빅데이터
trino에서 java.sql.SQLException: Unrecognized connection property 'url' 에러가 나는 이유와 해결 방법
AndersonChoi
2024. 10. 16. 20:12
spark jdbc를 통해 trino를 접근하기 위해 아래와 같은 코드를 짤 수 있다.
import org.apache.spark.sql.{DataFrame, SparkSession}
import java.util.Properties
// Spark 세션 생성
val spark = SparkSession.builder()
.appName("Spark Trino JDBC Example")
.getOrCreate()
// JDBC URL 설정
val jdbcUrl = "jdbc:trino://<trino-host>:<port>/<catalog>/<schema>"
// Trino JDBC 속성 설정
val connectionProperties = new Properties()
connectionProperties.setProperty("user", "<your-user>")
connectionProperties.setProperty("password", "<your-password>")
connectionProperties.setProperty("driver", "io.trino.jdbc.TrinoDriver")
connectionProperties.setProperty("SSL", "true") // 필요 시 SSL 활성화
// Trino 테이블 또는 SQL 쿼리 설정
val hiveTable = "(SELECT * FROM your_table LIMIT 10) AS tmp"
// DataFrame 생성 및 데이터 로드
val dfJdbc: DataFrame = spark.read
.jdbc(jdbcUrl, hiveTable, connectionProperties)
// 결과 출력
dfJdbc.show()
문제는 실행했을 때 아래와 같은 에러가 발생할 경우이다.
java.sql.SQLException: Unrecognized connection property 'url'.
위 에러는 url이라는 key가 trino에 인입되어 발생하는 에러인데, trino에서는 용인되지 않는 설정값이 추가되면 warning도 아니고 에러로 뱉어버린다.......
spark에서는 url이라는 key에 value를 jdbc:trino:// 로 시작되는 값을 강제 주입하기 때문인데, 이는 3.2.x대 버전까지 이어져 왔다.
해결방법
이후 https://issues.apache.org/jira/browse/SPARK-36163 에서 해당 문제를 해결하고자 했고, 그 결과로 3.3.x 이상 버전에서는 해당 에러는 더이상 발생하지 않는다 ㅠ
반응형