java.lang.NumberFormatException : 입력 문자열의 경우 : Spark로 눈송이에서 읽을 때 "inf"

debugcn 에 게시 Dev

바 흐르

복식 열이있는 Snowflake 테이블이 있습니다. 값 중 하나는 inf및 -inf입니다.

Spark에서이 테이블을 읽으려고하면 다음 오류와 함께 작업이 실패합니다.

java.lang.NumberFormatException: For input string: "inf"
    at sun.misc.FloatingDecimal.readJavaFormatString(FloatingDecimal.java:2043)
    at sun.misc.FloatingDecimal.parseDouble(FloatingDecimal.java:110)
    at java.lang.Double.parseDouble(Double.java:538)
    at scala.collection.immutable.StringLike$class.toDouble(StringLike.scala:285)
    at scala.collection.immutable.StringOps.toDouble(StringOps.scala:29)
    at net.snowflake.spark.snowflake.Conversions$$anonfun$1.apply(Conversions.scala:156)
    at net.snowflake.spark.snowflake.Conversions$$anonfun$1.apply(Conversions.scala:144)
    at scala.collection.TraversableLike$$anonfun$map$1.apply(TraversableLike.scala:234)
    at scala.collection.TraversableLike$$anonfun$map$1.apply(TraversableLike.scala:234)
    at scala.collection.IndexedSeqOptimized$class.foreach(IndexedSeqOptimized.scala:33)
    at scala.collection.mutable.ArrayOps$ofRef.foreach(ArrayOps.scala:186)
    at scala.collection.TraversableLike$class.map(TraversableLike.scala:234)
    at scala.collection.mutable.ArrayOps$ofRef.map(ArrayOps.scala:186)
    at net.snowflake.spark.snowflake.Conversions$.net$snowflake$spark$snowflake$Conversions$$convertRow(Conversions.scala:144)
    at net.snowflake.spark.snowflake.Conversions$$anonfun$createRowConverter$1.apply(Conversions.scala:132)
    at net.snowflake.spark.snowflake.Conversions$$anonfun$createRowConverter$1.apply(Conversions.scala:132)
    at net.snowflake.spark.snowflake.CSVConverter$$anonfun$convert$1.apply(CSVConverter.scala:73)
    at net.snowflake.spark.snowflake.CSVConverter$$anonfun$convert$1.apply(CSVConverter.scala:34)
    at scala.collection.Iterator$$anon$11.next(Iterator.scala:410)
    at scala.collection.Iterator$$anon$11.next(Iterator.scala:410)
    at org.apache.spark.sql.execution.columnar.CachedRDDBuilder$$anonfun$1$$anon$1.next(InMemoryRelation.scala:100)
    at org.apache.spark.sql.execution.columnar.CachedRDDBuilder$$anonfun$1$$anon$1.next(InMemoryRelation.scala:90)
    at org.apache.spark.storage.memory.MemoryStore.putIterator(MemoryStore.scala:221)
    at org.apache.spark.storage.memory.MemoryStore.putIteratorAsValues(MemoryStore.scala:298)
    at org.apache.spark.storage.BlockManager$$anonfun$doPutIterator$1.apply(BlockManager.scala:1165)
    at org.apache.spark.storage.BlockManager$$anonfun$doPutIterator$1.apply(BlockManager.scala:1156)
    at org.apache.spark.storage.BlockManager.doPut(BlockManager.scala:1091)
    at org.apache.spark.storage.BlockManager.doPutIterator(BlockManager.scala:1156)
    at org.apache.spark.storage.BlockManager.getOrElseUpdate(BlockManager.scala:882)
    at org.apache.spark.rdd.RDD.getOrCompute(RDD.scala:335)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:286)
    at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:52)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:324)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:288)
    at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:52)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:324)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:288)
    at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:52)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:324)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:288)
    at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:52)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:324)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:288)
    at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:52)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:324)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:288)
    at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:90)
    at org.apache.spark.scheduler.Task.run(Task.scala:121)
    at org.apache.spark.executor.Executor$TaskRunner$$anonfun$10.apply(Executor.scala:402)
    at org.apache.spark.util.Utils$.tryWithSafeFinally(Utils.scala:1360)
    at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:408)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
    at java.lang.Thread.run(Thread.java:748)

오류가 발생하는 경우를 볼 때, 그것의 행 전환 될 것으로 보인다 Conversions.scala와data.toDouble

at net.snowflake.spark.snowflake.Conversions$$anonfun$1.apply(Conversions.scala:156)

data.toDouble입력이이면 작동하지 않습니다 inf. 스칼라에서 값은 대신 Infinity 여야합니다. (에서 온 Double.PositiveInfinity.toString)

유사한 경우 충돌을 방지하려면 해결 방법은 무엇입니까?

바 흐르

이것은 스파크 커넥터의 v 2.6.0에서 수정되었으며 여기는 PR 입니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-2

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

java.lang.NumberFormatException : 입력 문자열의 경우 : Spark로 눈송이에서 읽을 때 "inf"

java.lang.NumberFormatException : 입력 문자열의 경우 : Spark로 눈송이에서 읽을 때 "inf"

java.lang.NumberFormatException 오류 : 일반 엔드 포인트로 가져 오는 입력 문자열의 경우

입력 문자열 "1"에 대한 java.lang.NumberFormatException의

java.lang.NumberFormatException : 입력 문자열 : "0.89829948"

스레드 "AWT-EventQueue-0"예외 java.lang.NumberFormatException : 입력 문자열의 경우 : "달 선택"

스레드 "main"의 예외 java.lang.NumberFormatException : 입력 문자열 : ""(숫자를 입력했지만 빈 문자열을 읽은 것 같습니다)

java에서 float 구문 분석 문제 : java.lang.NumberFormatException : 입력 문자열 : "[60.0]"

파일 입력을 읽는 동안 java.lang.NumberFormatException

pyspark를 사용하여 S3에서 데이터를 읽으면 java.lang.NumberFormatException 발생 : 입력 문자열 : "100M"

오류 : java.lang.NumberFormatException : 입력 문자열 : "100"

java.lang.NumberFormatException : 입력 문자열 : "2017-01-28 13:28:20"

Jsp java.lang.NumberFormatException : 입력 문자열 : "atividade"

Android 통화-java.lang.NumberFormatException : 입력 문자열 : "099"

문자열에서 읽을 때 java.lang.IllegalArgumentException

스레드 "주요"java.lang.NumberFormatException의 예외 : 입력 문자열 : "38"

스레드 "AWT-EventQueue-0"에서 예외 java.lang.NumberFormatException : 입력 문자열 : "FALSE"

활동을 시작할 수 없습니다. ComponentInfo : java.lang.NumberFormatException : 입력 문자열 : ""

파일에서 입력을 읽을 때 파일의 모든 행을 Java로 읽지 않습니까?

Java에서 CSV 파일을 읽을 때 NumberFormatException 발생

switch 문에서 사용자 입력을 읽을 때 java.util.NoSuchElementException

java.lang.NumberFormatException : 빈 문자열-OBJ 모델 로더

회문 에서이 java.lang.NumberFormatException을 해결하는 방법은 무엇입니까?

JSON의 경우 스키마 추론이 Spark로 남아있을 때 Spark가 nullable = true를 출력하는 이유는 무엇입니까?

int java.lang.NumberFormatException 문자열

java parseint- "AWT-EventQueue-0"스레드 예외 java.lang.NumberFormatException : 입력 문자열 : ""

문자열이 입력 될 때까지의 Java 수

java.lang.NumberFormatException 문제

Java의 입력 문자열 이름을 기반으로 객체 반환

Java의 표준 입력에서 파이썬 이진 문자열을 읽는 방법

Java의 스캐너에서 입력 된 문자열을 지우는 방법은 무엇입니까?