스파크 2.4.6 버전에서 jupyter 노트북을 연결할 때 다음과 같은 오류가 발생합니다.
스파크 2.4.6은 python2 버전을 사용하게 되어 있는데, jupyter 노트북이 python3 으로 되어 있어서 오류가 발생합니다.
TypeError: an integer is required (got type bytes)
스택 오버플로우 등에서 추천하는 해결 방법은 파이썬 3.7로 쥬피터를 실행하는 방법입니다. 기존에 설치된 파이썬 버전을 확인하고 3.7 버전을 설치 하면 동작합니다.
또는 스파크 소스코드를 수정하여 처리할 수 있습니다. SPARK_HOME/python/pyspark/cloudpickle.py 파일을 수정합니다.
반응형
'빅데이터 > spark' 카테고리의 다른 글
[spark] spark-shell 실행 시 발생하는 java.lang.NoSuchFieldError: JAVA_9 오류 처리 (0) | 2024.02.25 |
---|---|
[spark] pyspark 의 파이썬 패스 설정 (0) | 2022.03.07 |
[spark] java.lang.NoSuchMethodError: net.jpountz.lz4.LZ4BlockInputStream.<init>(Ljava/io/InputStream;Z)V 오류 수정 (0) | 2022.01.30 |
[spark] spark3와 hive3 메타스토어 연동 (0) | 2021.06.21 |
[spark] spark2와 hive2 메타스토어 연동 (0) | 2021.06.21 |