티스토리 뷰

우지 스파크 액션에서 pyspark를 실행할 때 Missing py4j and/or pyspark zip files. Please add them to the lib folder or to the Spark sharelib 오류가 발생하는 경우가 있습니다.

 

해결 방법

우지의 sharelib 에 파이썬 라이브러리가 없어서 발생하기 때문에 우지의 spark sharelib에 스파크 파이썬 라이브러리를 추가하면 됩니다.

 

# 스파크 홈
$ cd ${SPARK_HOME}/python/lib

# 조회 
$ ls -alh
total 636
drwxr-xr-x 2 deploy deploy   4096 May 30  2020 ./
drwxr-xr-x 7 deploy deploy   4096 May 30  2020 ../
-rw-r--r-- 1 deploy deploy  42437 May 30  2020 py4j-0.10.7-src.zip
-rw-r--r-- 1 deploy deploy   1445 May 30  2020 PY4J_LICENSE.txt
-rw-r--r-- 1 deploy deploy 593141 May 30  2020 pyspark.zip

# sharelib 에 zip 파일 업로드
$ hadoop fs -put *.zip hdfs:///user/oozie/share/lib/lib_2xxxxx/spark/
반응형
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
«   2025/07   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
글 보관함