728x90
Spark란?
빅데이터 프로세싱 도구로, SQL, 스트리밍, 머신러닝 및 그래프 처리를 위한 기본 제공 모듈을 제공한다.
Mac intel에 Spark 설치
apache-spark를 설치하기 전 python, Java는 설치가 된 상태여야 한다.
1. python, Java 설치
(Java 설치는 아래 글 참고)
2024.11.16 - [데이터 분석] - Hadoop 설치 (Mac intel)
2. apache-spark 설치
brew install apache-spark # 3.5.3으로 자동 설치
3. 환경변수 설정
터미널 환경이 아닌 주피터 노트북을 사용하기 위해 ~/.zchrc에서 환경변수를 설정한다.
export SPARK_HOME=/usr/local/Cellar/apache-spark/3.5.3/libexec
export PATH=$PATH:$SPARK_HOME
export PYSPARK_PYTHON=python3
export PYSPARK_DRIVER_PYTHON="jupyter"
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"
4. scala 설치
brew install scala@2.12
터미널에 위와 같이 입력하여 scala를 설치한 뒤
export PATH="/usr/local/opt/scala@2.12/bin:$PATH"
환경변수 설정을 위해 ~/.zchrc에 추가한다.
5. 설치 확인
java -version
javac -version
python3 --version
scala -version
pyspark --version
터미널에 한 줄씩 입력했을 때 설치된 버전이 나오고, 위 사진처럼 나오면 설치가 완료된 것이다.
6. pyspark 실행
터미널에 'pyspark'라고 입력하면 jupyter notebook이 실행되며 spark를 jupyter notebook 환경에서 사용할 수 있게 된다.
Reference
728x90
'Study > 빅데이터' 카테고리의 다른 글
[Hadoop] HDFS에 파일 저장하기 (0) | 2024.11.17 |
---|---|
[Hadoop] Hadoop 설치 (Mac intel) (0) | 2024.11.16 |