일단 시험문제는 인터넷에서 구할 수 있는 기출문제와 유사하게 나왔다. 공부를 하지 않으면 어려울 수 있으므로 되도록 2주 전부터 공부를 하는게 좋다. http://wiki.gurubee.net/pages/viewpage.action?pageId=27426887 위의 연구회의 정리자료를 정독하고, 연습문제는 꼭 풀어보도록 하자. 연습문제에서 그대로 출제 된게 몇문제 있었다. 즉, 연습문제와 비슷한 형태로 나오므로 문제 유형을 파악하면 떨지 않고 시험을 칠 수 있다. http://bysql.net/index.php?mid=W201102S 여기의 연습문제도 꼭 풀어보자. 정규화, 조인(NL, SMJ, Hash) 관련 문제는 꼭 나오므로 차이를 꼭 외워서 가야한다. 1차, 2차, 3차 정규화의 차이과 조인간의 ..
조인 NL 조인 - 랜덤 액세스 위주의 조인 - 한레코드씩 순차적으로 진행 - 테이블의 크기가 작을수록 좋음 - 온라인 프로그램에서 사용할 때 좋음 - Driving 테이블의 크기가 가장 많은 영향을 준다. SMJ - 조인하기전에 정렬 - 넓은 데이터 처리에 유리함 - 정렬에 필요한 데이터가 많아지면 메모리대신 디스크를 사용하므로 성능이 떨어질 수 있음 - 조인 조건의 인덱스 유무에 영향을 받지 않지만 Sort 가 필요하다. Hash 조인 - 한쪽 테이블의 크기가 작을수록 좋음 - NL의 랜덤액세스, SMJ의 정렬작업에 대한 부담으로 등장 - 인덱스를 사용하지 않음, 인덱스 대신 Hash 함수를 사용 - 동등조인(=) 에서만 사용 - 수행 빈도가 높은 OLTP성 작업에서는 불리함 - 수행 빈도가 낮고, ..
- Total
- Today
- Yesterday
- 하둡
- ubuntu
- hbase
- yarn
- 하이브
- Linux
- java
- SPARK
- HIVE
- bash
- airflow
- AWS
- error
- SQL
- mysql
- Tez
- HDFS
- 파이썬
- build
- emr
- 오류
- S3
- Hadoop
- nodejs
- 알고리즘
- 정올
- oozie
- 다이나믹
- Python
- 백준
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |