Go to login Go to sub menu Go to text
  • Type MOOC course
  • Period Always open
  • hr Study freely
  • Course approval method Automatic approval

Instructor Introduction

Lecture plan

강의
  1. CHAPTER 0. 이 강의에 대한 설명 및 추천 학습 방법
    1. 강의 설명 & 추천 학습 방법
  2. CHAPTER 1. 환경 설정하기
    1. Databricks Cloud 가입하기
    1. 가상 Cluster 생성하기
    1. 가상 Cluster에 라이브러리 설치하기
    1. Databricks Cloud Notebook 사용하기
    1. Amazon Web Service Access Key 가져오기
  3. CHAPTER 2. 데이터 분석을 위한 준비 작업
    1. 데이터 저장소 연결하기
    1. SparkSession 객체 생성 후, 데이터 Load, 데이터 확인하기
    1. 데이터 클렌징하기
  4. CHAPTER 3. 예제로 배우는 Spark
    1. 1. 얼마나 많은 항공사가 있을까요?
    1. 2. DL 항공사는 1990년에 얼마나 비행을 했나요?
    1. 3. 운행 거리의 평균, 최소, 최대값은 얼마인가요?
    1. 4. 1987년과 1993년의 전체 운항 노선 수는 어떠한가요?
    1. 5. 각 공항에는 얼마나 많은 도착 기록이 있나요?
    1. 6. 평균적으로 실제 비행 시간과 예상 비행 시간의 가장 크게 차이가 나는 노선은 어디인가요?
    1. 7. 각 공항별로 다른 공항으로 향하는 운항 수가 몇 %인가요?
    1. 8. 해당 공항에서 출발, 도착을 모두 하는 항공사는 얼마나 있을까요?
    1. 9. 각 노선별로 다음 네 항공사의 운행은 몇 개인가요? : UA, TW, DL, US
    1. 10. 각 공항의 PageRank는 어떠한가요?
  5. CHAPTER 4. 해당 강의 수강 이후의 학습 방법
    1. 이제 어떤 방향으로 무엇을 학습할 것인가

Additional Info

다음과 같은 분들의 도움을 받았습니다.

[감수자]
이동진
Apache Software Foundation

[퍼블리셔]
변성윤
Socar 데이터과학자

[번역]
박시훈, 윤소영, 정태영, 조하늘, 한동훈, 신유주, 윤수식(커넥트 번역 서포터즈)