데이터분석

데이터 분석과 실제 비지니스 의사결정 간의 연결 고리를
만드는 능력이 데이터사이언티스트의 연봉을 좌우합니다.


프리퀀티스트 통계와 베이지언 통계의 차이를 정확히 아시나요?
예측 모형과 인과관계 분석은 어떤 연결이 되어있을까요?
데이터나 머신러닝에 대해 말하기에 앞서 의사결정 중심의
데이터 분석을 위해 어떤 질문들을 먼저 던지는지 아시나요?

우버 본사에서 우버 잇츠의 가격 결정을 하는 데이터사이언티스트였던 정종빈님이
위 질문들에 대한 답을 이 강의에 담았습니다.

캐나다, 멕시코, 호주, 브라질 등 9개국에서 6억명 이상이 우버잇츠를 통해서
배달 음식을 받을 때, 음식점은 얼마를 배달료로 내고,
배달 기사님들은 얼마를 받아갈까요?
나라 별로, 시간 별로, 수요와 공급 별로 시시각각 변하는 그 요율을
1주일 단위로 매주 결정하는 것을 뇌피셜로 하지는 않았겠죠.

기업 내 최고 경영진은 최적의 의사결정을 할 수 있도록 뒷받침이 되는
인사이트를 만들어낼 수 있는 데이터 분석가를 필요로 합니다.
이 강의에서는 실제로 현업에서 사용하는 베이지안 통계 및 추론에 대한 학습,
그리고 기업의 의사 결정에 도움이 되는 최적의 기법을 강의해 드립니다.

인간의 의사결정을 돕는 관점에서 데이터 분석을 이해하고
실증적으로 적용하는 문제를 매일 깊이 고민하는 사람은
세상에 손으로 꼽을 수 있을 정도로 적습니다.
그런 사람에게 배우시고 그런 사람이 되십시요.

데이터사이언티스트가 반드시 알아야 할 통계학을 기반으로 현실 세계 케이스를 높은 신뢰도로 Decision Making 할 수 있는 기법을 배워야 억대 연봉 데이터사이언티스트가 될 수 있습니다

“의사결정" 중심으로 실무에 도움이 되는 내용에 집중합니다. 많이 들어봤지만 정확하게 정의하지는 못하는 경우가 많은 신뢰구간, 베이지안, 프리퀀티스트, 모델의 유의성 인과관계 분석의 기초 등에 대해 구체적으로 소개합니다

직관적인 예제를 통해서 문제점을 보여 주며 데이터사이언티스트가 반드시 알아야 할 통계학을 그리스문자 없이 이해할 수 있도록 이론으로 또는 파이썬 코드 예제를 통해 배우고 실습합니다.

어느 때 어떤 통계 기법을 사용해야 되는지
진정 이해하시나요?


데이터사이언티스트가 반드시 알아야 할
통계학을 그리스문자 없이 직관적으로
이해할 수 있게 해드립니다.

데이터 사이언스 실무의 근간을 드러내는 예제를 통해
기초부터 탄탄하게 이해

Point 1- 불확실성과 데이터
[예제] 이 사람이 아이폰을 가졌을까? 안드로이드 폰을 가졌을까?

지하철에서 N 명 중 x 명이 아이폰, y 명은 안드로이드 폰 사용하고 있음을 목격. 한 명은 폰을 꺼내지 않음. 같이 탄 친구와 “폰을 꺼내지 않은 사람이 아이폰 유저일까?”를 걸고 만원빵?
예제와 같은 상황에 가용한 정보를 최대한 활용해 합리적으로 접근하기 위한 일반적인 의사결정 모형을 소개하고 데이터를 활용한 접근 방법에서 새로운 그리고 보다 기업실무에 가까운 연습문제 제시를 하고 풀이를 합니다.
  • 학습 1 : 일반 의사 결정 모형

    예제와 같은 상황에 가용한 정보를 최대한 활용해 합리적으로 접근하기 위한 일반적인 의사결정 모형은 무엇인지 소개합니다.

  • 학습 2 : Frequentist 통계

    데이터를 활용한 접근 방법 중, 보다 “전통적"으로 여겨지는 frequentist 통계의 입장에서 예제를 심도 있게 풀이해 봅니다

  • 학습 3: Bayesian 확률

    Frequentist와 얼핏 비슷해 보일 수도 있지만, 근본적인 철학적 입장이 전혀 다른 (그래서, 무엇보다 중요하게 결과의 해석 및 활용이 다른) Bayesian 접근 방법을 소개합니다.

  • 실전 : 어느 나라로 시장 진출을 할 것인가

    진출 후보 시장 10개를 대상으로 시장조사 실험결과를 수집하여 어는 나라로 시장 진출을 하는 것이 가장 효율적인 가를 계산해 봅니다. 이를 통계 기반에서 분석을 해보고 최종적인 진출 전략을 어떻게 가져가야 하는지도 봅니다.

Point 2 - 머신러닝 예측과 인과관계 분석
  • 학습 1: 예측 모형의 기본적인 고려 사항 숙지

    “무작정 ML”식의 예측 모형을 이용한 일차적인 접근을 통해, 예측 모형(그리고 보다 폭 넓게 ML)의 기본적인 고려 사항을 (train/validate/test, bias-variance) 숙지합니다

  • 학습 2 : 기본적인 방안 및 함정 탐구

    데이터에 근거한 의사결정을 하다보면, 결국은 맞닥드릴 수 밖에 없는 “인과관계분석"의 난제들과 이를 접근하는 몇 가지 기본적인 방안 및 함정 탐구를 해봅니다

  • 학습 3 : ML모델을 활용한 접근 방식

    다양한 ML 모델(random forest, NN, 등)을 얕게 소개하기 보다는, 보다 보편적으로 “ML모델을 활용한 접근 방식"에 대해 소개합니다

  • 실전 : 예제 데이터의 실전 탐구 분석

    쿠폰을 줬을 때 구매를 할 가능성이 높은 유저를 예측부터, 어느 단계에서 (예를 들어 장바구니 전후) 쿠폰을 적용하는 것이 유리한지, 예산, 타겟 구매율, 구매의사 극대화, 추가 수익 극대화 등을 놓고 같이 학습해 봅니다

Top of Top
전통적인 통계학을
현업 최적의 의사 결정에 적용하는 기법은?
데이터사이언티스트가 되려면 무엇을 해야하고 되고 난 다음에는 무엇을 해야 살아남을 수 있으며 어떻게 하면 한 단계 더 도약할 수 있을까요? 향후 이 분야에서 20년 또는 30년을 살아 남으려면 또는 이 분야에서 최고가 되려면 단순히 분석과 예측을 하는 이상이 되어야 합니다. 우버 본사에서 가격에 대한 의사 결정을 위해 데이터를 인사이트로 제시하고 실제 정량적 값으로 매주 도출해야 하는 일을 지난 몇 년간 매일 밥먹듯이 해왔습니다. 이 강의에서는 실제로 현업에서 사용하는 전통적인 통계학을 의사 결정에 적용하는 최적의 기법을 강의해 드립니다.
스탠포드에서 Ron Howard 교수
그리고 Sharad Goel 교수 아래에서 배운 것이
저를 이 분야로 전문가로 만들었어요.
제가 하던 연구가 융합 연구의 성격이 있어서, 지도 교수가 두 분이었습니다. Ron Howard는 교수님은 “의사결정분석" 분야를 개발한 시초 중 한 명이고 현대의 RNN, dynamic programming 알고리즘 개발에 기초를 다진 사람입니다. Sharad Goel 교수님은, 제가 박사 시작했을 때 막 스탠포드 신임 교수로와서, 지도교수라기 보다는 친구처럼 지내며 같이 연구도 하고, 미정부 각처 및 미디어와 협업하며 다양한 정치/사회문제에 데이터 분석을 동원하는 Stanford Computational Policy Lab을 창단했습니다. 지금은 하버드 케네디 스쿨에 정교수로 계십니다. 이 두 분이 저를 의사 결정 전문가로 만들어 주셨죠
문제가 어려워질수록
직관의 성능이 점점 저하됩니다.
데이터가 많이 없고 정보가 제한 되는 상황에서는 인간이 “직관적으로" 내리는 결정이나 알고리즘을 가지고 내리는 결정이나 크게 차이가 없는데, 정보가 많거나 문제가 어려워지면 인간의 직관이 점점 성능이 저하 된다는 내용의 연구를 했습니다. 뻔한 결과 같지만, 그 뻔한 내용을 그렇지 않다고 발표하는 다른 선행 연구의 결과를 반박하는 연구였고, 결국 그 선행연구와 같은 저널에 실리기도 해서, 꽤 재밌게 했었던 기억이 나는 연구입니다. 데이터가 많아지고 문제가 복잡해지는 요즘 시대에 직관이 아닌 데이터 기반의 의사 결정을 어떻게 내리는지 확인해 보세요.
세계 주요국들에서 사용하는 배달앱
우버 잇츠의 가격을 결정하는 일을 했습니다.
모델링을 하고 각 나라의 사람들과 미팅하면서 가격 자체를 결정하는 것은 쉬운 문제입니다. 너는 어떤게 맞다고 믿니? 라고 논의하면 되지요. 가정에 따라 최적화 개선을 할 수 있도록 하는 일이지요. 반면 쉽게 자동화 할 수 없는 부분. 즉, 많은 옵션 중에서 어떤것이 맞다고 믿는지 선택하는 결정이 어려운 과정입니다. 이 많은 사람들이 각자 고민하는 것이 무엇이고, 같은것과 다른것을 판단한 다음 같은것은 묶어서 기계적으로 처리하고, 서로 다른 것들은 그들의 판단을 가지고 선택할 수 있도록 시스템을 구축하는 업무가 제 업무였는데요. 각 나라에 따라 다른점이 많아 어려웠지요. 이처럼 머신러닝을 활용한 자동화 기법과 인간적 경험을 바탕으로 하는 의사결정 과정, 이 둘이 공존하는 복잡한 문제를 접근하기 위한 근본적인 틀을 이 수업에서 강의하고자 합니다.
의사 결정을 리드하는
데이터 사이언티스트로 성장해 보시겠습니까?
이 강의가 시작되기 직전 2021년 가을에 우버를 퇴사하고 원클릭 체크아웃으로 유명한 커머스 솔루션 분야의 신규 강자인 볼트로 이직했습니다. 역시 마찬가지로 의사 결정을 하는데 회사는 우버보다 작지만 상품의 종류나 국가 수는 훨씬 많아졌지요. 순수 수학/공학이 아닌, 인간의 의사결정을 돕는 관점에서 확률/통계/데이터 분석을 이해하고 실증적으로 적용하는 문제를 깊이 고민하는 사람이 세상에 손으로 꼽을 수 있을 뿐더러, 이를 굳이 정리해서 강의하려는 사람은 얼마나 있는지 모르겠네요. 제가 그 중 한 사람이 되었고 여러분께도 그 길을 알려 드리려고 합니다. 저는 다양한 private/public 분야에서 공동체적 의사결정이나 정책결정에 체계적으로 도움이 되는 일들을 계속 할 예정입니다.
데이터사이언티스트인가 탐정인가?
데이터사이언티스트는 “이론적인 것"과 “실증적인 것"의 구분을 명확히 짓고, 같이 협업해야 하는 이해 당사자들의 입장에서 문제를 고민하는게 도움이 많이 됩니다. 데이터를 다루는 부분에 있어서는, 새로운 머신러닝 툴이나 코딩을 하는 건 누구나 다 비교적 쉽게 배울 수 있는 부분인 것 같고, 실력의 차이는, 데이터의 출처와 의미에 대한 호기심을 가지고, 컨택스트 이해하며 숨겨진 전제 등을 파헤치려는그 무엇인가가 필요하죠. ”기술"이나 “코딩"과는 다소 별개의 “탐정 수사" 마인드에서 결과의 차이가 난다고 생각합니다.
강의 선수 지식
• 기본적인 통계학 지식
• 파이썬 기본 지식

수강 대상
• 호기심이 있고 배우고 싶어하는 사람 누구나
• 데이터 사이언티스트가 되는 것을 배울 준비가 되어 있는 사람

강의 특징
• 이 강의는 템플릿이나 코드 위주의 수업이 아닌 통계학 수업입니다.

강의에 필요한 툴
• 구글 콜랩
전 우버 본사 데이터사이언티스트의
머신러닝 의사결정 마스터 과정,
지금 최저가로 만나보세요!
(자동) (자동) (자동)
정가 (자동)
현재 판매가 (자동)
12개월 무이자 할부 시 (자동)
상세 커리큘럼

* 본 강의 시간은 5시간이며, 현재 사전 예약 상태로 추후 변동될 수 있습니다.

수강료.

  • The RED : 우버처럼 하는 머신러닝 의사결정 by 정종빈

    현재 정가 대비 73% 할인 중!
    12월 31일 금요일 자정 까지

    정가 879,000원
    현재 판매가 229,000원

    12개월 무이자 할부 시 월 19,083원

국내 9개 카드사 12개월 무이자 할부 지원! (간편 결제 제외)

  • 삼성카드
  • 신한카드
  • 롯데카드
  • 현대카드
  • 하나카드
  • BC카드
  • KB국민은행
  • 씨티카드
  • NH농협카드