우버 출신 데이터사이언티스트가 말하는 머신러닝 의사결정

#데이터분석 #실리콘밸리 #머신러닝


우버 하면 무엇이 생각나시나요? 우버가 하는 모든 일의 중심은 데이터입니다.
우버는 전세계의 그 어떤 기업보다 데이터를 영리하게 사용해서 급성장한 회사로 손꼽히기도 하죠.

그렇기에 현 데이터사이언티스트 혹은 미래의 데이터사이언티스트들에게 우버의 데이터사이언티스트를 만날 수 있는 기회는 앞으로 어떤 데이터사이언티스트가 되고 싶은지 길을 열어주는데 아주 유용한 이정표 역할을 해 줄 것이라는 생각이 듭니다.


그래서 오늘은 우버 출신 데이터사이언티스트 정종빈 박사님을 만나서,
우버에서는 데이터사이언티스트가 어떤 역할을 하는지 이야기를 나눠보는 시간을 가지려고 합니다.

데이터 엔지니어링

Q1. 간단한 소개 부탁 드립니다.

안녕하세요. 저는 2021년 가을까지 우버 본사에서 근무한 데이터사이언티스트 정종빈입니다.
스탠포드 대학에서 박사과정까지 마쳤고요. 현재는 미국 샌프란시스코에서 원클릭 체크아웃으로 유명한 커머스 솔루션 분야의 신규강자인 볼트의 데이터사이언티스트로 근무하고 있습니다.


Q2.우버에서는 어떤 일을 하셨나요?

세계 주요국들에서 사용하는 배달앱 우버 이츠의 가격을 결정하는 일을 했습니다. 캐나다, 멕시코, 호주, 브라질 등 9개국에서 6억명 이상이 우버이츠를 통해서 배달 음식을 받을 때 음식점은 얼마를 배달료로 내고, 배달 기사님들은 얼마를 받아갈까요?
나라별, 시간별로 수요와 공급별로 시시각각 변하는 그 요율을 1주일 단위로 결정하는 일이 저의 일이었습니다.
가격에 대한 의사 결정을 위해 데이터를 인사이트로 제시하고, 실제 정량적 값으로 매주 도출해야 하는 일이었죠.


Q3. 우버에서 일하시면서 느낀 데이터사이언티스트로서의 필요 역할 혹은 역량이 있을까요?

데이터사이언티스트라는 이 단어는 어떻게 보면 모호한 의미를 품고 있다고 생각해요.
제가 우버에서 일하면서 가장 중요하다고 생각한 점은 데이터 분석, 통계, 머신러닝 기술과 실제 비즈니스 의사결정 간의 연결 고리를 만드는 것이라고 생각했어요.
즉 예측 모형을 만들고 제품을 개발하는 그런 분야가 아닌, 데이터를 모아서 사내의 의사결정을 돕거나 경영진의 중요한 결정을 이끈다거나 하는 그런 역할이죠.


Q4. 위에 말씀 주신 것처럼 데이터사이언티스트에게 ‘의사 결정 분석’이 중요한 이유가 무엇일까요?

데이터를 가지고 일을 하는 데이터사이언티스트의 일이란 곧 제품 개발이나 의사 결정을 도와주는 일입니다.
이와 같은 맥락으로 제가 우버에서 하는 일도 우버 사내에서 경영진들이 가격 결정을 할 수 있도록 돕는 시스템을 구축하는 일이죠.
기업 내 최고 경영진은 최적의 의사결정을 할 수 있도록 뒷받침이 되는 인사이트를 만들어낼 수 있는 데이터사이언티스트를 필요로 합니다.

Q5. 평소에 업무 관리하는 노하우가 있으시다면?

이론적인 것과 실증적인 것의 구분을 명확하게 짓고, 같이 협업해야 하는 이해 당사자들 입장에서 문제를 고민하는게 많은 도움이 되는데요.
데이터를 다루는 부분에 있어서는 새로운 머신러닝 툴이나 코딩을 하는 기술적인 것은 누구나 배울 수 있는 부분이라고 생각합니다.
이후 실력의 차이는 데이터의 출처와 의미에 대한 호기심을 가지고, 숨겨진 전제들을 파헤치려는 탐정 수사 마인드에서 나온다고 생각해요.


Q6. 스탠포드에서 박사과정 중 쓰신 논문은 어느 분야였나요?

데이터 분석과 관련한 인간의 의사결정에 대해 연구했습니다.
구체적으로 미국 형사 재판 과정에서 판사가 보석 관련 결정을 내려야 할 때, 가용한 정보/데이터를 최대한 활용하는 의사결정 방법론과 더불어, 그에 따른 혹은 데이터를 활용하지 않음에 따른 인종/성/연령 차별 등 소위 ‘ML fairness’의 문제에 대해 다양하게 연구했어요.
또, 졸업 직전에 한 연구가 있는데요. 간단하게 말하자면 데이터가 많이 없고 정보가 제한되는 상황에서는 인간이 직관적으로 내리는 결정이나 알고리즘을 가지고 내리는 결정이 크게 차이가 없는데, 정보가 많거나 문제가 어려워지면 인간의 직관이 점점 성능 저하가 된다는 내용의 연구였어요. 뻔한 결과 같아 보이지만, 그 뻔한 내용을 그렇지 않다고 발표하는 다른 선행 연구의 결과를 반박하는 연구였죠. 결국 그 선행 연구와 같은 저널에 실리기도 해서 꽤 재미있게 했던 기억이 있어요.


Q7. 스탠포드 대학에는 유명한 교수님들이 많은 것으로 알고 있는데, 지도 교수님은 무엇을 하는 분이었나요?

Ron Howard 교수와 Shard Goel 교수 아래에서 배운 것이 저를 이 분야 ‘의사 결정 분석’의 전문가로 만들었다고 해도 과언이 아닌데요.
제가 하던 연구가 융합 연구의 성격이 있어서, 지도 교수가 두분이었어요. Ron Howard 교수는 ‘의사 결정 분석’ 분야를 개발한 시초 중에 한명입니다. 현대의 RNN, dynamic programming 알고리즘 개발에 기초를 다진 사람입니다.
Sharad Goel 교수는 미정부 각처 및 미디어와 협업하며 다양한 정치/사회 문제에 데이터분석을 동원하는 Stanford Computational Policy Lab을 창단했어요. 지금은 하버드 케네디 스쿨 교수입니다.


Q8. 데이터사이언티스트가 되고 싶은 혹은 한 단계 더 도약하고 싶은 데이터사이언티스트들에게 해주고 싶은 말이 있으시다면?

이 분야에서 최고가 되려면 단순히 분석과 예측을 하는 것 이상의 실력을 가져야 합니다. 순수 수학, 공학이 아닌 인간의 의사 결정을 돕는 관점에서 확률, 통계, 데이터 분석을 이해하고 실증적으로 적용하는 문제를 깊이 고민하는 사람은 전세계적으로 손에 꼽습니다.
데이터가 많아지고 문제가 복잡해지는 요즘, 직관이 아닌 데이터 기반의 의사 결정을 내릴 수 있는 손에 꼽히는 데이터사이언티스트가 되시길 바랍니다.
저도 앞으로도 private, public 분야에서 공동체적 의사결정이나 정책 결정에 도움이 되는 일을 계속 하고자 합니다.


문제가 어려워질수록 직관의 성능이 점점 저하됩니다.
그렇기 때문에 전통적인 통계학을 최적의 의사 결정에 적용하는 기법이 중요하죠.
우버 출신 정종빈 박사의 인터뷰에서 이야기를 나눴듯이, 데이터 사이언티스트는 인간의 의사 결정을 돕는 관점에서 확률, 통계, 분석 결과를 실증적으로 적용해야 합니다.

삶을 살아가는데 있어서 멘토를 만나고 그의 길을 따라가는 것만큼 값지고 좋은 경험이 없겠죠. 맨땅에 헤딩하면 수년이 걸릴 시간을 소요하지 않고, 원하는 바를 이룰 수 있을테니까요.
패스트캠퍼스에는 정종빈 박사와 같이 "머신러닝 의사결정"을 잘 할 수 있는 데이터 사이언티스트로 성장하기 위한 프로젝트를 담은 머신러닝 강의가 있습니다.
아래 네임카드에 소개해드리는 강의를 통해 여러분이 성장하는 길이 조금 더 쉽게 열릴 수 있기를 바랍니다.


지금 패캐머들이 읽고있는 BEST 아티클이 궁금하다면

이 글과 연관된 주제의 추천 강의