부트캠프

데이터 직군, 무슨 일을 하는지는 알고 공부하자.

나의 두 번째 대학교, 부트캠프를 다니다.

#데이터 사이언스 #데이터분석 #코딩


해당 콘텐츠는 시리즈로 연재되고 있습니다. (클릭시 이동)

[1] 대학원을 포기하고 데이터 사이언티스트가 되기로 했다.
[2] 나의 두 번째 대학교, 부트캠프를 다니다.
이 글은 저의 도피성으로 진학한 문과 대학원생에서 데이터 사이언티스트로 취업하기까지의 진솔한 이야기를 담은 에세이입니다. 저처럼 진로를 고민하거나 커리어 전환을 꿈꾸는 누군가가 이 글을 읽고, 가장 본질적인 것들을 고민해 볼 수 있는 기회가 될 수 있기를 바랍니다.

-

1편에 이어, 2편에서는 현재 국비지원 교육으로 듣고 있는 데이터사이언스 교육 과정과 해당 내용들이 내 커리어에 어떤 변화를 가져왔는지에 대한 내용들을 다뤄보려고 한다. 우선 국비지원교육은 국가에서 하는 교육은 아니다. 사설 학원에서 운영되는 프로그램들의 수강료를 나라에서 지급하는 형태의 교육이다. 그렇기 때문에 학원과 커리큘럼을 잘 비교해보고 고르는 게 중요하다.

최근에는 정말 다양한 학원들에서 정말 다양한 커리큘럼의 부트캠프들이 운영되고 있기 때문에 '데이터 사이언티스트'를 막연히 꿈꾸고 있거나 어떤 부트캠프를 선택하는 게 나에게 맞는지 모르겠다면 꼭 이 글을 끝까지 읽기를 바란다.

내가 들었던 부트캠프는 아쉽게도 패스트캠퍼스의 부트캠프는 아니었다. 타이밍이 맞지 않아 수강하지 못했지만 다시 선택할 수 있었던 때로 돌아가면… 패스트캠퍼스를 선택할 것 같다. 여러분들은 이 글 끝까지 잘 읽고 자신에게 잘 맞는 선택 하시길! 내가 다녔던 부트캠프는 특별히 어느 영역에 특화된 커리큘럼이 아니라 데이터 사이언스 전반, 넓게는 컴퓨터 공학 기초까지 광범위하게 다루는 부트캠프였다. 하지만 다짜고짜 커리큘럼에 대해 얘기하면 이해가 안 될 테니 우선 이 얘기를 하기 전에 데이터 사이언스 직군 별 특징을 짚고 넘어가겠다.

우선 이런 그림은 구글에 data scientist career 같은 내용을 치면 우르르 쏟아져 나오는 흔한 도표이다. 그림에서 보는 것처럼 데이터 분야의 직군은 크게 3가지로 나뉜다.

출처 Chiranjeevi Vegi Medium

1. Data Scientist 데이터 사이언티스트 (과학자) DS
2. Data Analyst 데이터 애널리스트 (분석가) DA
3. Data Engineer 데이터 엔지니어 (기술자) DE

최근 해외에서 뜨는 채용공고들을 보면, 좀 더 하나의 분야에 특화된 'Data Visualization specialist' 데이터 시각화 전문가, 분석가에 가깝다. 'Marketing Data Analyst'(데이터 분석가 + 마케터) 혹은 'Machine Learning Engineer' (데이터 사이언티스트 중에서도 머신러닝 분야에 특화된 직무) 등의 직무가 생겨나고 있다. 하지만 아직 한국에서는 저렇게 세 가지로 나눠 채용하는 게 보편적이다. 사실 나는 이 차이를 잘 모르고 무턱대고 유명하다는 아무 부트캠프를 시작했고 각 직무에서 요구하는 역량에 대한 인지도 전혀 없었기 때문에 부트캠프 중반 즈음 가서 수업을 못 따라가 고생을 했던 기억이 있다. 여러분들은 그런 시행착오를 겪지 않도록 아래에 각 직군에 대한 정보를 하나씩 설명해 보도록 하겠다.


Data Scientist 데이터 사이언티스트 DS

우선 데이터 사이언티스트는 데이터 직군에서 가장 넓은 범위의 업무를 다루는 것 같다. 대기업의 경우라면 좀 더 특화된 업무를 다루겠지만, 중소기업이나 스타트업에 데이터 사이언티스트로 나 혼자 입사하는 경우 DA, DE 의 일까지 모두 맡는 경우도 있다고 한다.

데이터 사이언티스트들에게 요구되는 가장 큰 기술은 머신러닝, 딥러닝 모델을 다루는 것 일 것이다. 이를 위해 데이터를 수집하고, 전처리하고, 기계에 넣어서 원하는 값을 가져오는 것이 주요 업무다. 그렇기 때문에 깊이 들어가면 들어갈수록 수학과 고급 통계가 중요해진다. 머신러닝, 딥러닝 모델은 수학으로 이루어져 있고, 각 모델들의 특성을 파악해 적절한 모델을 사용하거나 파라미터(옵션)를 조절하기 위해서는 모델의 개념에 대한 이해가 꼭 필요하기 때문이다. 그러니 꽤 오랜 시간 동안 공부해야 하는 영역임이 틀림없고, 특히 딥러닝 분야로 더 깊이 들어간다면 이미지처리, 영상처리, 자연어처리 등 석박사 이상으로 하나의 분야를 공부하시는 분들이 많아 진다. 부트캠프를 선택할 당시의 나는 이 사실을 전혀 모르고 있었고, 당연히 코딩만 좀 할 줄 알면 DS 가 될 수 있을거라고 생각했다. 그러니 DS 를 선택하고 싶은 경우 아래와 같은 내용들을 점검해보자. 자신의 적성이나 역량을 떠올리며 질문에 답을 한다면 커리어 패스 결정에 큰 도움이 될 것이다.

Q. 수학으로 이루어진 복잡한 모델의 구조를 이해하는 데 관심이 있는가?
Q. 다양한 툴을 이용해서 코드를 짜고, 이를 통해 과제를 해결하는 데 즐거움을 느끼는가? (학창시절 어려운 수학 문제를 풀 때 어땠는지 떠올려보자)
Q. 코딩을 하다 다양한 에러를 마주한 경우, 에러의 원인을 찾고 해결하며 문제를 해결하는 데 즐거움을 느끼는가? (역시 수학 문제에 비유해 보자)


Data Analyst 데이터 애널리스트 DA

데이터 분석가의 경우, DS 보다는 조금 더 기획과 마케팅의 접점이 많은 업무를 한다. 채용 공고를 검색해보면 주로 타부서와의 협력이 많은 것이 명시되어 있고, 데이터를 분석하고 시각화 해 리포트를 제공하는 업무, 비즈니스 의사결정을 내리는 데 도움을 줄 수 있는 업무가 가장 주된 업무이다.

나같은 경우에는 7개월 간 부트캠프를 들으며 DA 의 경우는 제너럴리스트에 좀 더 가깝다는 느낌을 받았는데, 실제로 데이터 직군이 훨씬 더 보편적인 미국에서는 DA 로 커리어를 시작해 연차가 쌓이면 DS 로 파트 이동을 하는 경우가 많다고 한다. 나 역시 DA 직군으로의 취업을 준비 중인데 그 이유도 대학 때 부전공으로 수업을 들었던 경영학과 긴밀한 접점이 있으며, 말을 하거나 글을 쓰는 것이 나의 상대적인 장점이기 때문이다. 덧붙이자면 이렇게 짧은 시간을 공부해 DS 로 바로 취업하긴 어렵겠다는 생각을 했다. 이 글을 읽는 여러분이 만약 DA 직군으로 취업을 생각 중이라면 다음과 같은 질문에 대답해보자.

Q, 데이터를 통해 논리적인 인사이트를 얻고, 비즈니스적 의사결정을 내리는 것에 관심이 있는가?
Q. 데이터를 이용해 자신의 주장이나 프로젝트를 뒷받침해본 적이 있는가?
Q. 어떤 회사나 조직의 수익구조 등 전반적인 경영 문제에 관심이 많은가?


Data Engineer 데이터 엔지니어 DE

지난 7개월 간 부트캠프를 들으며 데이터 엔지니어야말로 DA 와 DS 의 일을 가능하게 해 주는 중요한 역할을 한다고 생각했다. 그럴만한 것이 DE 가 하는 가장 주된 일은 데이터를 모으고, 이것을 어떤 곳에 적재하고, 관리하는 것이다. 이들은 기업의 수많은 서비스로부터 발생한 데이터를 파이프라인에 모아 저장하고 DS 와 DA 가 사용 가능한 형태로 만들어 주는 일을 한다. 그렇기 때문에 DE 들에게 요구되는 스킬셋은 앞서 말한 DA, DS 와는 조금 결이 다르다. 우선 대용량 데이터를 전문적으로 처리하는 하둡, 스파크 등을 메인 툴로 사용한다. 거기에 기본적으로 DS, DA 들이 하는 일에 대한 이해나 컴퓨터 공학에 대한 제너럴리스트 수준의 스킬셋 역시 요구한다. 또한 직무 특성 상 프론트엔드, 백엔드와의 접점도 있는 편이기 때문에, 일부 대기업들은 JAVA 같은 보편적 프로그래밍 언어들을 요구하기도 한다.

역시 아래의 질문 리스트들에 답변해보자

Q, 기업마다 달라지는 개발 환경과 다루는 툴을 배우는 데에 거부감이 없는가?
Q. 팀원들의 다양한 니즈를 커뮤니케이션 역량이 있는가?
Q.데이터 structure, architecture를 구성하고, 전반적인 프로젝트를 이해해 워크플로우를 구성할 수 있는 프로젝트 통찰력이 있는가?

직군 별 차이와 요구되는 적성의 차이가 눈에 보이는가?

이렇듯 데이터 분야 직군은 세부적으로 요구되는 스킬셋이나 역량들에 큰 차이가 있다. 그러니 자신의 적성을 파악하고 그것에 맞는 커리큘럼을 제공하는 부트캠프나 인강을 고르는 것이 커리어 전환에서의 시행착오를 줄일 수 있다. 이렇게 들어서 아직 잘 모르겠다면 채용 공고 사이트에 각 직군을 쳐보고 요구하는 역량을 하나씩 읽어보자. 공부해야하고 갖춰야 하는 기본 역량들이 뚜렷하게 구분될 것이다.

나같은 경우 구분없이 모든 직군을 다 경험할 수 있는, 바꿔 말 하자면 전문성이 부족한 부트캠프를 들었다. 세 직군 모두를 경험하기 위해서는 어쩔 수 없이 단기간에 너무 많은 내용들을 배워야 했다. 때문에 양도 많고 요구되는 난이도도 높았다.예를 들어 html을 딱 하루 배우고 파이널 프로젝트로 웹페이지 형태의 결과물을 제출하라 한다던가. 결국은 따로 시간을 내어 혼자 다시 공부했다. 혹은 수업에서는 아주 기본적인 예제 코드만을 다루고 그것들이 응용된 버젼으로 과제를 준다던지 등 외부 자료의 도움이 꼭 필요한 순간들이 있었다.

그런데, 검색을 통해 얻어지는 자료들은 대부분 내가 원하는 자료와 원하지 않는 자료가 섞여있다. 뿐만 아니라 난생 처음 보는 개념도 익숙치 않은 코드가 주석도 없이 인터넷에 있다면 그걸 이해하는데 너무 오랜 시간이 걸릴 수도 있고 이는 단기간에 공부해서 취업을 해야 하는 나의 목적과는 걸맞지 않는다. 그래서 나의 경우 가장 고초를 겪었던 딥러닝, 머신러닝, 데이터 엔지니어링 분야에서 도움을 얻을 수 있는 사설 인터넷 강의를 활용해 부트캠프 진도를 따라갔다.

비유를 하자면 부트캠프에서 제공해주는 자료가 수학의 정석이나 학교 교과서 같은 official documents, 하지만 이해는 잘 안되는 그런 느낌이라면 사설 인터넷강의에서 제공해주는 자료는 쎈이나 수능특강처럼 떠먹여 주는 학습에 가까운 교육방식을 채택한다. 인터넷강의 역시 사이트들마다 강의 방식에 조금씩 차이가 있는데, 이런 류의 인강을 무려 4군데에서 들어본 수강생 입장에서 말하자면, 패스트캠퍼스의 경우 타사 인강들보다는 훨씬 더 깊은 수준으로 강의가 진행되며, 제공되는 강의자료의 양도 많은 편이다. 또, 강의들마다 부록처럼 추가되어 나오는 서브 내용들이 존재한다. 예를 들어 머신러닝을 배우려면 너무 당연히 먼저 파이썬 기본과 수학을 꼭 알아야 하고, 때에 따라 시각화도 알면 도움이 된다. 그런데 타사에서는 머신러닝 강의를 사면 머신러닝만 딱 알려준다. 근데 패스트캠퍼스는 이걸 알기 전에 알아야 할, 알고 나서 부가적으로 알면 좋은 내용들을 파악해서 부록으로 붙여주기 때문에 올인원 강의로서의 성격이 강한 편이다. 그리고 수강 기간에 제한이 없다!

지금까지 패스트캠퍼스에서 다섯 개의 강의를 이용했는데, '직장인을 위한 파이썬 데이터분석 올인원 패키지' 와 '한 번에 끝내는 딥러닝/인공지능 초격차 패키지'두 개를 특히 추천한다. 전자의 경우 파이썬 기초부터 머신러닝, 그리고 일곱개의 프로젝트를 다뤄주기 때문에 다양한 분야를 경험해 볼 수 있다는 게 강점이고, 후자는 혼자서는 이해하기 어려운 딥러닝의 딥한 개념들과 딥러닝을 쓸 때 사용되는 함수나 class 같은 프로그래밍 방법을 섞어 강의한다는 게 강점이다. 둘 다 부트캠프 전반에 걸쳐 아주 큰 도움이 되었던 강의들이다. 부트캠프 동기들에게 내가 엄청나게 영업하고 다녀서.. 수료가 한 달 남은 지금 내 친한 동기들은 대부분 패스트캠퍼스의 강의를 한 두 개씩은 듣고 있다.

앞서 내가 패스트캠퍼스의 강의를 5개나 구매했다는 대목에서 내가 듣는 부트캠프에서 제공되는 자료와 요구되는 학습 성취도의 갭이 상당히 크다는 점을 인지할 수 있었을 것이다. 그럼에도 당신이 데이터 직군으로의 커리어 전환을 꿈꾼다면, 어떤 부트캠프를 선택하던 대학을 한번 더 다니는 정도의 학습 시간과 노력을 투자해야 한다고 본다. 그만큼 새로 배워야 할 것들이 넘쳐 나고 업무를 처리하는 방법, 사고하는 방법에서 전환도 요구된다. 장담컨데 당신이 문과계열의 학과를 졸업했다면, 이전까지와는 완전히 다른 사고방식으로 프로젝트를 진행하게 될 것이다. 그리고 이는 훨씬 즐거울 것이다!

나 역시 지금까지 7개월동안 몰입해 학습했으나, 아직 Entry level 에 못 미치는 역량을 가졌다고 스스로 판단했다. 그렇기 무턱대고 부트캠프를 듣기보다는 본인을 적성을 객관적으로 판단하고 시장에서 요구하는 직무별 주된 역량을 파악한 뒤 그것을 학습할 수 있는 가장 빠르고 효율적인 방법을 찾는 것을 추천한다.


부트캠프는 나에게 정말로 제 2의 대학처럼 다가왔다. 매일매일 꼭 배우고 싶었던 새로운 내용들을 탐구했고, 그것을 활용해 내 안의 세계를 확장시킬 수 있었으며 같이 수강하는 동기들과는 동기 그 이상의 끈끈한 유대감을 쌓았다. 부트캠프를 하며 배운 다양한 소프트스킬도 빼놓을 수 없다. 특히 데이터 직군에게 가장 중요한 커뮤니케이션 능력, 일정과 조직을 조율하고 관리하는 능력, 글을 쓰고 말을 하는 능력 등 사회인으로서 꼭 필요한 다양한 능력들을 배울 수 있었다.

대학을 졸업하고 취업을 하기 전까지 그 어디에도 완전히 소속되지 못한 상태는 그야말로 불안함 그 자체였다. 학생에서 직장인으로 넘어가는 과도기에 꼭 배워야 하는 것들은 누구도 알려주지 않았다. 만약 부트캠프 없이 혼자서 취업에 필요한 역량들을 쌓으라고 했다면 중간에 어떤 방식으로든 포기 했을 것 같다. 그래서 취업 과도기에 나를 확실히 이끌어줄 수 있는 부트캠프를 듣는 것 자체는 긍정적으로 생각한다. 하지만 아직 부트캠프를 선택하기 전이라면, 본인을 잘 파악하고 꼭 필요한 역량을 위주로 부트캠프 초반부터 좀 더 집중적으로 쌓아나가는 방식을 선택하거나, 어느 한 부분에 특화된 부트캠프를 듣는 방식도 효율성의 관점에서 추천하는 바이다.

1편에서 언급했듯 나는 그간의 슬럼프로 많이 상처 입고, 좌절하는 상황에서 부트캠프에 탑승하며 커리어 전환을 꿈꾸게 되었다. 두려움 반, 긴장감 반으로 시작했던 부트캠프였다, 정말 내가 이걸 할 수 있을지, 내가 데이터 사이언티스트가 될 수 있을지 매 순간 의심했고 특히 비전공자로서 느끼는 한계도 많았다. 수학이라던가 수학이라던가 수학에서 말이다. 총 120명을 선발해 시작한 부트캠프에 현재 80명 남짓만이 남아있을만큼 커리어 전환은 절대 쉬운 일이 아니었지만, 다행히 다른 분야더라도 어딘가에서 쌓아온 다양한 경험과 노력은 나에게 어떤 방식으로든 도움이 되었다. 주전공 지리에서 배웠던 공간정보학을 이용해 훨씬 다양한 영역의 프로젝트를 시도해 볼 수 있었고, 영어강사로 오래 일했기 때문에 영문 자료를 읽거나 발표를 하는 데에 거리낌이 없었던 것이다. 나는 내가 커리어 전환을 하게 되면 모든 것을 버리고 제로부터, 바닥부터 시작하게 되는 거라고 막연히 생각해 왔는데 그렇지 않았다.

4월엔 데이터사이언스와 주전공을 섞을 수 있는 공모전에 출품을 했는데, 정말 감사하게도 1등을 하게 됐다. 덕분에 미국의 공간정보 학회에도 한국 대표 자격으로 초대받아 이 분야의 전문가들과 세계적인 기업들을 보며 주전공과 데이터사이언스의 접점을 찾아 이전보다 더욱 구체적인 커리어 고민을 할 수 있게 되었다. 또, 부트캠프 수료 후 오는 11월 공모전 우승으로 날 미국에 보내줬던 그 기업에서 일을 시작하게 되었다. 일을 하며 공부도 하고, 서서히 유학을 준비할 생각을 하니 두려움은 온데간데 없고 설레는 마음만 남았다.

나는 과거의 내가 무한한 슬럼프에 빠져있었을 때 용기 내 커리어 전환을 선택했던 내 자신을 칭찬해 주고 싶다. 가만히 앉아 너무 고민만 하기 보단 일단 시작하길 참 잘했다는 생각이 든다. 그런 의미에서 이 글이, 과거의 두려워하던 동시에 열망하던 나같은 커리어 전환을 꿈꾸는 누군가에게 용기가 되길 바란다.

양세비
취준, 커리어, 데이터, 공간정보, 일상에 대한 이야기를 나눕니다.
블로그
Linked in

이 글과 연관된 주제의 추천 강의