세계 3등이 말하는 데이터 분석 포트폴리오, 합격 여부는 이것에 달렸다?

#데이터 분석 포트폴리오 #데이터 분석 프로젝트 #데이터시각화


| 데이터 분석가에게 포트폴리오 과연 필수일까?

포트폴리오는 더 이상 디자이너만의 필수 요건이 아닙니다. 마케터, 기획자 등 여러 직무에서 채용 시 포트폴리오 첨부를 선호하고 있습니다. 실제 사무 경험자를 대상으로 신입 구직자도 포트폴리오를 첨부 여부에 대해 질문한 결과, 10명중 7명(73.7%)이 포트폴리오를 갖출 필요가 있다고 응답하였습니다.

데이터 분석 포트폴리오의 필요성

[이미지 출처: 인크루트]

데이터 분석가 또한 이 흐름에서 예외이진 않습니다. ‘난 신입 또는 주니어이고 경력이 없는데, 어떤 포트폴리오를 만들어야 하나..’ 고민이신 분들이 많을 것으로 예상됩니다. 하지만 포트폴리오는 경력이 아닌 경험을 보여주는 것. 지금부터 데이터 전문가들이 말하는 데이터 분석 포트폴리오를 구성하는 중요한 내용부터 어떻게 차별점을 만들 수 있는지, 주니어에게 조언해주고 싶은 점까지 전부 소개해 드리겠습니다.


| 데이터 분석 포트폴리오 어떻게 구성하면 될까?

데이터 분석가 지원자에게 요구되는 역량과 스킬을 잘 보여줄 수 있는 포트폴리오를 보여주는 것이 우선입니다.
데이터 분석가 직무 기준, 인기순 10개 기업의 채용 공고에 있는 기업에서 요구하는 역량 및 스킬 내용입니다.

채용 공고에서 보이는 데이터 분석가 요구사항

[역량]
의사소통 능력 : “문제 정의 > 원인 분석 > 해결 방안 도출 > 데이터 스토리텔링 > 조직 내 커뮤니케이션 / 설득 > 액션” 의 프로세스를 거쳐 조직과 비즈니스에 임팩트를 낼 수 있는 의사소통 능력

논리적 사고 능력 : 논리적으로 분석 결과를 전달할 수 있는 사고 능력. 보고서 작성 시 처음 제시한 가설과 결론까지 하나의 흐름을 잘 끌어나갈 수 있는 논리적 사고 능력

[스킬 내용]
- 데이터 파이프라인 구축
- 데이터시각화


주니어 분석가에게 심화된 분석이나, 실험 설계, 데이터 거버넌스 관리 등 고난도 스킬 셋을 요구하기는 어렵습니다. 때문에, 중요도는 높으나, 비즈니스 이해도는 상대적으로 낮아도 유효하게 분석할 수 있는 데이터 파이프라인 구축 > 데이터시각화 업무를 주니어가 가장 많이 담당하는 경우가 많은데요. 포트폴리오에서는 이를 잘 보여주는 것이 중요하겠습니다.

또한, 데이터 분석가의 포트폴리오는 결과 중심이 아닌 진행 과정 중심으로 구성되어야 합니다. 진행 과정을 보여줄 수 있는 구성 요소로는 크게 2가지가 있습니다.

1. 공모전/대회

2. 데이터 분석 프로젝트 진행
1) 공공데이터
2) 지원 기업 관련 비즈니스 모델 실습

포트폴리오 구성 | 공모전


[공모전]
공모전이라고 하면 흔히 수상 여부에 따라 결과가 나뉜다고 생각할 수 있지만, 실은 그렇진 않습니다.
대신 아무 공모전이나 나가는 것 보다는 개인마다 기준으로 두고 참여하는 것이 좋습니다. 아래 3가지의 기준을 두는 것을 추천드립니다.

1. 주최 기관
공모전 또는 대회를 주최하는 곳이 어디인지 확인해야 합니다. 권위 있는 기관이나 정부, 기업일수록 더 상세한 심사와 피드백을 들을 수 있습니다. 어떤 주제를 다루고, 어떠한 결과를 도출했는가를 중점으로 다뤄야 하는 포트폴리오에서 전문가에게 받은 피드백을 바탕으로 도출된 인사이트까지 적용하면 포트폴리오를 더 풍부하게 작성할 수 있습니다. 또한 공모전에 나가면 데이터를 제공받을 수 있으니, 관심 있는 분야의 공모전이 나온다면 꼭 도전해 보는 것을 추천합니다.

2. 커리어
공모전에서 진행한 프로젝트가 내 직무와 관련이 있는지를 살펴봐야 합니다. 공모전에 참여하고 수상을 했더라도, 주제가 내 직무와 크게 관련이 없다면 공모전의 이력이 의미가 없을 수도 있습니다. 커리어 측면에서 나에게 얼마나 의미 있는 프로젝트를 만들 수 있을지 판단 후에 공모전에 참여하는 것이 좋습니다.

3. 배우고 성장할 수 있는지
가장 중요하게 생각되는 부분입니다. 적당히 난이도 있는 공모전에 도전하면서 실력을 상승시키고 새로운 시야를 넓히는 기회로 삼는 것이 좋습니다. 결과적으로는 내가 프로젝트를 통해 배움이 있고, 밑거름 삼아 성장할 수 있는 발판이 되는 공모전을 선택해야 합니다.


🎯 이 밖의 공모전 수상 꿀팁을 간략히 말씀드리자면, 주최측의 니즈를 파악하여 어떤 결과물을 보여주어야 할지 방향성을 설정해야 한다는 것입니다.

공모전을 주최하는 근본적인 목적을 고민해 보는 것이 중요한데, 예를 들어 행정 안전부에서 주최한 공공 빅데이터 공모전인 경우, 포털 사이트를 통해서 공개되고 있는 빅데이터가 국민의 공익 증진에 기여하고 있음을 알리는 것에 목적이 있습니다. 따라서, 데이터를 활용해 공공의 이익을 높일 수 있는 프로젝트인 경우 수상 확률을 높일 수 있습니다

또한, 기업에서 주최하는 공모전인 경우 기존 고객에게 제공하던 서비스에서 한발 더 나아가서 더 큰 비즈니스적 가치를 가져다줄 수 있는 새로운 대시보드 설계한다면 더 수상 확률을 높일 수 있을 것 입니다.


데이터 분석 포트폴리오 구성 | 데이터 분석 프로젝트

데이터 분석 프로젝트 데이터

데이터 분석 프로젝트라고 하면 데이터를 얻는 과정부터 시작이라고 할 수 있습니다. 프로젝트를 준비하시는 분들은 본인이 사용할 수 있는 데이터를 찾는 과정부터 어려움을 겪는데요.

먼저 데이터를 얻을 수 있는 대표적인 사이트 6개를 공유드리겠습니다.

공공 데이터
1) 서울 열린 데이터 광장 : https://data.seoul.go.kr/
2) 공공데이터 포털: https://www.data.go.kr/
3) KOSIS 국가 통계포털: https://kosis.kr/index/index.do
4) 서울특별시 빅데이터 캠퍼스: https://bigdata.seoul.go.kr/main.do

해외 데이터
1) 캐글: https://www.kaggle.com/datasets
2) 구글 데이터 검색: https://datasetsearch.research.google.com/

위에서 얻은 데이터를 바탕으로
가상 시나리오 설정>데이터 전처리 작업>데이터 파이프라인 설계>문제 정의 >데이터시각화&대시보드 제작>인사이트 도출
의 과정을 거치는 과정을 포트폴리오에 설명해야 합니다.

데이터 분석 프로젝트 6단계

다만 공공 또는 오픈 데이터의 경우, 이미 비슷한 프로젝트의 경험이 있는 지원자가 다수일 수 있으며, 실제 현업에서 진행하는 데이터 분석 업무와 관련이 없는 프로젝트일 가능성이 있습니다.

따라서, 기업에서는 실제 비즈니스 모델이 같거나, 회사에서 직면하고 있는 또는 직면했던 문제를 다루는 지원자에게 눈이 갈 수밖에 없습니다!

예를 들어, 교육 업계 회사에 데이터 분석가로 지원했는데, 교육 관련 서비스 데이터를 수집해서 데이터 분석한 프로젝트를 경험했다면? 게임 업계 회사에 데이터 분석가로 지원했는데, 게임 유저의 세그멘테이션을 분석한 프로젝트가 있다면?

이처럼 기업에서 관심있을 주제의 웹사이트 구축부터, 로그를 분석하기 위한 택소노미 설계, GTM 설치, GA4 데이터를 빅쿼리로 보낸 뒤 태블로로 시각화해 하나의 대시보드를 설계한 지원자라면 당연히 프로젝트에 더 관심이 가고, 기억에 남을 수밖에 없겠죠!

마지막으로는 데이터 분석의 마지막 단계 데이터시각화입니다. 인사이트를 직관적으로 파악하고 설득력 있는 커뮤니케이션을 하기 위해 꼭 필요한 단계입니다.
시각화 툴을 잘 다루는 것도 중요한 요소가 되지만, 복잡한 데이터를 시각적으로 한눈에 파악할 수 있어야 한다는 목적을 가지고 있습니다.

저는 데이터분석 주니어에게 한가지 조언을 드리고 싶습니다.
채용을 위한 포트폴리오 준비에 가장 중요한 것은 이것을 읽게 될 사람들의 니즈에 집중해야 한다는 것 입니다. 즉, 이 포트폴리오를 누가 볼 것이며, 어떻게 그들의 요구(회사가 직면한 문제를 해결하는 능력) 를 충족할 수 있는지를 고려해야 합니다. 지원하는 회사가 직면할 수 있는 매우 구체적인 비즈니스 문제와 프로젝트 목표를 설정하고, 그 문제를 해결하는 과정을 시각적으로 잘 보이게 전개하고 (데이터시각화 또는 대시보드 활용), 지원자의 강점을 활용해 독창성을 약간 더하는 접근 방식으로 풀어나가는 것을 메인 포인트로 잡는 것을 추천드립니다.

포트폴리오 구성 | 데이터 분석 프로젝트 준비 단계

1단계. 관심 있는 업계가 직면한 비즈니스 문제 목록 작성해보기
:모든 조직은 큰 그림에서의 문제와, 운영 단의 문제가 있습니다. 예를 들어, 유튜브는 “ 모든 사람이 자신의 목소리를 내고, 이야기를 듣고 공유하고 커뮤니티를 구축할 때 더 나은 세상이 된다” 라는 미션이 있습니다.

이러한 큰 그림에서의 관점을 가지고, 그 안에서 발생할 수 있는 운영 단의 문제를 해결하는 데이터 분석 시나리오를 작성해 보는 것입니다. 예를 들어, 유튜브는 추천 시스템, 채널 성과 측정, 이탈, 마케팅(신규 고객 유치), 예측 등 수천가지의 문제에 직면해 있을 것입니다.

이러한 문제들은 각 기업의 데이터 분석가가 작성한 테크 블로그 글이나, 해당 기업에서 개최하는 컨퍼런스, 웨비나 등에서 그 구체적인 예시를 확인해볼 수 있습니다. 해외에도 좋은 자료가 많으니 빅테크 기업의 영문 테크 블로그도 찾아보시는 것을 추천드립니다.


2단계. 가상의 비즈니스 문제를 개선할 수 있는 방법에 대해 생각해보기
: 이제 지원하고자 하는 부서가 직면해 있을 수 있는 가상의 문제를 어떻게 개선할 수 있을지 고민하는 단계입니다.

예를 들어, 마케팅에 대한 지식과 데이터시각화 역량을 강조하고 싶다면 이런 예시가 있습니다. 유튜브 프로덕트 팀에서 키즈 전용 유튜브 앱의 신규 유입을 늘려야 하는 상황에 직면했다면, 유입 채널 믹스 전략 계획을 세우기 위해, 가상의 데이터로 유튜브 키즈 앱의 Aquisition 채널별 노출, 설치, 앱 사용량, 비용, 타겟팅 등을 분석하는 대시보드를 보여주고, 유튜브 키즈 마케팅 팀, 퍼포먼스 마케팅 팀, 그로스 팀이 어떤 액션 플랜을 세워야 하는지 간략하게 설명해보는 것입니다.

또는 각 비즈니스 문제에 머신러닝이 활용되는 방안을 고민해 볼 수도 있습니다. 유튜브 키즈 앱에서의 지속적인 이탈을 막기 위한 이탈 예측을 주제로 매 주 이탈 확률이 어떻게 되는지 예측한다거나, 비슷한 고객군끼리 클러스터링을 하여 콘텐츠를 cross-recommend 하는 등 머신러닝을 활용한 다양한 비즈니스 문제를 개선해나가는 여러가지 접근 방식을 시도해볼 수 있습니다.

여기서 지원자 본인이 강조하고 싶은 독창적인 역량과 지원하는 직군과 포지션에 필요한 역량에 포커스하여 그에 맞게 시나리오를 구축해보시면 됩니다.


3단계. 데이터셋 만들기
이제 가상의 시나리오를 실제 데이터로 만들어보는 과정입니다.
이미 만들어진 각 산업군별 Fake 데이터를 활용할 수 있는 RWFD 프로젝트 (https://data.world/markbradbourne/rwfd-real-world-fake-data) 의 데이터셋도 좋지만, 직접 만들어 보시는 것도 추천드립니다.

가상의 시나리오에 포함되어야 할 데이터 컬럼을 정하고 나서, 예상하고 있는 인사이트 도출 흐름에 따라 데이터 값의 범위 등을 설정하고 그에 맞게 샘플 데이터를 생성합니다. 직접 컬럼별 데이터 형식 및 값 범위 등을 지정하여 샘플 데이터를 만들 수 있는 플랫폼 Mockaroo (https://www.mockaroo.com/) 라는 곳도 있고, 또는 Chat GPT 를 활용하여 비즈니스 시나리오를 설명하고 그에 맞는 컬럼명을 요청한 뒤, 해당하는 컬럼을 포함한 샘플 데이터셋을 생성하는 파이썬 코드를 작성해달라고 말해 파이썬에서 생성하는 방법도 존재합니다.


4단계. 약간의 독창성 더하기
모든 면에서 독창적일 필요는 없으나, 프로젝트에 약간에 유니크함을 더해 프로젝트를 차별화하는 방식을 정하는 것입니다.

예를 들어, 지원하는 직무에 따라 다르겠지만 남들이 흔히 하는 공공데이터 프로젝트가 아니라 직접 자신의 블로그 광고 소재를 테스트해보고, 소재 실험 결과를 분석해보고, 그에 대한 액션을 세워보고, 그 결과는 어땠는지 확인하고 리뷰하는 방식도 있을 것입니다. 이 과정은 지원하는 직무의 실제 업무와 관련되어 있을수록 좋습니다.

또 다들 많이 쓰는 matplotlib 라이브러리의 기본 차트가 아니라 유저가 인터랙티브하게 드릴 다운 탐색이 가능한 직관적인 대시보드를 작성해서 눈길을 확 끌거나, 해외 데이터 분석 관련 컨퍼런스에서 소개된 새로운 분석 개념을 적용해보거나, HuggingFace 에서 아직 사람들이 잘 모르는 최신 NLP 모델을 적용해보는 등 다양한 방법이 있을 수 있습니다.


| 마무리하며

데이터 분석가란?
가설과 KPI를 수립하고 다양한 분석 솔루션으로 데이터 분석환경을 구축하여 고객의 행동분석을 통한 비즈니스의 문제를 해결하는 전문가 입니다.

분석가는 어떤 숫자가 중요한지 이해해야 하며, 단순 숫자를 정리하여 알려주는 것이 아니라 해당 숫자가 어떤 것을 나타내는지 그 정의가 중요합니다. 하지만, 주니어 분석가의 경우 다음과 같은 어려움이 있습니다.


1. 기업에서 실제 다루는 양과 질의 데이터를 얻기에 어렵다.

2. 분석을 왜 해야 하는지 그 목적을 이해하기 어려우며, 인사이트 발견 및 도출하는 과정에 대한 배경 지식과 인사이트를 활용하는 방법에 대한 이해도가 상대적으로 부족하다.

3. 비즈니스 또는 분석 항목에 대한 이해도가 없는 상황에서 분석을 진행할 경우 비즈니스적 관점에서 좋고 나쁨을 해석하기가 어렵다.

그래서 여기, 실제 데이터 분석가들이 가장 많이 하는 비즈니스 프로젝트를 준비하였습니다.
[세계 3등에게 배우는 13개 데이터 분석 프로젝트]
퍼포먼스 마케팅 데이터 분석부터 유저 세그멘테이션 분석, 프로모션 분석 등 13개의 다양한 분야와 다양한 시나리오를 통해 6단계의 데이터 분석 파이프라인의 경험과 데이터시각화 스킬을 가져가 보세요.


📌 현업에서 가장 많이 쓰는 가상 비즈니스 시나리오 13개 제공
📌 기업 규모의 가상 데이터셋 파일 13개 제공
📌 다양한 산업별 비즈니스 목적에 맞는 대시보드 템플릿 13개 제공


참고 및 출처:
https://fastcampus.co.kr/data_online_global3
https://www.youtube.com/watch?v=QS1kRbeTgeA
https://www.youtube.com/watch?v=p4DuJ77p6Ko
https://gils-lab.tistory.com/103


👉 지금 패캐머들이 읽고 있는 BEST 아티클이 궁금하다면?

이 글과 연관된 주제의 추천 강의