채용공고에 나오는 7가지 데이터 분석 툴 완벽 정리 (feat. 파이썬, R…)

#데이터 분석 #데이터 분석가 #데이터 분석 방법


코로나 시대로 진입하면서, 여러 산업환경이 빠르게 변화하고 있다. 동시에 대부분의 산업이 온라인화 되면서 데이터 분석에 대한 관심도 계속해서 커지는 추세다. 예전에 비해, 이제 대학에서 빅데이터 관련 학부나 데이터 전문가를 육성하는 전공들을 보는 것도 어렵지 않아졌다. 이러한 변화는 사실 데이터 관련 산업의 성장에서 시작한다고 볼 수 있다. 데이터 관련 산업이 크게 발전하면서 관련된 인력을 채용하는 기업들이 많아졌기 때문이다.

데이터 분석

| 데이터 분석 채용공고 뜯어보기

그렇다면 기업에서 요구하는 데이터 분석가는 구체적으로 어떤 사람들일까? 채용정보 사이트 잡플래닛에 ‘데이터 분석’ 키워드를 검색해본 결과를 확인해보자. 다음은 ‘마이리얼트립’이라는 한 기업의 데이터 분석 매니저 직군 채용공고이다.

데이터 분석가 채용공고

출처 : 잡플래닛

기본적으로 SQL과 파이썬, R 등을 활용해 데이터를 추출하고 가공하며 기본적인 통계학과 실험 방법론에 대한 이해가 있는 사람을 요구하고 있다. 이외 우대사항으로 GA와 BigQuery 등 로그 분석 툴을 사용할 수 있는 사람을 찾는 걸로 보인다.

GA와 Big Query

아마 이 공고를 읽어보고 ‘이게 대체 무슨 소리지?’ ‘이렇게 많은 것을 해야 한다니’라고 생각하는 사람도 있을 것이다. 데이터 분석 직군은 그 분야나 업무의 커버리지(Coverage)가 매우 넓다. 때문에 데이터 분석이라는 직무에서 원하는 역량도 굉장히 많고 다양한 편이다. 실무에서 주니어를 찾아보기 어려운 것도 이 때문이다.


| 데이터 분석가에게 요구하는 역량은?

결국 포인트는, 데이터 분석 직군에서 요구하는 역량이 매우 많다는 점이다. 그리고 파이썬이나 SQL과 같은 도구를 활용해서 뭔가를 처리할 수 있는 실질적인 능력을 원한다는 점이 핵심이다.

데이터 분석 직군에서는 개발자들이 세팅한 환경에서 ‘데이터를 가지고 얼마나 잘 놀 수 있느냐’가 중요하다. 데이터를 가지고 잘 놀려면 결국 ‘도구’를 잘 써야 하고, 여기에는 다양한 코딩 언어나 엑셀, 구글 빅쿼리, 태블로와 같은 프로그램이 포함된다. 이외에 팀 단위로 일하는 데이터 분석 업무에 요구되는 협업을 위한 커뮤니케이션 능력도 당연히 중요하다.

데이터 분석가 역량

| 데이터 분석의 기본 과정은?

데이터 분석의 기본 과정은 산업마다 조금씩 다르겠지만, 아래의 4단계를 필수적으로 거친다.

1. 데이터 수집
회사에 소속되어 있는 데이터 분석가들은 보통 데이터를 직접 수집하지 않는다. 이미 데이터가 있는 상태에서 업무를 시작하게 된다. 혹시 회사에 소속되지 않았다면, 이미 공개된 공공 데이터를 찾아 활용하거나 크롤링을 통해 데이터를 직접 수집해야 한다.

2. 데이터 탐색(EDA)
수집한 데이터를 다양한 관점으로 파악하는 과정이다. 탐색적 데이터 분석(Exploratory Data Analysis)이라고 부르기도 한다. 데이터를 본격적으로 분석하기 전에 데이터에 문제가 없는지 이상치나 결측치 등을 확인한다.

3. 데이터 전처리
Real Data는 분석에 적합하지 않다. 수집한 데이터를 실제로 분석에 사용할 수 있게끔 처리하는 과정을 전처리라고 한다. 생선을 먹기 전에 손질하는 것과 동일한 맥락이다. 어떤 Feature을 사용할지, 보고 싶지 않은 데이터는 어떻게 정리할지 등을 고민한다.

4. 데이터 모델링
데이터 모델링(data modeling)이란 주어진 개념으로부터 논리적인 데이터 모델을 구성하는 작업을 말하며, 일반적으로 이를 물리적인 데이터베이스 모델로 환원하여 고객의 요구에 따라 특정 정보 시스템의 데이터베이스에 반영하는 작업을 포함한다. 후자의 의미로 흔히 데이터베이스 모델링으로 불리기도 한다.


| 데이터 분석 툴 7가지 특징별로 정리

채용공고에 가장 자주 등장하는 데이터 분석 툴은 아래의 7가지로 요약된다. 각각의 데이터 분석 언어 또는 프로그램이 어떤 특징을 가지고 있는지 알아보자.

파이썬

파이썬

쉽고 직관적인 프로그래밍 문법이 장점이다. 수칙 연산, 데이터 처리, 시각화까지 모두 처리할 수 있어 데이터 분석 업무에 넓게 활용된다. 데이터 분석 결과를 다른 웹 애플리케이션에 접목하거나 통계적인 코드를 데이터베이스에 포함시켜야 할 때 효과적으로 쓸 수 있다

R

R

엑셀로 처리하기 힘든 방대한 양의 데이터를 처리하기에 적합하다. 즉시 사용 가능한 테스트 SET를 R에서 제공하고, 시각화에 효과적이라 연구 목적이 아니더라도 다양한 데이터 분석 업무에서 활용된다.

엑셀(EXCEL)

엑셀(EXCEL)

데이터 직군이나 개발 직군이 아니더라도, 대부분의 회사원들이 사용하는 사무용 프로그램이다. 아주 대용량의 데이터가 아니라면, 엑셀의 기능만 활용해도 데이터를 효과적으로 처리하고 분석하는데 무리가 없다.

SQL

SQL

간단한 쿼리문 몇 줄로 대용량의 고객 데이터를 체계적으로 추출하고 관리할 수 있다. 다른 프로그래밍 언어에 비해 배우기 쉬워, 데이터 전문 직군이 아닌 마케터나 기획자 직무에서도 SQL 역량을 갖추는 추세이다

태블로(Tableau)

태블로(Tableau)

다양한 시각화 차트가 제공되는 태블로는 ‘데이터 스토리텔링’에 특히 효과적이다. 데이터 분석 업무 자체보다는, 데이터 분석 결과를 통한 사내 커뮤니케이션이나 업무 보고에 활용하기 좋다.

Power BI

Power BI

엑셀을 포함한 Microsoft Office 어플리케이션 기반으로 활용할 수 있는 협업 툴이다. 개인적으로 열람했던 데이터를 협업이 필요한 관계자들끼리 공유하고, 커스텀 대시보드로 데이터 시각화에 활용할 수 있다.

구글애널리틱스(Google Analytics)

구글애널리틱스(Google Analytics)

GA는 흔히 마케팅에 국한해서 쓰인다고 생각하기 쉽다. 하지만 GA는 웹 로그 데이터 분석에 범용적으로 쓰이는 대표적인 분석 툴이다. 어떤 분야의 고객 데이터든, 심층적으로 분석하여 광고 효율과 제품의 매출을 개선시킬 수 있다.


| 데이터 분석의 핵심은 추출이 아닌 의사결정

데이터 분석가로 취업이나 직무 전환을 생각하고 있다면, 무엇보다 데이터 분석의 핵심 가치를 명확히 이해하고 있어야 한다. 데이터 분석의 핵심은 데이터의 분석 그 자체가 아닌 이후의 의사결정에 있기 때문이다.

1. 수집한 데이터에서 어떤 가치를 뽑아내는가?
2. 데이터를 분석해서 어떤 걸 얻고 싶은가?
3. 데이터를 통한 올바른 의사결정을 할 수 있는가?

결국 데이터 분석 자체도 중요하지만, 데이터 분석이라는 단계를 거쳐 ‘이후에 어떤 가치를 연쇄적으로 만들어낼 수 있는가’까지 고민하는 것이 필요하다.

데이터 분석가 역량

기업에서 요구하는 데이터 분석 역량, 언제 어떻게 다 준비할 지 고민하세요? 이제 온라인 강의 하나로 완벽 대비해보세요.

채용공고에서 가장 많이 요구하는 데이터 분석 핵심 툴 4가지를 80시간 분량의 온라인 강의에서 원하는 대로 골라 배울 수 있습니다. 부록으로 제공되는 네카라쿠배 선배들의 아티클로 현업에서 인사이트 뽑는 꿀팁까지 얻어가세요!

아래 네임카드를 클릭해 커리큘럼을 자세히 확인해보세요!


지금 패캐머들이 읽고있는 BEST 아티클이 궁금하다면

이 글과 연관된 주제의 추천 강의