파이썬 강의

파이썬 독학 시 좋은 강의 고르는 법, 파이썬 데이터 분석 입문 강의 추천

#파이썬 독학 #파이썬 데이터 분석 #파이썬 강의


데이터 분석을 위한 파이썬 입문 강의를 찾는 사람들에게 바칩니다.


| 파이썬은 왜 데이터 분석에 많이 쓰일까?

파이썬 python

파이썬이 데이터 분석에 많이 사용된다는 말을 많이 들어보셨을 겁니다. 이 글을 보고 계시는 여러분도 그런 이유에서 파이썬 독학을 결심하셨고, 열심히 찾아보다 이 글을 읽게 되셨을 거라 생각됩니다.

그런데 혹시 ‘왜?’ 데이터 분석에 파이썬이 많이 쓰이는지 알고 계신가요?

1. 데이터 분석에 가장 특화된 언어

파이썬은 현재 전 세계적으로 가장 인기 있는 프로그래밍 언어 중 하나입니다. 쉬운 접근성, 높은 확장성, 넓은 활용성으로 개발에도 많이 쓰이는데요. 구글, 넷플릭스, 인스타그램 등 여러분들이 자주 이용하는 서비스 또한 파이썬으로 개발되었답니다.

그렇지만 파이썬이 가장 많이 쓰이는 분야는 사실 ‘데이터 분석’인데요, 2021년 JET BRAINS의 조사에 따르면 파이썬 데이터 분석 활용도가 51%로 웹 개발보다 무려 6% 높게 나타났답니다.

이렇듯 파이썬은 데이터 분석에 가장 특화된 언어로 데이터 분석을 공부하고자 하는 사람들에게 있어 필수불가결적인 요소가 된 거죠.

네카라쿠배당토라고 들어보셨나요? 취업이나 이직하고 싶으신 분들이 가장 가고 싶은 기업으로 꼽혀요. 그래서 요즘 이런 선진 IT 기술을 가진 데이터 친화적인 기업에서는 파이썬을 활용하는 것이 기본이 되어 가고 있습니다.

여러분이 꿈꾸는 기업이라면, 그리고 현재 업무에서 데이터를 더 능숙하게 다루고 싶다면 기본적으로 파이썬 프로그래밍은 무조건 배우셔야 합니다.

2. 다양한 라이브러리 지원

파이썬은 주로 데이터 분석 결과를 다른 웹 애플리케이션에 접목하거나 통계적인 코드를 데이터베이스에 포함시켜야 할 때 사용합니다. 필요한 패키지나 라이브러리를 불러오고 조합하여 분석 목적에 맞는 작업을 수행할 수 있습니다.

데이터 분석을 하다 보면 크롤링, 시각화 등 목적에 따라 다양한 라이브러리를 활용해야 합니다. 파이썬은 이러한 작업을 하는 데 있어 유용할뿐더러 다양한 라이브러리를 제공합니다. 데이터 분석의 일련의 과정에서 각 단계마다 필요한 라이브러리를 불러와, 최적화된 기능을 활용할 수 있다는 것이 장점입니다.

이러한 이유로 최근 파이썬 독학을 하는 사람들이 급증했는데요. 그만큼 공부하고자 하면 책부터 유튜브, 각종 온라인 강의 등 다양한 방법으로 학습이 가능합니다.

하지만 막상 파이썬 독학을 하기 위해 찾아보면 단순 문법만 배우거나 자동화, 웹 개발 등 프로그래밍 중심의 강의가 많았을 거예요. 개발에도 적지 않게 쓰이다 보니 프로그래밍 중심의 강의와 도서가 많은 것이 현실입니다.

그래서 오늘은 파이썬으로 데이터 분석을 하고자 하는 분들을 위해 파이썬 데이터 분석 강의 고르는 팁과 몇 가지 강의를 추천드리고자 합니다.


| 파이썬 독학 강의 고를 때 살펴봐야 할 사항

1. 수업 환경
파이썬 강의에는 대표적으로 Jupyter notebook(주피터 노트북)과 Google Colab(구글 코랩)이 사용됩니다.

1) Jupyter notebook(주피터 노트북)
Jupyter notebook은 Jupyter에서 제작한 “파이썬을 위한 통합 개발 환경” 입니다. 다양한 파이썬 개발 툴 중에서 가장 인기가 많다고 하네요. Jupyter notebook의 Jupyter는 지원하는 세 가지 언어인 Julia, Python, R 에서 유래했다고 합니다.

2) Google Colab(구글 코랩)
Google Colab은 구글 내에서 주피터 노트북을 연구 및 교육하기 위해 커스텀하여 개발한 환경입니다. 한 마디로 “구글의 주피터 노트북” 인거죠. 얼핏 보면 비슷해 보이지만 구글에서 계속 사용하면서 꾸준히 기능을 향상시켰다고 하네요.

Q. 어차피 비슷하면 주피터 노트북을 쓰면 되지 않나요?
범용적으로 사용되는 주피터 노트북도 장점이 많고, 구글 코랩 또한 주피터 노트북 기반으로 개발된 환경이지만 구글 코랩만의 장점이 있습니다.

google colab 구글 코랩

1) 사용법/공유가 편리함
구글 코랩의 최대 장점은 별도 설치와 다운로드 없이 브라우저로 바로 실행할 수 있다는 것인데요. 구글 계정이 있으면 누구나 무료로 이용 가능합니다.
또한 공유의 왕국 구글답게 링크로 다른 사용자와 쉽게 공유할 수 있습니다. 즉, 구글 코랩은 주피터 노트북 기능에 구글 드라이브 기능을 더한 환경이라고 볼 수 있겠습니다.

2) 주피터 노트북과 유사한 기능 탑재
구글 코랩은 주피터 노트북의 기능을 대부분 포함하고 있습니다. 파이썬 2.7 및 3.6 을 모두 지원하며 파이썬 코드 실행, 마크다운, 수식, 차트 표현 등 다양한 기능이 제공됩니다. 다만 여러 언어를 활용 가능한 주피터 노트북과 달리 구글 코랩은 파이썬만 지원하고 있습니다.

3) 라이브러리 다운도 필요 없음
구글 코랩은 matplotlib, seaborn, tensorflow, numpy 같은 라이브러리가 있어 다운로드하지 않아도 됩니다. 만일 필요한 라이브러리가 없다면 pip 외부 명령 실행으로 추가 설치할 수 있습니다.

어느 환경이 더 좋다 우열을 가리긴 어렵지만, 입문자에게는 최대한 간편하게 실행할 수 있는 구글 코랩이 조금 더 편리할 수 있겠습니다. 언어나 라이브러리 사용법도 익숙하지 않은데 실습 환경을 설치할 때 오류가 생긴다면 공부하는 데 시간이 많이 지체되기 때문입니다.

2. 커리큘럼과 실습 데이터
다음으로는 커리큘럼에서 꼭 보셔야 하는 사항들에 대해 알려드리겠습니다.

1) 파이썬 데이터 분석에 필요한 핵심 라이브러리가 모두 포함되었는가?
파이썬 데이터 분석에 대표적으로 쓰이는 라이브러리는 총 5가지입니다. 각각 데이터 수집, 전처리, 데이터 가공(분석), 시각화에 필요한 라이브러리죠. 파이썬 독학을 하고자 한다면 커리큘럼에 최소 아래에서 소개해 드리는 5개 라이브러리는 꼭 포함되어야 합니다.

  • Numpy
    데이터 전처리
    벡터, 행렬 등 가장 중요하고 기초적인 수치계산에 필요한 라이브러리.

  • BeautifulSoup
    데이터 수집
    원하는 데이터를 웹 사이트에서 자동화로 수집 가능한 라이브러리.

  • Pandas
    데이터 조작 및 분석
    외부 데이터 추출 및 정제, 가공, 통계분석, 시각화까지 데이터 분석에 필요한 대부분의 기능들을 가지고 있는 라이브러리.

  • Matplotlib Seaborn
    데이터 시각화
    데이터를 통해 새로운 인사이트를 도출하고, 시각화까지 할 수 있는 라이브러리. 마케팅 전략이나 기획을 진행할 때 데이터 분석 및 시각화에 활용 가능.

2) 실무에서 활용할 수 있는 실습 주제로 구성되어 있는가?
실제로 우리가 분석해야 할 데이터와 유사한 실무형 실습이 포함되어 있는지 살펴보는 것이 중요합니다. 공공데이터를 활용한 실습은 파이썬 라이브러리 활용법을 익히는 데는 문제없지만 실제로 실무에서 어떻게 활용하는지 습득하기에는 한계가 있기 때문입니다.

예를 들어, 마케터라면 고객 구매 여정 분석이나 캠페인 고객 반응 예측을, HR 인사 담당자라면 이직 예측 분석을, 기획자라면 구매 데이터를 활용한 서비스 지표나 상품 고객 이탈 단계를 분석을 하는 등의 내 업계나 직무와 맞닿아 있는 실습으로 배운다면 실무 활용도 또한 높아질 것입니다.

3. 강사 이력
파이썬은 웹 개발에도 많이 쓰이기 때문에 입문/초급 강의인 경우 개발자 재직 or 출신 강사님께서 진행해 주시는 경우가 잦습니다. 하지만 개발자와 데이터 사이언티스트의 직무에는 차이가 있습니다. 데이터 분석을 하기 위해 파이썬 독학을 하는 것이라면 데이터를 분석하고 인사이트를 도출하는 것까지 설명해 줄 수 있는 데이터 분석가/데이터 사이언티스트 혹은 데이터 관련 학과 출신 강사님에게 배우는 것이 좋습니다.

| 추가로 살펴보면 좋을 것들

파이썬 독학

1. 질의응답 제공 여부
파이썬 독학을 하다 보면 예상치 못한 오류를 맞닥뜨릴 수 있습니다. 구글링이 나의 모든 오류 케이스를 커버해 주지는 못하기 때문에 Q&A 서비스를 제공하거나 Slack 등으로 수강생들끼리 교류 가능한 커뮤니티가 있다면 초보자가 겪는 문제를 쉽게 해결할 수 있을 것입니다.

2. Raw data를 제공하는가
실무에서 우리가 마주치는 데이터는 실습에서 사용하는 정제된 데이터와 다릅니다. 또한 강의를 듣고 추가적으로 데이터 분석을 해 보고 싶어도 통상 데이터가 없어서 하지 못하는 경우도 있는데요. Raw data가 제공되는 강의를 수강한다면 완강 후에도 스스로 데이터 분석을 하며 실전 능력을 향상시킬 수 있습니다.


지금 패캐머들이 읽고있는 BEST 아티클이 궁금하다면

이 글과 연관된 주제의 추천 강의