딥러닝 기반
코스 프로모션 배너 전용입니다.
0 0시간 0 0 코스 프로모션 배너 전용입니다.
(자동)
정가 (자동)
현재 판매가 (자동)
12개월 무이자 할부 시 (자동)

👇 강의 엿보기 👇

Brand-new Sight

AI 를 만들기 위한 필수 기술 3가지를 아시나요?

컴퓨터 비전

자연어 처리

음성 합성/출력

이 중, AI사람 사이의 간극을 줄이는 핵심은 사람처럼 말하는 기술입니다.

딥러닝 음성

영화 HER의 주인공 테오도르가 인공지능을 사랑할 수 있었던 이유는,
상대를 사람으로 인식했기 때문일 텐데요.

이는 자신이 사람과 대화하고 있다고 느끼는 것
즉, 감정을 표현하는 인공지능의 목소리 때문입니다.

최근 가상인간이 여러 매체에서 활동을 하기 시작했습니다.
가상인간의 장점으로는 언제 어디서든 제약을 받지 않고 동시에 많은 활동을 할 수 있다는 것인데 지금 가상인간의 문제점은 대역 연기자가 목소리 연기, 노래, 표정, 동작 등을 해주는 방식이라 이러한 장점이 없어 최대한으로 활용하기 어렵습니다.
인공지능 성우가 활용되면 대역 연기자 없이도 가상인간을 동작 시킬 수 있습니다. 대본에 따라 감정과 스타일을 살려서 연기를 할 수 있는 것이 필요한데
텍스트에서 음성을 만들어내는 기술이 중요한 역할을 차지합니다.

더 나아가서는 텍스트에서 감정과 스타일을 살려서 표정이나 동작을 생성해내는 기술로도 확장이 가능합니다. 이런 기술은 자율 활동을 하는 가상인간을 만들어 내는데 필수적인 기술이라고 볼 수 있습니다.

by. 김태수

사람처럼 말하는 AI 는 이미 많은 분야에서 활용되고 있습니다.

아래의 프로젝트는 강사님께서 직접 참여하신 프로젝트로 구성되어 있습니다.

01. MBC 다큐멘터리 - 너를 만났다

먼저 떠나보낸 딸과 재회를 위해 VR 기술과 음성 합성 기술로
재회를 이루어내어 큰 감동을 주었습니다.

02. 유튜브 콘텐츠

1분요리 뚝딱이형, ITSub 잇섭, 우왁굳 등 다양한
유튜브 채널에서 인공지능 성우를 활용하고 있습니다.

03. 가상의 성우, 가수, 연기자

밀리의 서재 AI 보이스, 인공지능 성우, 가상의 가수 등
다양한 컨셉의 음성을 만들어 낼 수 있습니다.

04. 외국어 번역 및 언어 변환

도널드 트럼프 전 대통령의 목소리를 학습하여
한국어로 이야기 하는 영상으로 큰 주목을 받았습니다.


소량의 데이터를 통해서도
목소리를 학습하고 재현해 낼 수 있는 기술

원하는 콘텐츠에 원하는 느낌대로 표현할 수 있도록
사용자가 원하는대로 컨트롤 할 수 있는 기술

가상 성우의 얼굴 표정이 음성에 맞춰
적절하게 표현할 수 있는 기술




글로벌 최고 수준의 인공지능 기반
음성 및 영상 합성 원천 기술을 보유한
네오사피엔스 김태수 대표에게 직접 배워 보세요.

보고 듣는 기술, 즉 인식에 대한 기술은
어느정도 성과를 보이고 있는데, 말하고 행동하는,
즉 생성 모델에 대한 기술은 앞으로 시장 가능성이 매우 높다고 봤습니다.
텍스트 및 음성 신호 처리에 대한 이해

텍스트 처리에 대한 개념과 음성 신호 처리에 필요한
도메인 지식과 프로세스에 대해 학습합니다.

딥러닝 기반 음성 합성 기술에 대한 이해

Acoustic 모델부터 뉴럴 보코더 기술인 VocGAN 까지
음성 합성에 필요한 딥러닝 기반 기술에 대해 학습합니다.

고급 음성 합성 기술에 대한 이해

Multi speaker, Multi lingual, 감정,
운율 조절 및 제어 기술에 대해 학습합니다.

말하는 가상 인간을 위한
Text to face 기술에 대한 이해

영상과 음성의 합성 기술에 필요한 생성모델인
Wave2Lp에 대해 학습합니다.

TTS 란? Text - To - Speech 입력된 텍스트 정보를 사람의 음성으로 변환해 주는 기술

Top of Top

본 강의는 음성 합성 기술에 대한 이해를 위한 핵심 이론만 압축해서 준비했습니다.

누구나 한번쯤은 써봤던 휴대폰 통화 속 노이즈 제거 기술, 시리와 빅스비로 보편화된 실시간 음성 에이전트(비서)
기술의 전세계 최초 상용화에 앞장 선 글로벌 20년 경력의 국내 최고 수준 전문가인 김태수 대표의 노하우를 담았습니다.

경력 및 학력

[ 2017 - 현재 ]
Neosapience : 대표이사

• 누적 가입자 100만명 인공지능 성우 서비스 타입 캐스트 운영 중
• 2022년 9월 기준 - 누적 투자유치 318억원

[ 2010 - 2017 ]
Qualcomm : Sr. Staff Engineer

• 스냅 드래곤 보이스 액티베이션 - AI 호출어 인식 기술 상용화
• 주변 소음 인식하여 음악 검색 서비스 런칭

[ 2007 - 2010 ]
LG Electronics : Sr. Research Engineer / Technical Leader

• 통화 중 내목소리만 전송하는 기술 상용화
• 비디오 촬영 시 원하는 방향의 소리만 녹화하는 기능 상용화

[ 2001 - 2007 ]
KAIST : Research Assistant

• Ph.D. Brain Engineering, KAIST, 2003~2007
• M.S. Electrical Engineering, KAIST, 2001~2003


프로젝트

• Ambient sound recognition, Qualcomm Technology Inc.
• Always on Music Detection, Qualcomm Technology Inc.
• Always on voice activation, Qualcomm Technology Inc.
• Audio Content Recognition, Qualcomm Technology Inc.
• Always on low power microphone and audio systems, Qualcomm Technology Inc.
• Dual Microphone Noise Reduction for Comfortable Voice Call, LG Electronics.
• Dual Microphone Audio Focus for Camcorder, LG Electronics.
• Development of Artificial Brain Prototype and Office mates, KAIST
• Blind source separation and its application to audio separation, UCSD and Softmax Inc. (now acquired by Qualcomm, Inc.)
• The RUBI (a social robot for child care) project, UCSD and Sony Corp.
• Google Scholar Link : 논문 인용 횟수 3,500건


수상내역

2022년 : 임팩테크 대상 - 과학기술정보통신부 장관 상 수상
2020년 : AI 코리아 대상 기술분야 1위 - 과학기술정보통신부 장관상 수상
2020년 : 서울시 CAC 글로벌 서밋 혁신 기업 선정

딥러닝 TTS

기술 관련 미국 특허 40개 / 논문 20편 / 논문 인용횟수 3500건
BTS, 밀리의 서재, 대기업 홈쇼핑 채널 등이 선택한 서비스 타입캐스트의 창업자
자타공인 국내 최고 전문가의 직강을 지금 바로 확인하세요!

딥러닝 기초

이런 분들을 위해 준비 했습니다.

음성 합성에 관심있는 기본적인 딥러닝 지식이 있는 분

음성 합성 기술을 본인의 서비스에 적용하고 싶으신 분

조금 더 고도화된 음성 합성 기술을 배워보고 싶은 분

음성 합성 기술의 활용 방안에 대해 궁금한 인공지능 분야 현업자

상세 커리큘럼

음성 합성 기술에 필요한 기본적인 도메인 부터,
생성모델, 딥러닝 모델까지 국내 최고 전문가 김태수가 전달 합니다.

Part 01. Introduction

딥러닝 AI

Part 02. 텍스트 및 음성 신호 처리

딥러닝 음성처리

Part 03. 딥러닝 기반 음상 합성 기술

딥러닝 음성 합성

Part 04. 고급 음성 합성 기술

딥러닝 기술

Part 05. 말하는 가상 인간을 위한 Text-to-face 기술

딥러닝 기초

Part 06. 강의 마무리

딥러닝이란
잠깐!
학습을 위한
사전 지식
선기본적인 Python 코딩 지식
Pytorch, Tensorflow 등의 Deep Learning Tools
CNN, RNN, Transformer 등의 딥러닝 기초 지식

수강 대상
기본적인 Python 코딩 지식
Pytorch, Tensorflow 등의 Deep Learning Tools
CNN, RNN, Transformer 등의 딥러닝 기초 지식

학습 목표
기본적인 음성 합성 기술에 대한 이해
음성 합성 기술에서 중요하게 다뤄야 할 부분과 실용적 관점
앞으로의 기술 발전 방향에 대한 이해

주의 사항
본 수업은 실습 내용은 포함하고 있지 않습니다.