The Red : 감정을 담은 AI TTS 개발을 위한 딥러닝 음성 합성 기술
![딥러닝 기반](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/000607-774/메인최종.png)
👇 강의 엿보기 👇
Brand-new Sight
AI 를 만들기 위한 필수 기술 3가지를 아시나요?
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/051914-712/eye.webp)
컴퓨터 비전
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/051922-712/ear.webp)
자연어 처리
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/051930-712/ask.webp)
음성 합성/출력
이 중, AI와 사람 사이의 간극을 줄이는 핵심은 사람처럼 말하는 기술입니다.
![딥러닝 음성](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/090524-712/000.gif)
영화 HER의 주인공 테오도르가 인공지능을 사랑할 수 있었던 이유는,
상대를 사람으로 인식했기 때문일 텐데요.
이는 자신이 사람과 대화하고 있다고 느끼는 것
즉, 감정을 표현하는 인공지능의 목소리 때문입니다.
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/075308-712/00red-02-banner00.webp)
최근 가상인간이 여러 매체에서 활동을 하기 시작했습니다.
가상인간의 장점으로는 언제 어디서든 제약을 받지 않고 동시에 많은 활동을 할 수 있다는 것인데
지금 가상인간의 문제점은 대역 연기자가 목소리 연기, 노래, 표정, 동작 등을 해주는 방식이라
이러한 장점이 없어 최대한으로 활용하기 어렵습니다.
인공지능 성우가 활용되면 대역 연기자 없이도 가상인간을 동작 시킬 수 있습니다.
대본에 따라 감정과 스타일을 살려서 연기를 할 수 있는 것이 필요한데
텍스트에서 음성을 만들어내는 기술이 중요한 역할을 차지합니다.
더 나아가서는 텍스트에서 감정과 스타일을 살려서 표정이나 동작을 생성해내는 기술로도 확장이 가능합니다.
이런 기술은 자율 활동을 하는 가상인간을 만들어 내는데 필수적인 기술이라고 볼 수 있습니다.
by. 김태수
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/010255-712/red-banner.webp)
사람처럼 말하는 AI 는 이미 많은 분야에서 활용되고 있습니다.
아래의 프로젝트는 강사님께서 직접 참여하신 프로젝트로 구성되어 있습니다.
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/054013-712/ai-03.webp)
03. 가상의 성우, 가수, 연기자
밀리의 서재 AI 보이스, 인공지능 성우, 가상의 가수 등
다양한 컨셉의 음성을 만들어 낼 수 있습니다.
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/054327-712/red-s-3-1.webp)
소량의 데이터를 통해서도
목소리를 학습하고 재현해 낼 수 있는 기술
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/054441-712/red-s-3-2.webp)
원하는 콘텐츠에 원하는 느낌대로 표현할 수 있도록
사용자가 원하는대로 컨트롤 할 수 있는 기술
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/054449-712/red-s-3-3.webp)
가상 성우의 얼굴 표정이 음성에 맞춰
적절하게 표현할 수 있는 기술
글로벌 최고 수준의 인공지능 기반
음성 및 영상 합성 원천 기술을 보유한
네오사피엔스 김태수 대표에게 직접 배워 보세요.
보고 듣는 기술, 즉 인식에 대한 기술은
어느정도 성과를 보이고 있는데, 말하고 행동하는,
즉 생성 모델에 대한 기술은 앞으로 시장 가능성이 매우 높다고 봤습니다.
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/054855-712/강사님-right.webp)
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202008/110232-11/artboard-1.png)
TTS 란? Text - To - Speech 입력된 텍스트 정보를 사람의 음성으로 변환해 주는 기술
Top of Top
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202008/110232-11/artboard-1.png)
본 강의는 음성 합성 기술에 대한 이해를 위한 핵심 이론만 압축해서 준비했습니다.
누구나 한번쯤은 써봤던 휴대폰 통화 속 노이즈 제거 기술, 시리와 빅스비로 보편화된 실시간 음성 에이전트(비서)
기술의 전세계 최초 상용화에 앞장 선 글로벌 20년 경력의 국내 최고 수준 전문가인 김태수 대표의 노하우를 담았습니다.
경력 및 학력
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/061124-712/a2-01.webp)
[ 2017 - 현재 ]
Neosapience : 대표이사
• 누적 가입자 100만명 인공지능 성우 서비스 타입 캐스트 운영 중
• 2022년 9월 기준 - 누적 투자유치 318억원
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/061130-712/a2-02.webp)
[ 2010 - 2017 ]
Qualcomm : Sr. Staff Engineer
• 스냅 드래곤 보이스 액티베이션 - AI 호출어 인식 기술 상용화
• 주변 소음 인식하여 음악 검색 서비스 런칭
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/061400-712/a2-03.webp)
[ 2007 - 2010 ]
LG Electronics :
Sr. Research Engineer / Technical Leader
• 통화 중 내목소리만 전송하는 기술 상용화
• 비디오 촬영 시 원하는 방향의 소리만 녹화하는 기능 상용화
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/040827-712/a2-04.webp)
[ 2001 - 2007 ]
KAIST : Research Assistant
• Ph.D. Brain Engineering, KAIST,
2003~2007
• M.S. Electrical Engineering, KAIST,
2001~2003
프로젝트
• Ambient sound recognition, Qualcomm Technology Inc.
• Always on Music Detection, Qualcomm Technology Inc.
• Always on voice activation, Qualcomm Technology Inc.
• Audio Content Recognition, Qualcomm Technology Inc.
• Always on low power microphone and audio systems, Qualcomm Technology Inc.
• Dual Microphone Noise Reduction for Comfortable Voice Call, LG Electronics.
• Dual Microphone Audio Focus for Camcorder, LG Electronics.
• Development of Artificial Brain Prototype and Office mates, KAIST
• Blind source separation and its application to audio separation, UCSD and Softmax Inc. (now acquired by Qualcomm, Inc.)
• The RUBI (a social robot for child care) project, UCSD and Sony Corp.
• Google Scholar Link :
논문 인용 횟수 3,500건
수상내역
• 2022년 : 임팩테크 대상 - 과학기술정보통신부 장관 상 수상
• 2020년 : AI 코리아 대상 기술분야 1위 - 과학기술정보통신부 장관상 수상
• 2020년 : 서울시 CAC 글로벌 서밋 혁신 기업 선정
![딥러닝 TTS](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/064013-712/이미지.webp)
기술 관련 미국 특허 40개 / 논문 20편 / 논문 인용횟수 3500건
BTS, 밀리의 서재, 대기업 홈쇼핑 채널 등이 선택한 서비스 타입캐스트의 창업자
자타공인 국내 최고 전문가의 직강을 지금 바로 확인하세요!
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/064702-712/red-banner00.webp)
![딥러닝 기초](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/065533-712/잠깐.webp)
이런 분들을 위해 준비 했습니다.
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202109/204722-472/section-5-3.png)
음성 합성에 관심있는 기본적인 딥러닝 지식이 있는 분
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202109/204722-472/section-5-3.png)
음성 합성 기술을 본인의 서비스에 적용하고 싶으신 분
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202109/204722-472/section-5-3.png)
조금 더 고도화된 음성 합성 기술을 배워보고 싶은 분
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202109/204722-472/section-5-3.png)
음성 합성 기술의 활용 방안에 대해 궁금한 인공지능 분야 현업자
상세 커리큘럼
음성 합성 기술에 필요한 기본적인 도메인 부터,
생성모델, 딥러닝 모델까지 국내 최고 전문가 김태수가 전달 합니다.
Part 01. Introduction
![딥러닝 AI](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/073129-712/page01.webp)
Part 02. 텍스트 및 음성 신호 처리
![딥러닝 음성처리](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/073152-712/page02.webp)
Part 03. 딥러닝 기반 음상 합성 기술
![딥러닝 음성 합성](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/073229-712/page03.webp)
Part 04. 고급 음성 합성 기술
![딥러닝 기술](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/073339-712/page04.webp)
Part 05. 말하는 가상 인간을 위한 Text-to-face 기술
![딥러닝 기초](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/073344-712/page05.webp)
Part 06. 강의 마무리
![딥러닝이란](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202209/030024-8/스크린샷-2022-09-28-오전-11.59.37.png)
잠깐!
사전 지식
ㆍPytorch, Tensorflow 등의 Deep Learning Tools
ㆍCNN, RNN, Transformer 등의 딥러닝 기초 지식
ㆍPytorch, Tensorflow 등의 Deep Learning Tools
ㆍCNN, RNN, Transformer 등의 딥러닝 기초 지식
ㆍ음성 합성 기술에서 중요하게 다뤄야 할 부분과 실용적 관점
ㆍ앞으로의 기술 발전 방향에 대한 이해
![](https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202008/173619-15/sc5.png)