XAI

딥러닝 엔지니어라면 SSL과 XAI를
내 프로젝트에 적용할 줄 알아야 합니다.

#컴퓨터비전 #SSL #XAI


시간이 지날 수록 인공지능(AI) 기술은 더욱 정교해지고 있습니다. AI 분야에서 좀 더 세부적으로 들어가보자면,
최근 컴퓨터비전 분야에서는 SSL(Self-Supervised Learning)과 XAI(Explainable AI)의 중요성이 강조되고 있는데요,

기업과 대학, 심지어 국가 단위로 투자할 정도로 주목받고 있는 AI 분야에서 이제 SSL과 XAI를 빼놓고 논하기는 어렵다고 볼 수 있습니다.

그래서 오늘은 SSL과 XAI가 무엇인지와 그 중요성에 대해 연구중이신 강사님과 이야기를 나눠보았습니다.


Q. 안녕하세요. 강사님께서는 인공지능분야 연구 중이신 것으로 알고 있는데요,
최근 컴퓨터비전 분야에서 SSL과 XAI가 왜 중요한지, 어떻게 활용되고 있는지 설명 부탁드립니다.

실제 연구 및 개발을 하고 있는 사례들을 설명드리면 더 와닿으실 것 같습니다.
Tesla는 가장 큰 주력 사업으로 SSL(Self-Supervised Learning)를 두고 있고,
Meta의 AI팀은 SEER(SElf-supERvised) 이라는 Self-Supervised Learning 모델을 개발하여 이를 배포하고 있습니다.

또한, 최근 Google research 팀은 SSL 방법론 중 하나인 
SimCLR 논문을 ICML 2020에서 발표하였고,
 이를 활용한 MICLe(Multi-Instance Contrastive Learning) 모델을 개발하였습니다.

이렇듯 이미 테슬라, 구글, 메타 등 하이테크 기업들은 앞다퉈 SSL과 XAI를 연구하고 있으니, 이것으로 그 중요성은 충분히 체감이 되실 것이라 생각합니다.


Q. 강사님께서 진행하시는 이번 강의에서도 컴퓨터 비전 분야의 다양한 논문 주제 중 SSL과 XAI를 강의의 중점 주제로 잡으셨는데요, 딥러닝 분야에서 유명한 얀르쿤 또한 SSL 및 XAI의 중요성을 발표했다고 들었습니다.

네 맞습니다. AI 사대천왕이자, CNN의 창시자인 얀 르쿤도 많은 학회 및 프레젠테이션을 통해 SSL과 XAI의 중요성을 다음과 같이 발표했습니다.

기존 AI·ML의 모델의 문제는 학습에 사용되는 라벨링의 샘플이 적어
감독·강화 학습은
많은 샘플과 실험을 요구하나, 
자기지도학습(SSL)은 러닝 의존성을 줄이고
기계들은 SSL을 통해 
상식을 습득해 나갈 것이다
- 얀르쿤

이번 강의에서 여러분이 이러한 최신 분야 내용을 적립하고 간다면, 큰 메리트가 될 것이라 생각합니다.

Q. 구체적으로 SSL과 XAI는 무엇이며 각각 어떤 방식으로 모델 성능 향상에 기여하는지 간단하게 말씀해주실 수 있을까요?

SSL'Self-Supervised Laerning'의 약자로, '사람의 개입없이 딥러닝 모델을 훈련" 하기 위한 방법론이라고 생각하시면 됩니다. 이를 통해 데이터의 정보를 최대로 사용하는 것이 가능합니다.

SSL은 Labeling에 대한 비용없이, 딥러닝 모델을 학습시킬 수 있으며, Task와 상관 없이 모델의 성능을 
향상시킬 수 있는 중요한 기술입니다.

XAI'Explainable AI'의 약자로, 딥러닝 모델의 결과에 대한 근거를 분석할 수 있게 하는 방법입니다. 쉽게 말하자면 설명가능한 인공지능으로 분석이 힘든 딥러닝 모델도 분석할 수 있게 해주는 기술입니다.

딥러닝은 성능이 매우 뛰어나지만, 그 계산과정이 매우 복잡해 모델이 어떤 방식으로 출력을 계산하는 지에 대한 설명이 부족합니다. 그래서 모델의 신뢰도가 매우 필요한 도메인(의료, 자율주행차 등)에서는 성능 뿐만
 아니라 모델에 대한 분석을 XAI 기술 활용이 필요한 것입니다.

출처: Visual Explanations From Deep Networks via Gradient-Based Localization (2017, ICCV)

Q. 이번 강의에서는 XAI 모델 중 CAM(Class Activation Map)을 배우고 실험하는 과정이 포함되어 있는 것으로 알고 있는데요, CAM(Class Activation Map)에 대해서도 간단하게 설명 부탁드립니다.

CAM은 Class Activation Mapping이라는 방법론으로, CNN 모델이 classification을 할 때, 그 결정에 대한 reasoning을 할 수 있는 방법론입니다.
진짜 고양이를 보고 고양이라고 판단을 했는지를 파악하는 것 등을 예시로 들 수 있습니다.

출처: Learning Deep Features for Discriminative Localization (2016, CVPR)


Q. 바로 이러한 SSL과 XAI에 관련해서 연구 중이시고, 이미 강사님께서 ‘삼성 혁신 AI과제 Self-Supervised Learning 모델 개발’과 ‘정부 NRF 중견 과제 Self-Supervised Learning 모델 개발’ 등 컴퓨터비전 관련 분야 프로젝트를 진행하신 경험이 있으신 것으로 알고 있습니다. 이러한 프로젝트 및 연구 과정에서 얻으신 인사이트나 러닝포인트를 공유해주실 수 있을까요?

논문을 읽을 때, 단순히 method를 익히는 것에서 끝나는 것이 아니라, 해당 저자들이 어떤 동기를 가지고 논문을 만들었는 지 생각하며 읽게된다면, 해당 방법론을 더 깊이 알 수 있습니다. 이런 자세가 더 좋은 방법론에 대한 아이디어를 떠오를 수 있게 하는 좋은 방법 중 하나인 것 같습니다.

논문을 읽을 때, 단순히 method를 익히는 것에서 끝나는 것이 아니라, 해당 저자들이 어떤 동기를 가지고 논문을 만들었는 지 생각하며 읽게된다면, 해당 방법론을 더 깊이 알 수 있습니다. 이런 자세가 더 좋은 방법론에 대한 아이디어를 떠오를 수 있게 하는 좋은 방법 중 하나인 것 같습니다.

논문의 방법론을 본인의 연구에 적용하려고 할 때, 단순히 코드를 돌리는 것이 중요한 것이 아니라, 그 코드 한줄 한줄의 의미가 더 중요합니다.

예를 들면, 논문의 전체부분은 필요가 없고,(혹은 쓸 수 없고), 일부분을 사용하고자 한다면, 어떤 부분까지 자를 지, 어떻게 자를지 에 대한 능력이 있어야합니다. 이를 위해서 논문의 코드의 의미를 파악하는 것이 중요합니다.

이번 강의에서는 SSL과 XAI 관련한 최신 논문과 가장 많이 사용되는 기술들을 중심으로 총 10개의 논문을 선정하여 여러분이 논문을 직접 구현해볼 수 있도록 구성하였으니 SSL과 XAI 논문 구현 역량을 확실하게 적립하고 가셨으면 좋겠습니다.

Q. CAM에서 더 나아가 Weakly Supervised Learning에 대해서도 강의를 진행하시는 걸로 알고 있습니다. Weakly Supervised Learning에 대해 배우면 모델 학습에 어떤 것들을 적용할 수 있을까요?

Segmentation label이 없는 상황에서, Image level label이 있을 때, 단순히 classification model만 학습이 가능 한 것이 아니라, segmentation model을 학습하여 이용할 수 있습니다.

출처: Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentaion (2020, CVPR)


Q. 이 강의를 통해 경력별 AI 현업자들께서(주니어/시니어 엔지니어, 관리자 엔지니어 및 C-Level 현직자) 어떤 인사이트를 얻어갈 수 있을지 설명해주실 수 있을까요?

논문의 단순 방법론에 대한 지식이 아닌, 연구 동기와 코드 한줄한줄의 의미를 얻어 갈 수 있습니다. 이 의미를 알아야 AI 분야의 모든 실무 및 연구 과정에 적용할 수 있기 때문에 현업자분들께 도움이 될 것이라 생각합니다.

Q. 마지막으로 딥러닝 엔지니어로서 실무 역량을 쌓고자 하는 분들에게 해주실만한 조언이 있으실까요?

딥러닝이라는 분야는 매우 빠른 분야이기 때문에, 최신 경향을 항상 따라갈 수 있어야 하지만 단순히 방법론에 대한 지식을 쌓는 것이 아닌, 그 논문의 의미를 파악하며 따라가는 것이 본인의 역량에 매우 큰 도움이 될 것이라고 생각합니다.


지금 패캐머들이 읽고있는 BEST 아티클이 궁금하다면

이 글과 연관된 주제의 추천 강의