HANA : Have A Nice AI

모두를 위한, 하나를 위한 AI

실용적인 AI/Active Learning

실용적인 Deep Learning 적용을 위한 시작

KM-Hana 2021. 1. 22. 01:28

레이블링 지옥에 빠진 개발자

'Deep Learning을 실산업에 적용할 때 가장 큰 문제가 무엇일까?'

라는 질문에 주저없이 답변 드릴 수 있다.

 

첫번째도, 데이터와 레이블링

두번째도, 데이터와 레이블링

세번째도, 데이터와 레이블링

 

였다.

 

데이터를 수집하는 것도 수 많은 비용이 발생되고,

그 데이터를 레이블링하는데 수 많은 장애물이 발생된다.

   1) 누가 레이블링 할 것인가?

   2) 비용은 누가 지불할 것인가?

   3) 얼마나 레이블링을 해야되는건가?

 

이러한 고객과 딥러닝 개발자, 사업부서간의 줄다리기 끝에서,

 

고객은 AI에 대해서 크게 실망하며,

'AI를 하겠다'는 생각이 잘 못되었음을 깨닫게 된다.

 

 

딥러닝 개발자, AI 개발자로서의 적은 데이터로 적은 레이블링을 통해, 모델을 개발해야함을 절감했으며

이를 해결하기위한 방법론들을 작성해보고자 한다.

 

'하늘이 무너져도,

데이터가 없어도,

레이블이 제대로 없어도...

솟아날 구멍' 하나쯤은 있겠지

 

 

적은 데이터로 높은 성능을 보일 수 있는 방법론 

1. Self-supervised Learning

2. Semi-supervised Learning

3. Transfer Learning

4. Active Learning

 

 

Active Learning 이란 - 기본

dsgissin.github.io/DiscriminativeActiveLearning/about/ About An introduction to the active learning framework, from classical algorithms to state of the art methods for neural networks. A new method..

kmhana.tistory.com

이 중, Tranfer Learning과 Active Learning을 중심으로 다뤄보고자 한다.