'Deep Learning을 실산업에 적용할 때 가장 큰 문제가 무엇일까?'
라는 질문에 주저없이 답변 드릴 수 있다.
첫번째도, 데이터와 레이블링
두번째도, 데이터와 레이블링
세번째도, 데이터와 레이블링
였다.
데이터를 수집하는 것도 수 많은 비용이 발생되고,
그 데이터를 레이블링하는데 수 많은 장애물이 발생된다.
1) 누가 레이블링 할 것인가?
2) 비용은 누가 지불할 것인가?
3) 얼마나 레이블링을 해야되는건가?
이러한 고객과 딥러닝 개발자, 사업부서간의 줄다리기 끝에서,
고객은 AI에 대해서 크게 실망하며,
'AI를 하겠다'는 생각이 잘 못되었음을 깨닫게 된다.
딥러닝 개발자, AI 개발자로서의 적은 데이터로 적은 레이블링을 통해, 모델을 개발해야함을 절감했으며
이를 해결하기위한 방법론들을 작성해보고자 한다.
'하늘이 무너져도,
데이터가 없어도,
레이블이 제대로 없어도...
솟아날 구멍' 하나쯤은 있겠지
적은 데이터로 높은 성능을 보일 수 있는 방법론
1. Self-supervised Learning
2. Semi-supervised Learning
3. Transfer Learning
4. Active Learning
이 중, Tranfer Learning과 Active Learning을 중심으로 다뤄보고자 한다.
'실용적인 AI > Active Learning' 카테고리의 다른 글
Active Learning을 위한 딥러닝 - Discriminative Active Learning (5) | 2021.02.02 |
---|---|
Active Learning을 위한 딥러닝 - Learning Loss for Active Learning (0) | 2021.02.02 |
Active Learning을 위한 딥러닝 - Core-set (2) | 2021.02.02 |
Active Learning 이란? - 기본전략 (4) | 2021.01.22 |
Active Learning 이란 - 기본 (2) | 2021.01.22 |