[논문요약] 딥러닝 관련 추천 모델

발전중인 AI/추천(Recommendation)

[논문요약] 딥러닝 관련 추천 모델 - Survey(2019)

KM-Hana 2022. 2. 15. 01:08

*크롬으로 보시는 걸 추천드립니다*

https://arxiv.org/pdf/1707.07435.pdf

딥러닝을 적용한 추천 모델들을 전반적으로 소개하는 논문입니다.

본 논문은 개인적으로 다음과 같은

1. 딥러닝을 적용한 추천 모델들의 맥락을 잡아주는 논문

2. 2019년 이후부터 현재까지 얼마나 딥러닝을 적용한 추천 모델이 발전했는지 보는 재미가 있는 논문

의미가 있었습니다.

향후 연구 및 미해결 과제

1. User 및 Item information에 대한, Joint Representation Learning

- Context Information : 1) 콜드 스타트 영향을 완화 2) 수집하기 용이 3) User의 상황에 따른 서비스와 제품을 맞춤화 가능

- 현재 : User 및 Item Profile을 학습하거나, 함축적인 피드백, Contextual information을 제한적으로 사용

- 방안 : Joint Representation을 통해, Multi-Modal Representation을 End-to-End로 학습

○ 딥러닝을 통해, Textual, Visual, Audio 및 Video Feature를 더 다양하게 사용할 것으로 기대

2. 설명 가능한 딥러닝

- 딥러닝의 단점 : 설명 불가능

- 설명 가능함의 중요성 :

○ 예측 결과를 User에게 제공 : 사용자에게 왜 이 Item을 추천했는지 설명 가능

○ 예측 결과를 실무자에게 제공 : 모델 자체에 대한 이해력을 높임

- 방안 : Attention 메커니즘을 통해, 단점을 완화( + 성능 향상에도 기여 )

3. 더 깊은 딥러닝 모델 적용

- 현재 : 대부분의 연구에서 3~4개의 Layer에서 정체

- 방안 : Residual 전략이나, 계층적 학습률, Auxiliary Loss 활용

4. 추천 시스템을 위한 추론의 확장

- 딥러닝의 발전이 추천 시스템의 발전으로 이어질 것으로 예상

○ 추천에서도 이미지 및 텍스트 정보를 사용 ( ∵ 각 분야에서 이미 딥러닝이 훌륭한 성능을 보임)

○ 추천과 추론은 정보 검색이란 측면에서 동일

- 추론 아키텍처가 앞으로 추천 아키텍처에서도 핵심이 될 것으로 예상

○ Multi-Step Inference를 통해 추천 ( 1 단계 : 사용자의 구매 등을 추론 / 2 단계 : 여러 Item을 추천하기 위해서 추론 )

○ 협업 필터링이나 Lookalike에서도 Inference 방식으로의 확장도 가능

5. Cross-Domain

- 현재 : 하나의 도메인에서 추천 시스템을 개별적으로 사용

○ 단일 도메인에서의 추천 시스템은 다른 도메인에서의 User의 관심사를 사용하지 않음

○ Sparse 및 콜드 스타트 문제가 더 악화됨

- 방안 : 다른 도메인에서 학습된 추천 모델을 Transfer Learning

○ 당양한 도메인 간의 일반화(generalization)와 차이점(difference)을 학습하여, 추천에 활용할 수 있을 것으로 기대

6. Multi-Task

- Multi-Task Learning 이란 : 예를 들어, 하나의 모델로 텍스트 분야에서 구문분석, 기계번역, 감성 분석 등을 모두 수행

- Multi-Task Learning 장점 :

1) Hidden Representation을 공유하여, 일반화 → Overfitting 방지

2) Auxiliary(보조적인) Task를 통해, 최종 Output에 대한 해석력을 높임

3) Data Augmentation을 통해, 희소성 문제를 완화

- 방안 : 이미 딥러닝 모델에서 Multi-Task에 대한 연구가 진행 중이며, 전통적인 추천 시스템에서도 Multi-Task를 연구한 사례 존재

* http://proceedings.mlr.press/v13/ning10a/ning10a.pdf

7. Scalability(확장성)

- 빅데이터 시대에서 데이터 볼륨이 매우 커져, 실제 Application에서 문제를 발생시킴

○ 모델의 유용성과 Time Complexity가 중요해짐

- 고려사항 :

1) 스트리밍 데이터와 같이 매우 큰 User 및 Item 데이터에 대한 학습

2) 고차원 데이터 및 Multi-media 데이터에 대한 계산 효율성

3) Parameter 및 모델 복잡성, 확장성(Scalability)에 대한 균형(Balance)

- 방안 :

1) Small/Compact 한 모델을 위한 Knowldege Distillation ( Teacher 모델이 Student 모델을 가르침)

2) 고차원 데이터 입력을 저차원 임베딩으로 압축 → 메모리 및 Computation Time 축소

8. 평가 방식에 대한 적립

- 현재 : 각 논문들의 평가 및 비교에 대한 기준선이 다름

- 방안 :

1) ImageNet이나 SQuAD와 같은 표준화된 평가 데이터셋이 있어야 함

2) Kaggle와 같은 통제된 평가 시스템 필요 ( ∵ 현재 테스트 셋에 대한 분리 기준 및 통제가 없음 )

3) 테스트 샘플의 난이도 적립 필요 ( ∵ 실제 현장에서의 추천 데이터와의 괴리가 발생할 수 있음 )

Conclusion

- 딥러닝 기반의 추천 시스템을 검토 및 분류

- 딥러닝 기반의 추천 시스템에 대한 장단점을 논의

- 미해결 문제와 앞으로 유망한 분야 대한 설명

- 추천 시스템 분야의 주요 핵심 및 주목할 만한 발전에 대한 포괄적인 이해를 제공

마치며

- 딥러닝 기반의 추천 시스템을 공부하기 위해서 중요한 참고자료가 될 것으로 생각됩니다

- RNN, RBM, 강화 학습 관련 추천 시스템은 본 요약정리에서 생략했습니다.

관심 있으신 분은 해당 논문을 참고하시면 좀 더 도움이 되실 거 같습니다

- Attention 메커니즘은 텍스트 및 이미지 분야에서 화두가 되고 있으며, 추천 분야에서도 예외는 아니였습니다

다음으로 제가 정리하게 될 추천 관련 논문은 Attention 메커니즘이 적용된 추천 시스템이 될 예정입니다.

'발전중인 AI > 추천(Recommendation)' 카테고리의 다른 글

[논문요약] GDCN(Gated Deep Cross Net, 2023) - 추천 AI의 핵심 트렌드 (0)	2025.02.03
[논문요약] DNN for YouTube(2016) - 추천 딥러닝 모델의 바이블 (0)	2022.02.15
추천 시스템 기본 - 협업 필터링(Collaborative Filtering) - ② (0)	2021.08.10
추천 시스템 기본 - 협업 필터링(Collaborative Filtering) - ① (0)	2021.08.08
추천 시스템(Recommendation System) 시작 (0)	2021.08.07

현재글[논문요약] 딥러닝 관련 추천 모델 - Survey(2019)

딥러닝, Tracking, Recommendation, Active, 되는 법, 능동적, task, 직무, Attention, learning, 능동, Metric, 설명, moe, retrieval, Deep, 사이언티스트, 학습, 추천, deep learning,

Today :
Yesterday :

KM-Hana