AI_ML
[Boostcamp AI Tech] Context-aware Recommendation
썬2
2022. 4. 7. 00:59
1. Context-aware Recommendation (CAR)
- MF를 활용한 CF의 한계: 유저의 데모그래픽이나 아이템 카테고리 및 태그 등 여러 특성들을 추천 시스템에 반영할 수 없다. + cold start에 대처하기 어려울 수 있다.
- 컨텍스트 기반 추천: 유저와 아이템 간 상호작용 정보 뿐만 아니라, 맥락적 정보도 함께 반영.
e.g) 유저가 주어진 아이템을 클릭할 확률 예측
알고리즘: 로지스틱 회귀/SVM -> MF -> FM -> FFM
2. Factorization Machine (FM)
- SVM과 FM의 장점을 결합
- FM의 장점:
1. SVM에 비해 매우 sparse한 데이터에 대해서 높은 예측 성능을 보인다.
2. MF에 비해 여러 예측 문제에 모두 활용 가능한 범용적인 지도 학습 모델이다.
3. Field-aware Factorization Machine (FFM)
- FM의 변형된 모델인 FFM.
- 여러 개의 필드에 대해서 latent factor를 정의.
- 입력 변수를 필드로 나누어, 필드별로 서로 다른 latent factor를 가지도록 factorize함.
e.g) 유저: 성별, 디바이스, 운영체제
4. Gradient Boosting Machine (GBM)
- CTR 예측을 통해 개인화된 추천 시스템을 만들 수 있는 또다른 대표적 모델.
- 하이퍼파라미터에 비교적 민감하지 않은 모델.
- Gradient Boosting: gradient descent을 사용하여 loss function이 줄어드는 방향으로 weak learner들을 반복적으로 결합함으로써 성능을 향상시키는 boosting 알고리즘.
- 잔차를 적합하는 것으로 학습.
- 장점: random forest보다 대체로 좋은 성능.
단점: 느린 학습 속도, 과적합. - e.g) XGBoost, LightGBM, CatBoost 등