Implicit feedback사용자가 특정 행동을 취하지 않았더라도(예: 클릭, 구매) 해당 아이템에 대한 선호도를 추정하는 방법입니다.예를 들어, 사용자가 영화를 시청한 경우에는 그 영화를 좋아하는 것으로 간주할 수 있습니다.실제 비즈니스에서는 이러한 암묵적 피드백을 주로 사용하게 됩니다. (명시적 피드백은 데이터 구하기가 어렵고, 있다고 해도 편항이 있을수 있음)단 명시적인 피드백(별점, 리뷰 등)을 잘 이용하면 추천 퀄리티가 높아질수 있습니다.Implicit feedback을 고려한 알고리즘이나 라이브러리가 별도 있습니다. 데이터 특성이나 인프라, 환경, 서비스형태 등에 따라 잘 선택해야합니다.https://orill.tistory.com/entry/Explicit-vs-Implicit-Feedb..
코드 및 쿼리문/강의 - 메타코드M
최종 추천모델 클래스 구성Matrix Factorization(SVD), Machine Learning(GBR), Content+Poupularity 추천을 생성하는 코드SVD Recommenderimport pandas as pdfrom surprise import Dataset, Readerfrom surprise import SVDfrom sklearn.ensemble import GradientBoostingRegressorclass SVDRecommender: def __init__(self, df_mf): self.df_mf = df_mf self.svd_model = self.fit_svd_model() def fit_svd_model(self): ..
Content-Based Filtering & PopularityContent-Based Filtering 은 이전 성능을 비교했던 추천 알고리즘과 다소 목적이 다릅니다.새로운 유저, 아이템에 대해 추천할 내용이 없는 경우 Cold Start 문제라고 하며 이는 추천시스템에서 반드시 다루어야할 과제입니다.Cold Start 문제를 사용자/아이템 프로파일링, 군집화를 이용해 해결할 수 있으나, 이를 위해 정교한 추가 데이터 분석이 필요합니다.이번 강의에서는 Content-Based Filtering과 Popularity-based 추천을 통해 해결하는 과정을 진행합니다.Content-based filtering유저 과거에 혹은 최근에 선호했던 아이템의 특성을 기반으로 비슷한 특성의 새로운 아이템을 추천하는..
추천알고리즘 성능 고도화일반적으로 베이스라인 모델을 빠르게 구축하고 성능 테스트를 진행/확인한 이후 이를 베이스로하여 성능 고도화를 위한 노력을 진행합니다.데이터를 늘리거나 줄이거나 새로운 데이터를 수집해서 실험해보거나 전처리/후처리 조건 등을 변경하는 작업이 필수입니다.위 내용은 실무에서 가능하고 도메인 지식과 밀접히 연결되어 있어 이번 강의에서는 스킵하고 추천 알고리즘을 변경해보는 방향을 위주로 성능 고도화를 진행합니다.3강의 베이스라인 모델의 성능을 개선할 방향성은 크게 아래 2가지입니다.(1) DeepLearning 계열 - DNN, NCF via TensorFlow(2) Regression 계열 Model (Linear Regression, Ridge, Random Forest, Gradien..
베이스라인 추천모델 구축(이론)Collaborative FilteringKNN Basic 알고리즘은 유사한 사용자들의 평가를 바탕으로, 각 사용자와의 유사도를 고려하여 가중 평균을 계산함으로써 새로운 평점을 예측합니다.즉 유사한 이웃을 찾아서 해당 이웃이 기존에 부여한 평점의 평균을 구하는데, 유사도를 가중치를 이용하여 평균을 구합니다.예를 들어, "A"라는 사용자에게 "Life of Pi" 책의 예상 평점을 추천하려고 할때 "A"와 가장 유사한 3명의 이웃(k=3)을 찾았다고 가정합시다.B (유사도: 0.8) -> 해당 책의 평점이 4.5C (유사도: 0.6) -> 해당 책의 평점이 5.0D (유사도: 0.5) -> 해당 책의 평점이 3.5 그렇다면 A가 "Life of Pi"에 줄 예측 평점을 구하는..
추천시스템 목적유튜브, 아마존, 넷플릭스 등 수많은 서비스들에서 개인화된 추천시스템을 개발하고 운영합니다.각 고객의 니즈와 선호에 맞는 컨텐츠나 상품이 추천되었을 때 비즈니스 효과(전환율, 재방문율 등)가 통계적으로 더 높음이 이미 증명되었기 때문입니다.개인화 추천시스템의 비즈니스 효과가 비개인화 대비해서 더 좋은 이유는 무엇일까요?고객이 직접 검색을 통해 원하는 항목을 찾는데 들어가는 시간과 노력을 줄여주기 때문이며 (목적성 구매, 소비의 경우)고객으로 하여금 특별한 위치와 관계임을 은연중에 전달하기 때문 (기업이 고객과 관계를 중시하는 느낌 전달)기업은 고객의 데이터를 분석/모델링하여 비즈니스 성과를 극대화하기 위해 아래 요인을 균형있게 고려한 추천시스템을 개발하고자 노력합니다.고객의 선호와 니즈에 ..