본문 바로가기
Computer Science/데이터마이닝

[Model-based Collaborative Filtering] 2

by 큌 2024. 6. 18.
반응형

확률론적 모델

소개: 확률론적 모델

• 확률 이론을 사용하여 사용자 등급을 예측합니다.

• 베이즈 분류 모델을 사용할 수 있습니다.

• 분류 문제의 경우 미리 정의된 여러 범주 중 하나에 항목을 할당하는 작업입니다.

• 대상 사용자가 주어지면 가장 가능성이 높은 등급 값을 계산하는 문제를 해결합니다.

베이지안 분류

• 통계분류기

• 확률적 예측을 수행합니다. 즉, 클래스 멤버 자격 확률을 예측합니다.

• 베이즈 정리에 기반을 두고 있습니다.

• nave ï Bayes 분류기가 일반적으로 사용됩니다.

요약: 베이즈 정리

• D를 샘플 및 관련 클래스의 교육 집합이라고 가정합니다.

• 각 표본은 d차원 벡터 x = (x1, x2, …, xd)로 표시됩니다 • m개의 클래스 c1, c2, …, cm가 있다고 가정합니다.

• 최대 후방 P(ci | x) 찾기 P(x)는 모든 클래스에 대해 일정하므로 분자만 고려합니다.

베이지안 분류의 과제

• 모든 k 클래스에 대한 모든 P(ci | x) 중에서 확률 P(ci | x)가 가장 높은 경우 x가 ci에 속한다고 예측합니다.

• 현실적인 어려움: 많은 확률과 상당히 높은 계산 비용에 대한 초기 지식이 필요합니다.

• 단순화된 가정

• 속성은 조건부로 독립적입니다.

• 이를 통해 계산 비용을 크게 절감할 수 있습니다.

네이비 ï 베이즈 분류기

• 다음과 같이 추정해 보겠습니다.

• 이는 다음과 같습니다:

CF의 확률모형

• Bob의 다른 등급과 함께 항목 5에 대한 등급값 5의 확률을 예측하는 방법은 무엇입니까?

CF의 확률모형

• 항목이 조건부로 독립적이라는 가정하에 nave ï Bayes 분류기를 사용할 수 있습니다.

• 가능성을 계산하는 방법은?

CF의 확률모형

• 또한 다른 등급에 대한 확률을 계산하고 가장 높은 확률로 등급을 결정합니다.

논의

• 바이너리 등급 데이터로 쉽게 확장할 수 있습니다.

• 작거나 희소한 등급 행렬에서는 잘 작동하지 않습니다.

• 확률적 모델은 클러스터링 방법과 함께 사용됩니다.

• 유사한 사용자 또는 항목을 클러스터로 그룹화합니다.

• 사용자가 특정 클러스터를 채울 확률을 예측합니다.

• 일부 도메인에서는 확률 모델이 다른 알고리즘보다 약간 더 우수합니다.

• 인기 영화 영역에서는 사용자 기반 CF보다 못합니다.

기울기 예측 변수 1개

슬로프 원 예측 변수란?

• 가장 간단한 형태의 아이템 기반 CF입니다.

• 단일 모수, 즉 f(x) = x + b를 갖는 회귀의 형태입니다.

• 서로 다른 사용자가 항목을 좋아하는 방법을 쌍으로 비교합니다.

• 두 항목의 등급 간 평균 차이로 계산됩니다.

예제: 기울기 예측 변수 1개

• 한 쌍(Item1, Item3)의 경우 두 가지 등급이 있습니다.

• 두 품목의 평균 차이는 0.5입니다.

• 따라서 Bob의 항목 3에 대한 예측값은 2 + 0.5 = 2.5입니다.

예제: 기울기 예측 변수 1개

• 한 쌍(항목 2, 항목 3)의 경우 공동 등급이 하나 있습니다.

• 두 품목의 차이는 3입니다.

• 따라서 Bob의 항목 3에 대한 예측값은 5 + 3 = 8입니다.

예제: 기울기 예측 변수 1개

• 항목 3에 대한 Bob의 예측은 최종적으로 공동 평가된 항목 수에 대한 가중 평균을 사용하여 계산됩니다.

기울기 예측 변수 1개

• 두 항목의 평균 편차가 계산됩니다.

• Si,j(R)를 두 항목 i와 j에 대한 등급을 모두 포함하는 평가 집합으로 표시합니다.

• devi,j를 이용한 사용자 u 및 항목 j에 대한 예측 기울기 예측 변수 1개

• 단순 조합은 모든 공동 평가 항목에 대한 예측의 평균으로 계산됩니다.

• 이는 공동 평가 횟수를 기반으로 예측에 가중치를 부여하여 확장됩니다.

논의

• 일반 엔지니어로서 구현하기 쉽습니다.

• 즉석 데이터 업데이트를 지원합니다.

• 질의 시간에 효율적입니다.

• 콜드 스타트 사용자에게 유효한 권장 사항을 제공합니다.

• 단순함에도 불구하고 합리적인 추천 품질을 보여줍니다.

반응형