본문 바로가기
Computer Science/데이터마이닝

[Model-basedCollaborative Filtering 2] 2

by 큌 2024. 6. 18.
반응형

암시적 피드백 통합

암시적 피드백을 도출하는 방법?

• 명시적 피드백의 경우 암시적 피드백을 도출할 수 있습니다.

• 암시적 피드백은 실제 등급 값에 관계없이 등급 항목의 ID에 의해 캡처됩니다.

• 두 개의 서로 다른 항목 요인 행렬을 사용하면 어떻게 됩니까?

• 명시적이고 암묵적인 항목 요소가 있습니다.

• 사용자 요인은 암시적 항목 요인의 선형 조합으로 도출됩니다.

암시적 피드백 매트릭스 구축

• 암시적 피드백 행렬은 이진 행렬에 의해 정의됩니다.

• 등급이 관찰되면 1이고, 그렇지 않으면 0입니다.

• 그런 다음 각 행의 L2-norm이 1이 되도록 정규화합니다.

• 행렬 F의 각 0이 아닌 항목은 1/ | ℐ-|이며, 여기서 ℐ-은 사용자 u에 의해 평가된 항목의 집합입니다.

명시적 피드백 표현

• U는 암시적 행렬 F와 암시적 잠재 항목 행렬 Y의 조합으로 계산된다고 가정합니다.

• Y의 변수는 각 요인 항목이 암묵적 피드백에 기여하는 성향을 인코딩합니다.

비대칭 요인 모형

• �/1을 계산하는 방법은 무엇입니까?

• 목적함수

• Y와 V 두 개의 매개변수가 있습니다.

• 경사 하강법으로 훈련됩니다.

장점: 비대칭 요인 모형

• 기존 잠재 요인 모델보다 더 나은 결과를 제공하는 경우가 많습니다.

• 두 사용자는 등급 값에 관계없이 유사한 항목에 대해 등급을 매겼다면 유사한 사용자 요인을 갖게 됩니다.

• 항목 요소의 선형 조합으로 도출하여 사용자 요소의 중복성을 줄일 수 있습니다.

• 설명 가능성도 지원합니다.

• 인수분해 �� ��를 � ���로 다시 씁니다.

• 항목 간 예측 행렬은 ���

�� 항목 �의 등급을 매기는 행위가 항목 �의 예측 등급에 얼마나 기여하는지 알려줍니다.

• 이러한 유형의 설명 가능성은 항목 중심 모델에 내재되어 있습니다.

단점: 비대칭 요인 모형

• 등급 항목의 ID에서 사용자 요소를 도출하는 것은 암묵적 피드백을 사용하는 극단적인 경우일 수 있습니다.

• 동일한 항목의 등급을 매겼지만 등급이 매우 다른 두 사용자를 구별하지 않습니다.

• 해결책: 암시적 사용자 요인 행렬 ��는 명시적 사용자 요인 행렬 �를 조정하는 데만 사용됩니다.

• 즉, ��과 곱하기 전에 �에 ��을 첨가합니다.

SVD++

• 비제약 행렬 인수분해 모형과 비대칭 인수분해 모형을 결합한 것으로 볼 수 있습니다.

• SVD++라는 용어는 기저 벡터가 직교하지 않기 때문에 약간 오해의 소지가 있습니다. 잠재 요인 모형을 느슨하게 암시합니다.

• �를 계산하는 방법은 무엇입니까?"

• 참고: � 및 �의 사용자 및 항목 편향이 포함되어 있습니다.

• 첫 번째 항은 ���에 의해 계산됩니다.

• 두 번째 항은 �� ��에 의해 계산됩니다.

SVD++에 대한 목적 함수

• SVD++에는 편향이 있는 세 개의 파라미터 U, V, Y가 있습니다.

• U의 (k + 2)번째 열은 1개만 포함합니다.

• V의 (k + 1)번째 열은 1개만 포함합니다.

• Y의 마지막 두 열에는 0만 포함됩니다.

SGD를 통한 교육

• 부분 도함수를 사용하여 업데이트 규칙을 도출합니다.

• SGD로 편향이 있는 U, V, Y를 업데이트합니다.

SGD를 통한 교육

• 벡터화된 형태로 다시 작성할 수 있습니다.

• 이러한 업데이트는 U, V 및 Y 행에 적용될 수 있습니다.

반응형