본문 바로가기
반응형

Computer Science/데이터마이닝33

[Evaluation ofRecommender Systems] 2 순위 인식 평가 지표순위 측정 기준: 위치가 중요합니다• 리콜 및 정밀도를 확장하여 순위 목록에서 올바른 항목의 위치를 고려합니다.• 관련 항목은 추천 목록에서 먼저 나타날 때 더 유용합니다.• 예제• 할인된 누적 이득, 평균 정밀도• 스피어맨 상관계수.관련 vs 추천• 특정 사용자-아이템 쌍에 대한 관련 항목은 이 항목이 사용자에게 좋은 권장 사항임을 의미합니다.• 추천 항목은 이 항목이 추천 모델에 의해 사용자에게 제공된다는 것을 의미합니다.• 추천 품목이 관련 품목과 얼마나 잘 연관되어 있는지 정량화하는 데 관심이 있습니다.순위 인식 정확도 메트릭• 정밀도 및 리콜 메트릭을 확장할 수 있습니다.• 추천 목록에서 해당 항목의 순위를 무시합니다.• 대표적인 순위 인식 지표• 평균 역수 순위(MRR)• .. 2024. 6. 18.
[Evaluation ofRecommender Systems] 1 추천자 모델 평가평가에 관한 주요 질문• 추천은 잘 되나요?• 사용자들은 추천 아이템을 좋아합니까?• 매출이 증가합니까?• 서비스에 가장 적합한 알고리즘은 무엇입니까?• 평가를 위한 적절한 설계가 중요하지만 너무 어렵습니다.• 평가는 종종 다면적입니다.• 하나의 기준으로는 설계자의 많은 목표를 달성할 수 없습니다.• 잘못된 설계는 추천 모델의 실제 성능을 과소평가하거나 과대평가할 수 있습니다.온라인 평가• 사용자 연구• 시험 과목을 적극적으로 모집합니다.• 추천 시스템과 상호 작용하여 작업을 수행합니다.• 대규모 사용자를 모집하는 것은 어렵고 비용이 많이 듭니다.• 모집된 사용자는 편향될 수 있습니다. 즉, 실제 사용자의 대표가 아닙니다.• 온라인평가 : A/B테스트• 사용자는 종종 상용 시스템의 실제 .. 2024. 6. 18.
[Model-basedCollaborative Filtering 2] 2 암시적 피드백 통합암시적 피드백을 도출하는 방법?• 명시적 피드백의 경우 암시적 피드백을 도출할 수 있습니다.• 암시적 피드백은 실제 등급 값에 관계없이 등급 항목의 ID에 의해 캡처됩니다.• 두 개의 서로 다른 항목 요인 행렬을 사용하면 어떻게 됩니까?• 명시적이고 암묵적인 항목 요소가 있습니다.• 사용자 요인은 암시적 항목 요인의 선형 조합으로 도출됩니다.암시적 피드백 매트릭스 구축• 암시적 피드백 행렬은 이진 행렬에 의해 정의됩니다.• 등급이 관찰되면 1이고, 그렇지 않으면 0입니다.• 그런 다음 각 행의 L2-norm이 1이 되도록 정규화합니다.• 행렬 F의 각 0이 아닌 항목은 1/ | ℐ-|이며, 여기서 ℐ-은 사용자 u에 의해 평가된 항목의 집합입니다.명시적 피드백 표현• U는 암시적 행렬 .. 2024. 6. 18.
[Model-basedCollaborative Filtering 2] 1 기본 잠재 요인 모형차원 축소• 고차원 공간에서 데이터가 주어지면 데이터를 저차원 부분 공간에 투영합니다.• 부분 공간의 축을 효과적으로 표현하는 방법은 무엇입니까?⇒ 데이터의 중요한 기능을 보존하는 데 필수적입니다.차원 축소가 필요한 이유는 무엇입니까?• 주요 관찰 사항: 등급 행렬에서 행과 열의 상당 부분은 상관 관계가 높습니다.• 등급 매트릭스에는 중복되는 행과 열이 있습니다.• 완전히 지정된 낮은 순위 근사치는 원래 행렬의 항목의 작은 부분 집합으로 결정할 수 있습니다.• 차원 축소는 축을 회전하여 중복 쌍별 상관 관계를 제거하는 데 사용됩니다.• 축은 사용자 및 항목에 대한 잠재 요인을 나타냅니다.기하학적 보기: 잠재 요인 모형• 세 영화의 평점은 상관관계가 높습니다.⇒ 1차원 라인을 따라 배열.. 2024. 6. 18.
반응형