본문 바로가기
반응형

Computer Science92

[Neighborhood-based Collaborative Filtering] 3 다른 방법과의 토론오프라인 계산을 줄이는 방법?• 이웃 기반 방법의 주요 문제는 오프라인 단계의 복잡성입니다.• 솔루션: 오프라인 가장 가까운 이웃 계산 단계를 오프라인 클러스터링 단계로 대체합니다.• 동일한 클러스터 내에서 가장 가까운 상위 k개의 피어가 예측에 사용됩니다.• 쌍별 유사도 계산이 동일한 클러스터 내에서 수행되기 때문에 계산 비용을 절감합니다.• 등급 매트릭스가 매우 클 때 적은 비용으로 실용적인 대안을 제공합니다.• 효율성과 정확성 사이에는 균형이 있습니다.근접 방법을 위한 클러스터링• 전체 사용자 집합은 여러 사용자 그룹으로 나뉩니다.• 일반적으로 k-means 클러스터링이 사용됩니다.• 과제: 등급 매트릭스가 불완전합니다.차원 축소• 밀도 높은 저차원 표현을 제공합니다.• 행 단위 .. 2024. 6. 18.
[Neighborhood-based Collaborative Filtering] 2 롱테일 아이템 분포• 사용자는 더 인기 있는 항목을 평가하는 경향이 있습니다.⇒ 등급 행렬의 누락된 항목은 랜덤하지 않습니다.• 등급 분포가 누락되었습니다. 무작위가 아닙니다.• 아이템이 인기가 있을 때 선호 아이템으로 선택될 가능성이 높습니다.• 선택 편향이 발생합니다.롱테일 아이템의 영향• 인기 있는 항목은 유사성을 측정하는 데 큰 영향을 미칩니다.• 역사용자주파수• IR에서 사용되는 IDF(Inverse Document Frequency) 개념을 채택합니다.• 희귀한 품목일수록 무게가 더 높습니다.• 피어슨 상관계수(Pearson correlation coefficient, PCC)아이템 기반 CF• 기본 아이디어: 항목 간의 유사성을 사용합니다.• 이는 사용자 항목 등급 매트릭스를 대체하는 것과 .. 2024. 6. 17.
[Neighborhood-based Collaborative Filtering] 1 협업 필터링(CF)이란?• 추천을 위해 군중의 지혜를 사용하세요.• 추천 시스템에 대한 가장 중요한 접근 방식 • 다양한 알고리즘과 그 변형이 존재합니다.• 대규모 상업용 전자 상거래 사이트에서 널리 사용됩니다.• 책, 영화 및 음악과 같은 많은 영역에 적용할 수 있습니다.이웃 기반 CF• 메모리 기반 알고리즘이라고도 합니다.• 이웃 기반 CF는 주로 k-근접 이웃 방법에서 영감을 받았습니다.• 2가지 타입의 동네 기반 CF• 사용자 기반 이웃 방법: 예측은 대상 사용자에 대한 동료 그룹 등급의 가중 평균에 의해 계산됩니다.• 항목 기반 이웃 방법: 예측은 대상 사용자에 대한 유사 항목의 가중 평균 등급으로 계산됩니다.공동 필터링을 위한 핵심 아이디어(CF)• 제 또래 친구들이 좋아하는 것을 말해주세요... 2024. 6. 17.
[Introduction toRecommender Systems] 1 정보 과부하• 데이터의 폭발적인 증가로 2020년에는 약 40조 기가바이트(또는 40제타바이트)가 발생합니다.• 매 1초마다 1.7MB의 데이터가 생성됩니다.• 구글은 매일 35억건 이상의 검색을 받습니다.• 연간 1.2조 건의 검색 및 초당 40,000건 이상의 쿼리 검색관련 항목에 액세스하는 방법?• 사용자가 관련 항목에 액세스할 수 있도록 하려면 어떻게 해야 합니까?• 풀 모드(검색 엔진) • 사용자가 주도권을 잡습니다.• 임시 정보가 필요합니다.• 푸시 모드(권장 시스템) • 시스템이 주도권을 잡습니다.• 시스템에는 사용자의 잠재적인 정보 요구 사항이 있습니다.권장사항의 가치• 넷플릭스: 보는 영화의 2/3이 추천됩니다.• 아마존: 추천 매출 35%.• 구글 뉴스: 추천은 38% 더 많은 클릭수를.. 2024. 6. 17.
반응형