본문 바로가기
반응형

Computer Science92

[Dimensionality Reduction] 3 특이치 분해(SVD)• 행렬 R은 세 개의 행렬로 분해될 수 있습니다: • U, S, V: 고유• U, V: 열 또는 정규 분포 • UTU = I, VTV = I (I : 아이덴티티 매트릭스) • 열은 직교 단위 벡터입니다.• S: 대각선• 항목(단수 값)은 양수이며, 감소하는 순서로 정렬됩니다 ( ≥ ≥ ⋯ ≥ 0).입력 데이터 행렬: m x n 행렬 왼쪽 단수 행렬: m x m 행렬 대각행렬 : m x n 행렬, 여기서 대각 원소는 특이값(개념의 강도) 오른쪽 단수 행렬: n x n 행렬SVD의 특성• 항상 행렬 A를 A = USV로 분해할 수 있습니다 • �, �, �: 유니크• U, V: 열 또는 정규 분포 • ��� = �, ��� = �(I: ID 행렬) • 열은 직교 단위 벡터입니다.• � .. 2024. 6. 17.
[Dimensionality Reduction] 2 주성분분석(PCA)• 데이터를 새 좌표계로 전송하는 직교 선형 변환 • 분산을 최대화하는 새 좌표 찾기• 데이터를 새 좌표계로 전송하는 직교 선형 변환 • 데이터 투영에 의한 가장 큰 분산은 첫 번째 좌표(첫 번째 주성분)에 있습니다.• 두 번째로 큰 분산은 두 번째 좌표(두 번째 주성분)에 있습니다.PCA를 계산하는 방법• 1단계: 데이터를 가져옵니다.• 2단계: 평균을 줄입니다.3단계: 공분산 행렬을 계산합니다.• 행렬 X가 주어졌을 때 공분산 행렬을 계산하는 방법은?• 4단계: 공분산 행렬의 고유 벡터와 고유값을 계산합니다.• 5단계: 구성요소 선택 및 특징 벡터 구성 • 새 피쳐 벡터 구성• 근사화를 위해 1차원 공간에 대한 특징 벡터를 줄일 수 있습니다.• 5단계: 새로운 데이터 세트 도출• 최.. 2024. 6. 17.
[Dimensionality Reduction] 1 차원 축소란 무엇입니까?• 차원의 저주• 차원이 증가함에 따라 데이터 희소성도 증가합니다.• 정보 손실을 최소화하여 차원 수를 줄일 수 있는 방법은 무엇입니까?• 가정• 고차원 공간의 데이터는 저차원 부분 공간 위에 있거나 근처에 있을 수 있습니다.• 확률 밀도는 지지하는 저차원 공간에서 멀어짐에 따라 매우 빠르게 감소합니다.차원 축소란 무엇인가?차원 축소는 고차원 데이터 세트에서 의미 있는 정보를 유지하면서 데이터의 차원을 줄이는 과정입니다. 차원 축소는 데이터를 더 쉽게 시각화하고, 계산 복잡도를 줄이며, 모델의 과적합(overfitting)을 방지하는 데 유용합니다.차원의 저주"차원의 저주(Curse of Dimensionality)"는 고차원 공간에서 데이터 분석 및 모델링이 어려워지는 현상을 말.. 2024. 6. 17.
[Clustering] 2 K-Medoids 클러스터링K-Medoids 클러스터링은 데이터를 여러 개의 군집으로 나누는 비지도 학습 알고리즘 중 하나입니다. K-Means와 유사하지만, 군집의 중심(centroid) 대신 실제 데이터 포인트(메도이드, medoid)를 사용한다는 점에서 차이가 있습니다. K-Medoids는 특히 이상치(outlier)에 덜 민감하여 보다 안정적인 군집화를 제공하는 특징이 있습니다.  1. 임의로 k개의 개체를 초기 메도이드로 선택설명: 처음에 k개의 메도이드(중심 포인트)를 선택해야 합니다. 이는 K-Medoids 알고리즘에서 군집의 중심 역할을 하는 포인트입니다.방법: 데이터셋에서 임의로 k개의 데이터를 선택합니다. 이 데이터들은 초기 메도이드가 됩니다.주의사항: 메도이드는 실제 데이터 포인트여야.. 2024. 6. 17.
반응형