본문 바로가기
반응형

Computer Science/데이터마이닝33

[Logistic Regression] 보호되어 있는 글 입니다. 2024. 4. 24.
[Machine Learning Basics & Linear Regression] 2. 1.Machine Learning머신러닝 프로세스는 크게 세 단계로 나눌 수 있습니다:데이터 수집 및 특징 추출, 모델 구축, 최적화입니다.이 과정에서 특징 벡터 (x)를 추출하는 방법은 중요한 과제 중 하나입니다.데이터 수집 및 특징 추출: 머신러닝 모델을 훈련하기 위해서는 먼저 관련 데이터를 수집해야 합니다.이후 데이터로부터 유용한 정보를 나타내는 특징(feature)을 추출합니다.예를 들어, 이미지에서는 색상, 모양, 질감 등이 특징으로 추출될 수 있습니다.하지만 특히 이미지와 같은 복잡한 데이터 형태에서 특징을 추출하는 것은 여전히 어려운 과제입니다.모델 구축: 모델을 구축하기 위해 가설 클래스 (H)와 손실 함수 (l)을 선택합니다.가설 클래스는 모델이 가질 수 있는 함수의 집.. 2024. 4. 24.
[Machine Learning Basics & Linear Regression] 1.What is Machine Learning (ML)?머신러닝(ML)은 컴퓨터가 명시적으로 프로그래밍되지 않아도 스스로 학습할 수 있는 능력을 가지게 하는 것입니다.톰 미첼(Tom Mitchell)은 1997년에 "컴퓨터 프로그램이 특정한 작업 클래스 T에 대해 성능 척도 P로 측정될 때, 경험 E를 통해 T에서의 작업 성능이 개선되면 그 프로그램은 학습한다고 말할 수 있다"고 정의했습니다.간단히 말해서, 머신러닝은 데이터로부터 모델을 훈련시켜 성능 척도에 따라 결정을 일반화하는 과정.이를 통해 시스템은 경험을 통해 점점 더 나은 성능.1.Types of Learning입력 벡터 x1, x2, …, xn의 일련의 관찰을 고려할 때, 기계 학습에는 다음과 같은 여러 유형의 학습이 있다... 2024. 4. 24.
[Link Analysis] 2. 1.PageRank: The Google FormulationPageRank는 Google이 웹 페이지의 중요성을 결정하기 위해 사용하는 알고리즘입니다.이 알고리즘은 웹 페이지 간의 링크 구조를 분석하여 각 페이지에 순위를 매깁니다.PageRank 알고리즘을 이해하려면 몇 가지 질문을 고려해야 합니다:이 알고리즘은 수렴하는가?원하는 결과로 수렴하는가?결과는 합리적인가?PageRank 알고리즘의 구현에는 두 가지 주요 문제가 있습니다:일부 페이지는 아웃링크가 없는 페이지.이러한 페이지들은 랜덤 워크가 갈 곳을 잃게 하여 중요도가 "누출"되는 문제를 일으킵니다.스파이더 트랩: 모든 아웃링크가 그룹 내부에 있다.이러한 경우, 랜덤 워크는 트랩에 "갇히게" 되고, 결국 .. 2024. 4. 24.
반응형