본문 바로가기
반응형

Computer Science/데이터마이닝33

[Evaluating ClassificationModels] 1 선형 기저 함수 모형회귀 분석을 위한 가장 간단한 선형 모형 매개변수의 선형 함수: w0, w1, …, wd • 또한 입력 변수의 선형 함수입니다.• 는 기저 함수로 알려져 있습니다.선형 기저 함수 모형• 다양한 기저함수모델다항식 곡선 피팅해당 레이블이 있는 1차원 관찰로 구성된 훈련 데이터를 고려합니다 다항 함수는 x의 비선형 함수이지만 계수 w의 선형 함수입니다.어떤 M을 선택해야 할까요? 모델 선택 M을 감안할 때, 무엇을 선택해야 합니까?파라미터 선택Ground truth(녹색): sinx다항식 곡선 피팅• 선형 최소 제곱과 유사하게 제곱합 오차 함수를 최소화합니다.데이터에 맞는 몇 가지 적합성• M = 9일 때 교육 데이터를 완벽하게 맞췄습니다과적합M = 9의 경우 훈련 오차가 0입니다.다항식에.. 2024. 6. 17.
[Decision Tree and Naive Bayes] 2 과적합을 피하기 위한 두 가지 방법 • 프리프루닝• 양호도 측정값이 임계값 아래로 떨어질 경우 노드를 분할하지 마십시오.• 적절한 임계값을 선택하기 어렵습니다.• 후가지치기• "다 자란" 나무에서 가지를 제거합니다.• 교육 데이터와 다른 데이터 세트를 사용하여 "최상의 가지치기 트리"를 결정합니다.네이비 ï 베이즈 분류기베이지안 분류• 통계분류기• 확률적 예측을 수행합니다. 즉, 클래스 멤버 자격 확률을 예측합니다.• 기초: 베이즈 정리에 기초함 • 정확도• 간단한 베이지안 분류기인 ï베 베이즈 분류기는 의사결정 트리와 비슷한 성능을 갖습니다.베이지안 정리 기초• 훈련 데이터 X가 주어지면 가설 a의 사후 확률 P(H | X)는 베이즈 정리를 따릅니다: • P(X|H)(우도): 가설이 성립한다고 가정할 .. 2024. 6. 17.
[Decision Tree and Naive Bayes] 1 What is Classification?Classification클래스 레이블이 있는 훈련 데이터 training data(숫자 또는 범주형 (numeric or categorical) )로부터 모형을 학습.학습된 모델을 사용하여 새 레코드의 레이블을 예측.테스트 데이터에 대한 정확한 예측을 위한 모델을 구축하는 방법은 무엇입니까?Process for Classification모델은 미리 정의된 클래스가 있는 training set 에서 구축됩니다.각 튜플/샘플은 클래스 레이블 특성에 의해 결정된 것처럼 미리 정의된 클래스에 속하는 것으로 가정.모델 구축에 사용되는 튜플 세트는 training set.모델은 분류 규칙, 의사 결정 트리 또는 수학 공식( classification rules, decis.. 2024. 6. 17.
[Logistic Regression] 2. 보호되어 있는 글 입니다. 2024. 4. 24.
반응형