728x90
반응형

머신러닝 5

머신 러닝 ch5) Multiple Linear Regression

Multiple Linear Regression- p predictors in a model :βj : association between Xj and Y ( Xj의 한 단위가 증가함에 따라 Y가 받는 평균 영향)  1. learning : 계수 추정 - 목표 : 계수 β^1,β^2,...,β^p 추정 - 방법 : 최소제곱법 (Least Squares) 사​용  2. prediction-> 이 모델을 사용해 새로운(test) 데이터에 대해 예측 수행  -----------------------------------------------------------------------------------------------------------------------------------------------..

머신러닝 2025.03.26

머신 러닝 ch4) Simple Linear Regression

simple Linear Regression기본 형태 : - From training data, learn model coefficients : β0^,  β1^ - predict y on the bases of x :    Residual sum of squares (RSS) - 예측값과 실제값 사이의 차이를 제곱해서 모두 더한 값 - RSS가 작을수록 모델이 데이터를 더 잘 설명하고 있다는 뜻- RSS가 크면 예측이 실제 데이터와 많이 다르다는 뜻- RSS는 선형회귀에서 최적의 선형모델을 찾기 위한 기준으로 자주 사용 How accurate is our model? 예시) Standard error (SE) - 표준 오차- 추정값이 반복 샘플링(repeated sampling) 상황에서 얼마나 변할 ..

머신러닝 2025.03.26

머신 러닝 ch3) 모델 정확도 평가 (Assessing Model Accuracy)

Assessing Model Accuracy- 기계학습 알고리즘은 매우 많음 -> 하지만 모든 데이터에 가장 잘 맞는 단일한 방법은 없음- 핵심 질문 : 어떤 학습 방법이 더 좋은 결과를 낼까?                  -> 즉, 다양한 방법을 어떻게 비교할 수 있을까?how to compare different learning methods? Measuring quality of fit (정확도 측정)For regression problem, => 예측값 y^와 실제값 y 사이의 제곱 오차의 평균=> MSE가 작을수록 더 좋은 모델 Training MSE vs Test MSE- training MSE : easy to minimize- but, training MSE != test MSE- tes..

머신러닝 2025.03.25

머신 러닝 ch2) 통계적 학습이란(Statistical Learning) ?

통계적 학습의 예시 : 광고 데이터 (Advertising data)- 목표 : want to improve sales of your shoes (control advertising budgets : SNS, streaming, and filter) How ?1) learn the relationship between advertising and sales2) use it to predict sales 핵심 용어 (Key terms)1. want to improve sales(Y) of a product -> Y : output variable, dependent variable 2. control advertising budgets : SNS(X1), streaming(X2), filter(X3)-> ..

머신러닝 2025.03.25

머신 러닝 ch1) 통계적 학습 개요

통계적 학습이란 (Statistical learning) ? - 데이터를 이해하고 분석하기 위한 도구들  학습의 종료1. 지도 학습 (supervised) - 주어진 데이터 (X, Y)를 바탕으로 Y를 예측하거나 추정하는 모델을 구축하는 것이 목표 - 즉, 입력 X로부터 출력 Y를 예측 2. 비지도 학습 (unsupervised) - 입력 X만 주어지고, 데이터의 내부 구조를 파악하는 것이 목표  지도 학습의 예시 : 임금 데이터 분석 - 데이터 : 3000명의 근로자에 대한 데이터로, 12개의 변수(나이, 성별, 결혼 여부, 인종 등)가 포함- 목표 변수 Y : 임금(Wage)- 입력 변수 : 나이, 성별, 교육 수준 등 질문 : 1. 노동자의 나이를 알면 임금을 얼마나 정확히 예측할까 ?2. 학력 수..

머신러닝 2025.03.25
728x90
반응형