인프런 커뮤니티 질문&답변

gilhyuns님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

캐글(kaggle) 필사 전략

작업형 3 summary

해결된 질문

24.06.19 07:53 작성

·

80

·

수정됨

0

Screenshot_20240619_075423_SamsungInternet.jpg안녕하세요 작업형3의 서머리에서의 결정계수라던지 용어에 대해서 정리된 파일이나 참고할 자료라 있을까요??영어랑 한글이 자꾸 헷갈려서 질문드립니다.

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 19. 22:01

물론, OLS 회귀 분석 결과를 각 항목별로 설명하겠습니다.

### Dep. Variable (종속 변수)
- **ERP**: 종속 변수로, 모델이 예측하려고 하는 대상 변수입니다.

### R-squared (결정계수)
- **R-squared**: 모델이 종속 변수의 변동을 얼마나 설명하는지를 나타내는 지표입니다. 0에서 1 사이의 값을 가지며, 1에 가까울수록 설명력이 높습니다.

### Adj. R-squared (조정된 결정계수)
- **Adj. R-squared**: R-squared 값을 변수의 수를 고려하여 조정한 값입니다. 모델의 복잡도를 고려한 설명력을 나타냅니다.

### Model (모델)
- **OLS (Ordinary Least Squares)**: 최소제곱법을 사용하여 회귀선을 추정하는 방법입니다.

### Method (방법)
- **Least Squares (최소제곱법)**: 오차 제곱의 합을 최소화하는 방법으로 회귀선을 추정합니다.

### F-statistic (F-통계량)
- **F-statistic**: 모델 전체의 유의성을 검정하는 통계량입니다.

### Prob (F-statistic) (F-통계량의 유의확률)
- **Prob (F-statistic)**: F-통계량에 대한 유의확률로, 모델이 유의한지를 판단하는 데 사용됩니다.

### Date (날짜) 및 Time (시간)
- **Date** 및 **Time**: 분석이 수행된 날짜와 시간입니다.

### Log-Likelihood (로그 우도)
- **Log-Likelihood**: 주어진 모델에서 데이터가 관측될 가능성을 나타내는 값입니다.

### No. Observations (관측치 수)
- **No. Observations**: 분석에 사용된 총 관측치의 수입니다.

### AIC (Akaike Information Criterion, 아카이케 정보 기준)
- **AIC**: 모델의 적합도와 복잡도를 고려하여 모델을 평가하는 지표입니다. 낮을수록 좋은 모델입니다.

### BIC (Bayesian Information Criterion, 베이지안 정보 기준)
- **BIC**: AIC와 비슷하지만, 모델의 복잡도에 더 큰 패널티를 부여하는 지표입니다. 낮을수록 좋은 모델입니다.

### Df Residuals (잔차 자유도)
- **Df Residuals**: 잔차의 자유도로, 관측치 수에서 추정된 파라미터 수를 뺀 값입니다.

### Df Model (모델 자유도)
- **Df Model**: 모델에 포함된 독립 변수의 수입니다.

### Covariance Type (공분산 유형)
- **Covariance Type**: 회귀 분석에서 사용된 공분산 추정 방법을 나타냅니다.

### Coefficients (회귀 계수)
- **coef (계수)**: 각 독립 변수의 회귀 계수로, 해당 변수의 1단위 변화가 종속 변수에 미치는 영향을 나타냅니다.

### Std err (표준 오차)
- **Std err**: 회귀 계수의 표준 오차로, 계수 추정의 불확실성을 나타냅니다.

### t (t-통계량)
- **t**: 회귀 계수가 0인지에 대한 가설 검정을 위한 통계량입니다.

### P>|t| (유의확률)
- **P>|t|**: t-통계량에 대한 유의확률로, 회귀 계수가 0인지의 유의성을 판단합니다.

### [0.025, 0.975] (신뢰구간)
- **[0.025, 0.975]**: 회귀 계수의 95% 신뢰구간으로, 해당 범위 내에서 계수가 존재할 확률이 95%입니다.

### Omnibus (옴니버스 검정)
- **Omnibus**: 잔차의 정규성을 검정하는 통계량입니다.

### Prob(Omnibus) (옴니버스 검정의 유의확률)
- **Prob(Omnibus)**: Omnibus 통계량에 대한 유의확률입니다.

### Jarque-Bera (JB) (자크-베라 검정)
- **Jarque-Bera (JB)**: 잔차의 정규성을 검정하는 또 다른 통계량입니다.

### Prob(JB) (자크-베라 검정의 유의확률)
- **Prob(JB)**: Jarque-Bera 통계량에 대한 유의확률입니다.

### Skew (왜도)
- **Skew (왜도)**: 잔차의 비대칭도를 나타내는 지표입니다.

### Kurtosis (첨도)
- **Kurtosis (첨도)**: 잔차의 뾰족한 정도를 나타내는 지표입니다.

### Durbin-Watson (더빈-왓슨 통계량)
- **Durbin-Watson**: 잔차의 자기상관을 검정하는 통계량입니다.

### Cond. No (조건수)
- **Cond. No**: 독립 변수들 간의 다중공선성을 나타내는 지표입니다.
gilhyuns님의 프로필 이미지

작성한 질문수

질문하기