인프런 커뮤니티 질문&답변

이선희님의 프로필 이미지
이선희

작성한 질문수

빅데이터분석기사 실기대비 (R 활용)

출제예상 문제 질문이요~

작성

·

119

·

수정됨

0

안녕하세요

 

오늘부터 빅분기 실기 R강의수강을 시작한 학생입니다.

 

강의를 듣던 중 궁금한 점이 있어서요

 

출제예상 문제중에서

아래 표시를 해두었는데요

 

데이터를 불러올때 왜 1부터 150행까지만 불러오는 것일까요?

 

airquality 데이터 전체를 df으로 불러오는건 안되는건가요?

 

 

 

# 2. 첫 행부터 상위 80%개의 행을 추출하고 Ozone변수의 결측값을 Ozone변수의 중앙값으로 대체하고

# 대체전과 후의 표준편차 값의 차이

df <- airquality[c(1:150),] ------------------------------> 이부분이 궁금해요!

str(df)

val <- nrow(df)*0.8

df1 <- df[c(1:val),]

str(df1)

df1$Ozone_comp <- ifelse(is.na(df1$Ozone), median(df1$Ozone, na.rm = T), df1$Ozone)

summary(df1)

sd(df1$Ozone, na.rm = T) - sd(df1$Ozone_comp, na.rm = T)

result <- sd(df1$Ozone, na.rm = T) - sd(df1$Ozone_comp, na.rm = T)

print(result)

 

답변 1

0

companionclub님의 프로필 이미지
companionclub
지식공유자

 

안녕하세요. 답변드립니다.

위의 코드는 특별한 의미는 없습니다.

 

당시 시험에 그 정도의 숫자의 데이터 프레임과 80%만 취하는 문제가 출제되어서 그렇습니다.

airquailty의 전체 row수의 80%가 정수로 떨어지지 않아서,

인위적으로 숫자를 유사하게 조정한 것일 뿐 특별한 의미는 없습니다.

 

그 점 참고부탁드립니다.

이선희님의 프로필 이미지
이선희

작성한 질문수

질문하기