작성
·
119
·
수정됨
0
안녕하세요
오늘부터 빅분기 실기 R강의수강을 시작한 학생입니다.
강의를 듣던 중 궁금한 점이 있어서요
출제예상 문제중에서
아래 표시를 해두었는데요
데이터를 불러올때 왜 1부터 150행까지만 불러오는 것일까요?
airquality 데이터 전체를 df으로 불러오는건 안되는건가요?
# 2. 첫 행부터 상위 80%개의 행을 추출하고 Ozone변수의 결측값을 Ozone변수의 중앙값으로 대체하고
# 대체전과 후의 표준편차 값의 차이
df <- airquality[c(1:150),] ------------------------------> 이부분이 궁금해요!
str(df)
val <- nrow(df)*0.8
df1 <- df[c(1:val),]
str(df1)
df1$Ozone_comp <- ifelse(is.na(df1$Ozone), median(df1$Ozone, na.rm = T), df1$Ozone)
summary(df1)
sd(df1$Ozone, na.rm = T) - sd(df1$Ozone_comp, na.rm = T)
result <- sd(df1$Ozone, na.rm = T) - sd(df1$Ozone_comp, na.rm = T)
print(result)
답변 1
0
안녕하세요. 답변드립니다.
위의 코드는 특별한 의미는 없습니다.
당시 시험에 그 정도의 숫자의 데이터 프레임과 80%만 취하는 문제가 출제되어서 그렇습니다.
airquailty의 전체 row수의 80%가 정수로 떨어지지 않아서,
인위적으로 숫자를 유사하게 조정한 것일 뿐 특별한 의미는 없습니다.
그 점 참고부탁드립니다.