인프런 커뮤니티 질문&답변

mj kim님의 프로필 이미지
mj kim

작성한 질문수

공공데이터로 파이썬 데이터 분석 시작하기

[3/20] 데이터로드하고 미리보기, 행과 열의 수를 알아보기

안녕하세요 데이터 최신과 관련해서 문의드립니다.

작성

·

16

0

안녕하세요 선생님 전국 평균 분양가격(2013~2015년 8월까지)데이터는 너무 옛날거라 쓰기가 좀 그래서요 혹시 최신버전이나 공공데이터에서 다운 받아서 쓸 수 있는 정보가 있을까요??

현재 2023 09~202408까지 데이터로 진행하고 싶은데 기존 데이터로 따로 월이랑 연도만 따로빼서 파일을 만드신건지..

그렇다고 하면 규모구분 칼럼에서 어떤게 기준점인지 궁금해요 ...

image.png

답변 3

0

박조은님의 프로필 이미지
박조은
지식공유자

안녕하세요. 해당 방법은 df.melt 라는 방법으로 사용합니다. 강의에 보면 2015년 이전 데이터를 이 방으로 녹이는 예제가 있으니 참고해 보세요.

그리고 다음 주소에 해당 데이터가 주기적으로 업데이트 되니 확인해 보세요!

https://kosis.kr/statHtml/statHtml.do?orgId=414&tblId=DT_41401N_005&conn_path=I2

0

mj kim님의 프로필 이미지
mj kim
질문자

아 감사합니다. 혹시

image.png

이런식으로 칼럼을 뽑아야할때는 코드를 어떻게 작성하는게 좋을지 혹시 조언얻을 수 있을까요

 

0

안녕하세요, 인프런 AI 인턴입니다. mj kim님께서 문의하신 전국 평균 분양가격 데이터의 최신버전에 대한 문제는 많은 수강생분들이 종종 겪으시는 부분입니다.

  1. 최신 데이터 다운로드: 현재 원하시는 최신 데이터가 공공데이터 포털에 업데이트되어 있지 않을 수 있습니다. 이 경우, 공공데이터 포털(https://www.data.go.kr)에서 주기적으로 데이터를 업데이트하므로 해당 포털을 통해 최신 데이터를 검색하여 사용해보실 수 있습니다.

  2. 데이터 가공 방법: 기존에 사용하신 데이터셋의 특정 기간이나 칼럼을 수정하여 사용하는 방법도 가능합니다. 예를 들어, 기존 데이터셋에서 원하는 연도와 월만을 추출하여 새로운 데이터셋을 구성하실 수 있습니다.

  3. 기준점 설명: 질문 중 ‘규모구분’ 칼럼에 대해 궁금해하셨는데, 이는 아파트 분양가 데이터에서 주로 ‘전용 면적’을 기준으로 분류됩니다. 따라서, 해당 칼럼의 값이 면적 크기를 나타내는 것으로 보시면 됩니다.

아래는 학교 및 연구 목적으로 최신 데이터를 활용하기 위해 기초 데이터 분석이 필요하신 경우, 파이썬의 pandas 라이브러리를 이용하여 데이터 프레임을 다루는 기본적인 방법입니다:

import pandas as pd

# 기존 데이터셋 불러오기
df = pd.read_csv("old_data.csv", encoding="cp949") 

# 원하는 연도와 월에 해당하는 데이터 추출
filtered_df = df[(df['연도'] == 2023) & (df['월'] <= 8)]

print(filtered_df.head())

위 코드에서는 2023년의 8월까지의 데이터를 추출하는 방법을 보여드렸습니다.

질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

mj kim님의 프로필 이미지
mj kim

작성한 질문수

질문하기