인프런 커뮤니티 질문&답변

성훈님의 프로필 이미지
성훈

작성한 질문수

처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part2]

XML 파일 파싱 시 read_xml()함수 사용

작성

·

209

1

강의 중 xml파일을 파싱하는 내용이 두 강의에 걸쳐서 길게 있는데 판다스 라이브러리 1.30 이상부터 쓸 수 있다는 pandas.read_xml 함수를 이용하면 안될까요? csv는 read_csv()를 자주 사용하는 것 같은데 xml 파일은 매번 복잡하게 데이터 프레임으로 바꿔야 하는건지 두렵네요..ㅎ 혹시 read_xml 함수를 일부로 사용하지 않으시는 거라면 그 이유도 궁금합니다!

답변 1

0

안녕하세요. 답변 도우미입니다.

기본적으로는 xml 데이터를 다룰 수 있고, 그 중 일부 데이터를 원하는 방식으로 가져오거나, 수정할 수 있어야 합니다. 그래서 xml 포멧부터, 세밀히 다룰 수 있어야, 여러 실제 케이스에 대응할 수 있을 것 같습니다.

즉, 'read_xml' 함수는 매우 편리하지만, 모든 종류의 XML 파일이나 사용 사례에 적합한 것은 아닐 수 있습니다. 복잡한 XML이나 특정한 처리가 필요한 경우에는 저수준의 파싱 방식이 더 나은 컨트롤을 제공할 수 있습니다.

다만, pandas 는 굉장히 많은 함수를 제공하기 때문에, 필요에 따라 말씀하시는 함수를 쓰셔도 좋고요. 저도 문제에 따라서, 저수준으로 컨트롤할 때도 있고, 위와 같은 함수를 찾아서 쓰기도 합니다.

감사합니다.

성훈님의 프로필 이미지
성훈

작성한 질문수

질문하기