작성
·
209
1
강의 중 xml파일을 파싱하는 내용이 두 강의에 걸쳐서 길게 있는데 판다스 라이브러리 1.30 이상부터 쓸 수 있다는 pandas.read_xml 함수를 이용하면 안될까요? csv는 read_csv()를 자주 사용하는 것 같은데 xml 파일은 매번 복잡하게 데이터 프레임으로 바꿔야 하는건지 두렵네요..ㅎ 혹시 read_xml 함수를 일부로 사용하지 않으시는 거라면 그 이유도 궁금합니다!
답변 1
0
안녕하세요. 답변 도우미입니다.
기본적으로는 xml 데이터를 다룰 수 있고, 그 중 일부 데이터를 원하는 방식으로 가져오거나, 수정할 수 있어야 합니다. 그래서 xml 포멧부터, 세밀히 다룰 수 있어야, 여러 실제 케이스에 대응할 수 있을 것 같습니다.
즉, 'read_xml' 함수는 매우 편리하지만, 모든 종류의 XML 파일이나 사용 사례에 적합한 것은 아닐 수 있습니다. 복잡한 XML이나 특정한 처리가 필요한 경우에는 저수준의 파싱 방식이 더 나은 컨트롤을 제공할 수 있습니다.
다만, pandas 는 굉장히 많은 함수를 제공하기 때문에, 필요에 따라 말씀하시는 함수를 쓰셔도 좋고요. 저도 문제에 따라서, 저수준으로 컨트롤할 때도 있고, 위와 같은 함수를 찾아서 쓰기도 합니다.
감사합니다.