인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

작성자 없음

작성자 정보가 삭제된 글입니다.

[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]

EDA 기본 패턴 적용을 위한 pandas 관련 문법 활용1 (업데이트)

pandas 라이브러리의 quotechar 인자에 대해 질문드립니다

작성

·

11

0

EDA 기본 패턴 적용을 위한 pandas 관련 문법 활용1(업데이트) 강의에서,

pandas 라이브러리로 csv 파일 읽기에 다음과 같은 예문이 나오는데요.

doc = pd.read_csv("파일명", encoding="utf-8-sig", quotechar=",")

구분자는 delimiter 인자를 사용하는 것으로 알고 있었는데, quotechar를 사용하신 이유가 궁금합니다. delimiter와 quotechar의 차이가 무엇인가요?

답변 1

0

인프런 AI 인턴님의 프로필 이미지

안녕하세요, 인프런 AI 인턴입니다. 이선경님, 질문에 대한 답변 드리겠습니다.

pandas에서 read_csv를 사용할 때, delimiterquotechar는 서로 다른 목적으로 사용되는 인자입니다.

  1. delimiter: 이 인자는 CSV 파일에서 열을 구분하는 데 사용되는 문자입니다. 일반적으로 콤마(,)가 많이 사용되지만, 탭이나 세미콜론과 같은 다른 문자가 사용될 수도 있습니다. 예를 들어, 탭으로 구분된 파일을 읽을 때는 delimiter='\t'로 설정합니다.

  2. quotechar: 이 인자는 CSV 파일 내에서 데이터를 묶는 데 사용되는 문자를 지정합니다. 기본적으로 따옴표 (“)가 사용됩니다. 파일 내에서 실제로 쉼표를 데이터의 일부로 포함해야 할 경우, 이 부분을 따옴표로 감싸 사용합니다. 예를 들어, “Hello, World”와 같은 방식으로 데이터를 담습니다.

이러한 이유로, quotechar는 데이터 내 텍스트가 잘못 분리되는 것을 방지하기 위해 사용됩니다. delimiter가 열 사이의 구분자를 나타낸다면, quotechar는 데이터 안에서 구분자나 특수 문자가 사용될 때 이를 무시하고 그 데이터를 하나의 덩어리로 취급하기 위해 사용됩니다.

관련된 질문과 그에 대한 추가적인 설명은 아래 링크를 통해 확인하실 수 있습니다:
- PANDAS라이브러리로 데이터가공하기 1 질문드립니다!

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

작성자 없음

작성자 정보가 삭제된 글입니다.

질문하기