인프런 커뮤니티 질문&답변

컴퓨터공부하자님의 프로필 이미지
컴퓨터공부하자

작성한 질문수

스프링 MVC 2편 - 백엔드 웹 개발 활용 기술

서블릿과 파일 업로드1

톰켓이 클라이언트로부터 받은 HTTP를 디코딩하는 방식은 어떻게 되나요?

해결된 질문

작성

·

793

1

톰켓이 HTTP를 디코딩하는 방식을 아래와 같이 생각하고 있습니다. 제가 제대로 이해한 걸까요?

HTTP 헤더는 ISO 8859-1로 디코딩합니다.

HTTP 바디는 헤더에서 선언한 디코딩 방식으로 디코딩 하거나

HTTP form 데이터 방식 입력스트림 같은 경우는 UTF-8 디코딩 방식을 사용합니다.

 예로 들면

POST/save HTTP/1.1

Host: localhost:8080

Content-Type: multipart/form-data; boundary=------XXX     <-  ISO 8859-1 디코딩                       

------XXX

Content-Disposition: form-data; name="username"   <- UTF-8 디코딩 

kim <- UTF-8 디코딩

------XXX

Content-Dispositon: form-data; name="age"  <-  UTF-8 디코딩               

20 <- UTF-8 디코딩                  

------XXX

Content-Disposition:form-data; name="file1"; filename="intro.png"                   

Content-Type: image/png   <- UTF-8 디코딩        

109328a9....        <-PNG압축 바이너리 형태 그대로

답변 1

5

김영한님의 프로필 이미지
김영한
지식공유자

안녕하세요. 컴퓨터공부하자님

HTTP 헤더는 ISO 8859-1로 디코딩할 것 같아요.

HTTP Header는 8byte로 된 ASCII 문자 + 일부 특수 문자만 지원하는데, 이 포멧만 맞다면 디코딩이 가능합니다. 현실적으로 ISO 8859-1 정도를 사용할 것 같습니다. (제가 톰켓 코드를 다 확인해보지 않아서 정확하지 않을 수 있습니다.)

바디의 경우 다음 두 방식은 인코딩 방식이 다릅니다.

- multipart/form-data

- x-www-form-urlencoded

URL + 쿼리파라미터는 퍼센트 인코딩을 사용합니다.

x-www-form-urlencoded 이 방식도 퍼센트 인코딩을 사용합니다.

multipart/form-data는 데이터를 전송할 때는 퍼센트 인코딩을 사용하지 않고, 바이트 정보를 그대로 전달합니다.

Content-Disposition: form-data; name="username"   <- 이 부분도 헤더로 인식됩니다. 따라서 ISO 8895-1 디코딩됩니다.

kim <- UTF-8 디코딩

데이터를 조회할 때는 웹 서버가 내부에서 multipart/form-data를 인식해서 적절하게 디코딩 합니다.

감사합니다.

컴퓨터공부하자님의 프로필 이미지
컴퓨터공부하자

작성한 질문수

질문하기