해결된 질문
작성
·
793
1
톰켓이 HTTP를 디코딩하는 방식을 아래와 같이 생각하고 있습니다. 제가 제대로 이해한 걸까요?
HTTP 헤더는 ISO 8859-1로 디코딩합니다.
HTTP 바디는 헤더에서 선언한 디코딩 방식으로 디코딩 하거나
HTTP form 데이터 방식 입력스트림 같은 경우는 UTF-8 디코딩 방식을 사용합니다.
예로 들면
POST/save HTTP/1.1
Host: localhost:8080
Content-Type: multipart/form-data; boundary=------XXX <- ISO 8859-1 디코딩
------XXX
Content-Disposition: form-data; name="username" <- UTF-8 디코딩
kim <- UTF-8 디코딩
------XXX
Content-Dispositon: form-data; name="age" <- UTF-8 디코딩
20 <- UTF-8 디코딩
------XXX
Content-Disposition:form-data; name="file1"; filename="intro.png"
Content-Type: image/png <- UTF-8 디코딩
109328a9.... <-PNG압축 바이너리 형태 그대로
답변 1
5
안녕하세요. 컴퓨터공부하자님
HTTP 헤더는 ISO 8859-1로 디코딩할 것 같아요.
HTTP Header는 8byte로 된 ASCII 문자 + 일부 특수 문자만 지원하는데, 이 포멧만 맞다면 디코딩이 가능합니다. 현실적으로 ISO 8859-1 정도를 사용할 것 같습니다. (제가 톰켓 코드를 다 확인해보지 않아서 정확하지 않을 수 있습니다.)
바디의 경우 다음 두 방식은 인코딩 방식이 다릅니다.
- multipart/form-data
- x-www-form-urlencoded
URL + 쿼리파라미터는 퍼센트 인코딩을 사용합니다.
x-www-form-urlencoded 이 방식도 퍼센트 인코딩을 사용합니다.
multipart/form-data는 데이터를 전송할 때는 퍼센트 인코딩을 사용하지 않고, 바이트 정보를 그대로 전달합니다.
Content-Disposition: form-data; name="username" <- 이 부분도 헤더로 인식됩니다. 따라서 ISO 8895-1 디코딩됩니다.
kim <- UTF-8 디코딩
데이터를 조회할 때는 웹 서버가 내부에서 multipart/form-data를 인식해서 적절하게 디코딩 합니다.
감사합니다.