목차

여러 문자 인코딩으로 해석되는 문자열

깨진문자인코딩의 특수한 예로, 문자열이 둘 이상의 문자 인코딩으로 해석할 수 있는 경우 본래 해석이 아닌 다른 (보통은 어처구니 없는) 해석이 본래 해석을 대신해서 쓰이는 경우가 종종 존재한다.

Shift_JIS ↔ EUC-KR/Windows-949

Shift_JIS의 2바이트 인코딩과 Windows-949에서 추가된 확장 완성형이 상당 부분 겹치기 때문에 가장 흔히 볼 수 있는 사례이다.

UTF-8 ↔ EUC-KR/Windows-949

UTF-8의 2바이트 인코딩과 EUC-KR 한글 영역(확장 완성형이 아니다!)은 대략 200여자 정도 겹친다. 이 때문에 짧은 EUC-KR 문자열이 UTF-8로 해석될 수도 있다. 그 밖에도 드물지만 3바이트 인코딩 두 개가 이어져서 올바른 확장 완성형으로 해석될 수 있다.