이것은 문서의 이전 버전입니다!


점 없는 I

터키어에는 로마자 i/I가 두 종류가 있는데, 하나는 (소문자 i처럼) 점이 있는 것이고 다른 하나는 (대문자 I처럼) 점이 없는 것이다. (전자의 발음은 보통의 /i/이고, 후자의 발음은 /ɯ/, 즉 "으" 정도의 발음이다.) 문제는 각각에 대소문자가 따로 있는데다가(…) 유니코드 상에서 점 있는 i의 소문자 형태와 점 없는 I의 대문자 형태가 보통 로마자의 소문자 i와 대문자 I에 그냥 대응되어 버려서 대소문자 처리가 굉장히 골치아파진다는 점이다!

좀 더 엄밀하게 말하자면, 보통의 로캘에서 대소문자 대응은 다음과 같다:

  • 소문자 i (U+0069) ↔ 대문자 I (U+0049)
  • 소문자 i (U+0069) ← 점 있는 대문자 İ (U+0130)
  • 점 없는 소문자 ı (U+0131) → 대문자 I (U+0049)

여기서 볼 수 있듯 일반적인 대소문자를 뺀 나머지 대응은 단방향으로만 대응된다. (이건 어쩔 수 없다) 그런데 터키어 로캘에서는 이 대응이 이렇게 바뀌어야 한다:

  • 점 있는 소문자 i (U+0069) ↔ 점 있는 대문자 İ (U+0130)
  • 점 없는 소문자 ı (U+0131) ↔ 점 없는 대문자 I (U+0049)

물론 유니코드는 이런 케이스를 처리하기 위한 별도의 규칙들(collation)을 가지고 있긴 하지만… 그 지원은 암울한 수준이어서, 이를테면 마이크로소프트 윈도의 경우 비스타부터에서야 이걸 제대로 처리하기 시작했다. 휴대폰에서도 이 지원이 엉망이라서 보통 점 없는 쪽을 1이라고 대체해서 쓴다고 한다. 안습.


도쿠위키DokuWiki-custom(rev 9085d92e02)을 씁니다.
마지막 수정 2011-05-30 18:25 | 외부 편집기