를 참고하라.
문서 | 설명 |
기본 다국어 평면 |
Basic Multilingual Plane (BMP). 유니코드 및 국제 문자 집합(UCS)의 평면 0, 즉 U+0000부터 U+FFFF까지의 영역. 216개의 연속된 문자를 "평면"이라고 표현하는 것은 UCS에서 유래한 것으로, 유니코드와 UCS가 처음으로 동기화된 영역이기도 하다(지금은 전체 평면이 동기화되어 있다). |
유니코드 |
<http://unicode.org/>
ISO/IEC 10646. IEEE 754와 더불어 소프트웨어 개발자가 꼭 알아야 하는 표준이라고 주장해도 모자라지 않는다. 다만 표준 자체가 굉장히 광범위하므로 필요한 부분만 잘 잘라서... 최소한 UTF-8에 대한 이해는 필요. |
유니코드와 한글 |
유니코드에서 한글은 크게 다음 영역에 할당되어 있다. (5.2 기준)
* 합쳐지지 않는 문자들
* Hangul Compatibility Jamo (U+3130..U+318F)
* Hangul Syllables (U+AC00..U+D7AF)
* 합쳐지는 문자들 (유니코드 5.2에서 옛한글 자모가 크게 추가됨)
* Hangul Jamo (U+1100..U+11FF)
* Hangul Jamo Extended-A (U+A960..U+A97F)
* Hangul Jamo Extended-B (U+D7B0..U+D7FF) |