ASCII

American Standard Code for Information Interchange (미국 정보 교환 표준 부호). 로마자와 각종 기호를 담고 있는 7비트1) 문자 집합. 현존하는 거의 모든 문자 집합이 ASCII에 영향을 받았기 때문에(심지어 유니코드까지!) 그 중요성이 크다.

미국국가표준원(ANSI)의 전신인 미국 표준 협회(ASA)에서 제정했으며, 현재의 표준 번호는 ANSI X3.4이다(옛날에는 ASA X3.4, USASI X3.4 등으로도 불렸다). ASCII는 ISO/IEC 646에 결정적인 영향을 미쳤으며 당연한 얘기지만 ISO/IEC 646 US와 동일하다.

포함된 문자들

ASCII는 33개(0x00~0x1F, 0x7F)의 제어 문자와 95개의 그래픽 문자로 구성되어 있으며, 그래픽 문자는 다시 한 개의 공백 문자(0x20), 52개의 로마자 대문자·소문자, 10개의 인도아라비아숫자, 그리고 32개의 기타 특수 문자로 구성되어 있다.

영역 문자 설명
0x00~0x1F 제어 문자 제어 문자인지 아닌지 체크하기 쉽게 하기 위해 그래픽 문자와 영역이 나뉘어 있다.
0x20 공백 사전순정렬을 간편하게 하기 위해 공백은 그래픽 문자보다 앞에 온다.
0x21~0x27 특수 문자 1 대부분의 문자들은 기계식자판기에서 시프트 글쇠를 누르면서 숫자를 누를 때의 문자에 대응한다. 이 영역은 ASCII에서 유래한 ECMA-1에서 제어 문자로 대체된다.
0x28~0x2F 특수 문자 2 구두점, 괄호, 수학 연산자를 포함한다. 괄호는 Shift-8Shift-9에 대응되는 위치에 있다(당시 일부 타자기가 이 배열을 사용하였다).
0x30~0x39 숫자 이진 부호화 십진수(BCD) 앞에 011 비트만 붙이면 변환이 가능하도록 구성되었다.
0x3A~0x3F 특수 문자 3 쌍점, 수학 연산자, 물음표를 포함한다.
0x40 @ 문자 프랑스어의 "à"("a"보다 순서가 앞이다)에 대응할 것을 염두에 두었다. 이 문자는 당시에는 유럽에서는 잘 쓰이지 않았다. 한편 ECMA-1에서는 이 문자가 널 문자가 된다(…).
0x41~0x5A 로마자 대문자 로마자는 A부터 Z까지 순서대로 배열되어 있는데, 그렇지 않았던 EBCDIC에서의 불편을 줄이고자 한 것이다. 대문자가 소문자보다 앞에 있는 것은 0x30~0x5F까지만 자르면 6비트 문자 집합이 되도록 한 것이다.
0x5B~0x60 특수 문자 4 대괄호, 역슬래시, 캐럿, 역따옴표, 밑줄 문자를 포함한다. 역슬래시는 ASCII에서 처음으로 등장한 문자이며, 캐럿은 본래는 ↑였으나 액센트 문자의 겹쳐쓰기에 더 적합하다는 이유로 교체되었다.
0x61~0x7A 로마자 소문자 소문자와 대문자는 비트 하나만 바꾸면 변환이 되도록 32칸만큼 차이가 난다.
0x7B~0x7E 특수 문자 5 중괄호, 세로줄, 물결표(틸드)를 포함한다. 중괄호와 세로줄은 (소문자를 넣기로 결정한 뒤에) 나중에 추가되었다.
0x7F 제어 문자
(삭제 문자)
천공카드에서 잘못된 글자는 칸에 구멍을 모두 뚫어 표시하는데, 이는 비트가 모두 설정된 것에 해당한다. ASCII 또한 이 전통을 따른다.

결과적으로, 최신판인 ANSI X3.4-1986에 들어 있는 모든 문자들은 다음과 같다: (제어 문자와 공백은 이름으로 표시하였다)

x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1x DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2x SP ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~ DEL
1) 종종 ISO 8859-1ASCII(또는 좀 더 심하게는 ANSI)라고 부르는 경우가 있는데, 이건 첫 128자가 ASCII와 같은 전혀 다른 문자 집합이다.

도쿠위키DokuWiki-custom(rev 9085d92e02)을 씁니다.
마지막 수정 2011-12-30 02:22 | 작성자 lifthrasiir