American Standard Code for Information Interchange (미국 정보 교환 표준 부호). 로마자와 각종 기호를 담고 있는 7비트1) 문자 집합. 현존하는 거의 모든 문자 집합이 ASCII에 영향을 받았기 때문에(심지어 유니코드까지!) 그 중요성이 크다.
미국국가표준원(ANSI)의 전신인 미국 표준 협회(ASA)에서 제정했으며, 현재의 표준 번호는 ANSI X3.4이다(옛날에는 ASA X3.4, USASI X3.4 등으로도 불렸다). ASCII는 ISO/IEC 646에 결정적인 영향을 미쳤으며 당연한 얘기지만 ISO/IEC 646 US와 동일하다.
ASCII는 33개(0x00~0x1F, 0x7F)의 제어 문자와 95개의 그래픽 문자로 구성되어 있으며, 그래픽 문자는 다시 한 개의 공백 문자(0x20), 52개의 로마자 대문자·소문자, 10개의 인도아라비아숫자, 그리고 32개의 기타 특수 문자로 구성되어 있다.
영역 | 문자 | 설명 |
---|---|---|
0x00~0x1F | 제어 문자 | 제어 문자인지 아닌지 체크하기 쉽게 하기 위해 그래픽 문자와 영역이 나뉘어 있다. |
0x20 | 공백 | 사전순정렬을 간편하게 하기 위해 공백은 그래픽 문자보다 앞에 온다. |
0x21~0x27 | 특수 문자 1 | 대부분의 문자들은 기계식자판기에서 시프트 글쇠를 누르면서 숫자를 누를 때의 문자에 대응한다. 이 영역은 ASCII에서 유래한 ECMA-1에서 제어 문자로 대체된다. |
0x28~0x2F | 특수 문자 2 | 구두점, 괄호, 수학 연산자를 포함한다. 괄호는 Shift-8 과 Shift-9 에 대응되는 위치에 있다(당시 일부 타자기가 이 배열을 사용하였다). |
0x30~0x39 | 숫자 | 이진 부호화 십진수(BCD) 앞에 011 비트만 붙이면 변환이 가능하도록 구성되었다. |
0x3A~0x3F | 특수 문자 3 | 쌍점, 수학 연산자, 물음표를 포함한다. |
0x40 | @ 문자 | 프랑스어의 "à"("a"보다 순서가 앞이다)에 대응할 것을 염두에 두었다. 이 문자는 당시에는 유럽에서는 잘 쓰이지 않았다. 한편 ECMA-1에서는 이 문자가 널 문자가 된다(…). |
0x41~0x5A | 로마자 대문자 | 로마자는 A부터 Z까지 순서대로 배열되어 있는데, 그렇지 않았던 EBCDIC에서의 불편을 줄이고자 한 것이다. 대문자가 소문자보다 앞에 있는 것은 0x30~0x5F까지만 자르면 6비트 문자 집합이 되도록 한 것이다. |
0x5B~0x60 | 특수 문자 4 | 대괄호, 역슬래시, 캐럿, 역따옴표, 밑줄 문자를 포함한다. 역슬래시는 ASCII에서 처음으로 등장한 문자이며, 캐럿은 본래는 ↑였으나 액센트 문자의 겹쳐쓰기에 더 적합하다는 이유로 교체되었다. |
0x61~0x7A | 로마자 소문자 | 소문자와 대문자는 비트 하나만 바꾸면 변환이 되도록 32칸만큼 차이가 난다. |
0x7B~0x7E | 특수 문자 5 | 중괄호, 세로줄, 물결표(틸드)를 포함한다. 중괄호와 세로줄은 (소문자를 넣기로 결정한 뒤에) 나중에 추가되었다. |
0x7F | 제어 문자 (삭제 문자) | 천공카드에서 잘못된 글자는 칸에 구멍을 모두 뚫어 표시하는데, 이는 비트가 모두 설정된 것에 해당한다. ASCII 또한 이 전통을 따른다. |
결과적으로, 최신판인 ANSI X3.4-1986에 들어 있는 모든 문자들은 다음과 같다: (제어 문자와 공백은 이름으로 표시하였다)
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF |
|
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0x | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
1x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |