티스토리 뷰

문자는 컴퓨터에게 결국 숫자일 뿐이다.

그러므로 컴퓨터는 문자를 숫자로 저장하고있다.

 

따라서 문자를 나타내기 위한 숫자를 규정할 필요가 있다.

이것은 먼옛날옛날에 컴퓨터를 만들 때부터 고민했을 것이며 많은 사람들이 약속하고 수정했을것이다.

특정숫자를 문자로 규정하는것을 부호체계라고 하며

현재 미국표준협회 ANSI(American National Standards Institute) 에서 만든 아스키(ASCII : American Standard Code for Information Interchange) 코드가 사용된다.

아스키코드 표 보기

 

컴퓨터의 8비트만으로 영문알파벳은 충분히 표현이 가능하다.

그러나 한국어, 일본어, 중국어 등과 같이 문자 수가 많고 체계가 복잡한 언어는 이것이 불가능

따라서 16비트로 확장하여 표현한다.

 

영문외 다른 문자 표현방법으로는 나라마다 여러가지가 존재했으나 (한국 : 조합형, 완성형 등, 중국: GBK, 대만: Big Five, 일본: Shift-JIS등등) 전 세계의 모든 문자를 통일된 코드 체계로 표현하기 위한 유니코드(UNICODE)가 만들어졌다.

모든 문자들이 동일한 크기를 가지고있다.

각 문자를 16비트로 표현, 총 65536 개 표현가능하다고함, 세계 각국의 글자들이 할당되어있으며 알파벳2449개, 중, 일 한국의 한자를 위해 20902 개, 한글을 위해 11172개 할당되어있다고함

유니코드의 0- 127까지는 아스키 코드와 호환되도록 만들어져 있어 유니코드 체계에서도 ASCII코드는 유효하다.

 

 

 

 

'ComComComCom > Common' 카테고리의 다른 글

Gpg Study 포럼 링크  (0) 2017.08.04
physX  (0) 2017.07.14
.NetFrmaework  (0) 2017.07.14
바이너리파일 텍스트파일  (0) 2017.07.04
ASCII code table (아스키코드표)  (0) 2017.07.04
댓글