검색
검색
회원가입로그인

유니코드, UTF, 아스키 코드 알아보기

유니코드

유니코드란 전 세계의 모든 문자를 컴퓨터에서 표현할 수 있도록 설계된 산업 표준이다.

U+0000와 같이 표현한다. 전체 표는 위키피디아 유니코드 목록에서 볼 수 있다.

자바스크립트에서는 \u003C \u003E 와 같은 형식으로 표시된다.

이는 각각 U+003C (< 작다 표시) 와 U+003E (> 크다 표시)를 의미한다.

유니코드 변환 형식 (Unicode Transformation Format, UTF)

유니코드의 매핑 방식은 유니코드 변환 형식 (UTF) 인코딩과 국제 문자 세트 인코딩이 있다.

우리가 자주 보는 UTF에 대해 알아보자.

  • UTF-8 : 유니코드를 위한 문자 인코딩 방식 중 하나. UTF-8은 유니코드 한 문자를 나타내기 위해 1바이트에서 4바이트까지를 사용한다.

  • UTF-16 : 주로 사용되는 기본 다국어 평면에 속하는 문자들은 그대로 16비트 값으로 인코딩이 되고 그 이상의 문자는 특별히 정해진 방식으로 32비트로 인코딩이 된다.

아스키 코드 (ASCII)

미국정보교환표준부호 (American Standard Code for Information Interchange)를 의미한다. 7비트 인코딩으로 영문 알파벳을 모두 표현할 수 있다. 초기 문자 인코딩에 사용되던 기법으로 대부분의 문자 인코딩이 아스키에 기초를 두고 있다.

예를 들어 대문자 A는 이진법으로 1000001이고 팔진법으로는 101이고 십진법으로는 65이며 85진법으로는 32이다.

모든 표는 위키피디아에서 볼 수 있다.

조회수 : 402
공유하기
카카오로 공유하기
페이스북 공유하기
트위터로 공유하기
url 복사하기