Notice
Recent Posts
Recent Comments
관리 메뉴

Developer Gonie

[8주차] 5. '문자 인코딩' 이란?( EUC-KR vs UTF-8 ) 본문

K-DigitalTraining 강의/4. HTML(웹표준)

[8주차] 5. '문자 인코딩' 이란?( EUC-KR vs UTF-8 )

이대곤 2022. 6. 28. 17:25

'문자 인코딩' 이란?

컴퓨터는 정보를 0과 1로만 저장하는데,

우리가 영어 또는 한글 등의 문자를 사용할 수 있는 이유는 문자 인코딩이라는 과정이 있기 때문에 가능하다.

 

'문자 인코딩'이란, 사람이 문자열을 입력하면 컴퓨터는 문자열과 숫자를 매치시켜둔 표를 본 뒤 컴퓨터는 그것을 이 바이너리 숫자로 저장하고, 사람에게 다시 보여줄 때는 다시 바이너리 숫자를 문자열 표를 확인하여 해당 글자를 찾아서 텍스트로 보여주는 것이다.

 

이런 문자 인코딩 방식에는 아래와 같은 여러가지 방식이 존재한다.

1. EUC-KR 

가장 초창기에 사용하던 문자열 표인 아스키 코드는 미국에서 사용되는 숫자나 알파벳 정도만 들어있어서 다른 나라의 문자 체계는 표현이 불가능했는데, 이런 상황에서 나라별로 각각 문자열 표를 만들게 되며 탄생한 것 중 하나가 EUC-KR 다.

 

EUC-KR의 문자열 표에는 한글, 영문, 일어, 한문, 특수기호가 함께 정의되어 있지만 여기에 정의되어 있지 않은 특정 다른 국가의 언어와 혼용하여 사용하면 이를 동시에 표현할 수 없는 문제가 있다.

 

이런 문제를 해결하기 위해 탄생한 문자열 표가 UTF-8(유니코드).

2. UTF-8(유니코드)

UTF-8의 탄생 배경은 위와 같고, 전세계 모든 국가의 문자를 포함하여 주로 사용된다.

Comments