일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 클래스
- 스프링
- suvlet
- 빌드
- Scanner
- wrapper
- 박싱
- https://start.spring.io
- start.spring.io
- 메소드
- 자동형변환
- bootstrap
- 콜렉션
- unboxing
- 제너릭
- 싱글턴
- Java
- 제네릭
- boxing
- 언박싱
- Short
- 루프
- 컬렉션
- 무한
- 싱글톤
- 인텔리제이
- 내장객체
- Jenkins
- dependency
- maven
Archives
- Today
- Total
Developer Gonie
[8주차] 5. '문자 인코딩' 이란?( EUC-KR vs UTF-8 ) 본문
'문자 인코딩' 이란?
컴퓨터는 정보를 0과 1로만 저장하는데,
우리가 영어 또는 한글 등의 문자를 사용할 수 있는 이유는 문자 인코딩이라는 과정이 있기 때문에 가능하다.
'문자 인코딩'이란, 사람이 문자열을 입력하면 컴퓨터는 문자열과 숫자를 매치시켜둔 표를 본 뒤 컴퓨터는 그것을 이 바이너리 숫자로 저장하고, 사람에게 다시 보여줄 때는 다시 바이너리 숫자를 문자열 표를 확인하여 해당 글자를 찾아서 텍스트로 보여주는 것이다.
이런 문자 인코딩 방식에는 아래와 같은 여러가지 방식이 존재한다.
1. EUC-KR
가장 초창기에 사용하던 문자열 표인 아스키 코드는 미국에서 사용되는 숫자나 알파벳 정도만 들어있어서 다른 나라의 문자 체계는 표현이 불가능했는데, 이런 상황에서 나라별로 각각 문자열 표를 만들게 되며 탄생한 것 중 하나가 EUC-KR 다.
EUC-KR의 문자열 표에는 한글, 영문, 일어, 한문, 특수기호가 함께 정의되어 있지만 여기에 정의되어 있지 않은 특정 다른 국가의 언어와 혼용하여 사용하면 이를 동시에 표현할 수 없는 문제가 있다.
이런 문제를 해결하기 위해 탄생한 문자열 표가 UTF-8(유니코드).
2. UTF-8(유니코드)
UTF-8의 탄생 배경은 위와 같고, 전세계 모든 국가의 문자를 포함하여 주로 사용된다.
'K-DigitalTraining 강의 > 4. HTML(웹표준)' 카테고리의 다른 글
[8주차] 7. 태그 : <title, br, hr> (0) | 2022.06.28 |
---|---|
[8주차] 6. html, jsp파일 생성시 자동으로 인코딩 방식이 UTF-8이 입력되도록 설정을 바꾸는 방법 (0) | 2022.06.28 |
[8주차] 4. Html에서의 주석처리 방법 (0) | 2022.06.28 |
[8주차] 3. 실행시 내부 브라우저가 아닌 외부 브라우저에서 실행되게 하는 방법 (0) | 2022.06.28 |
[8주차] 2. 톰켓 설치 이후 프로젝트 생성방법 및 실행방법 (0) | 2022.06.28 |
Comments