하드웨어인사이트 - 하드웨어 공개강좌 - 유니코드에 대해서..

하드웨어 인사이트

공개 강좌 : 이것만 알면 선임연구원까지 문제 없다.

하드웨어 설계에 관련한 공개 강좌를 게재하는 공간입니다.
운영진에 의해 강좌글은 편집되며, 공익을 위한 게시글은 '하드웨어 강좌'란으로 이동될 수 있습니다.

콘텐츠 수 15

유니코드에 대해서..

하드웨어 일반 구매수 0 조회 수 2042 2007.08.16 07:48:05

판매자	아크마	판매 납포인트	무료	평점	1.0점 / 총 2명 참여

1. SBCS (Single-byte Character Sets)

ASCII로 1~128까지 숫자를 표시하는 것 알고 계시죠? 그러니까 2^7만을 쓰는 거죠. 그런데 character 형은 아시다시피 1byte이고 따라서 1bit가 남게 됩니다.

예전 도스시절에 한글이 깨지면 보통 선문자나 유럽어의 움라우트가 불규칙하게 배열되는 것으로 알 수 있었습니다. 이런 선문자나 움라우트가 나머지 128개의 문자로서 채워지게 되는 거죠.

그래서 128+128 = 256 = 2^8 = 1 byte 가 되게 됩니다. 이때 마지막 한 비트는 음수를 표시하는 비트이고, 이 음수표시 비트가 1이 될 때, ASCII가 아닌 확장코드를 의미하게 됩니다.

2.MBCS (Multibyte Character Sets)

그런데 문제는 한글이나 한문 같은 경우는 128개로 표현할 수 없다는 점입니다.

그래서 2 character를 사용하게 됩니다. 아시다시피 도스환경이나 WAP같은 데서 보면 한글은 영문에 비해서 두 배의 넓이를 가지고 있습니다.(win에서는 거의 그런 경우가 없지만요. 이건 또 다른 문제입니다.)

위에서 설명드릴 때 음수표시 비트로 확장코드를 표시한다고 했었죠? MBCS의 경우에는 (음수)(음수) 로 표시하게 됩니다.

경우의 수를 따져보면,

(128 + 128) * (128 + 128)이니까,

= 128^2 + 2*128^2 + 128^2

이중에서 제일 마지막에 있는 항, 128^2이 MBCS를 표시하는 경우의 수죠.

한글이나 일어, 한문은 이런 방식으로 표시를 하게 되죠.

(참고로 제일 앞의 128^2는 ASCII 두 문자가 배열되는 경우의 수죠)

한글도스에서 일본어가 깨지고, 일본 도스에서 한국어가 깨지는 것은 각 나라마다, 각 코드마다 MBCS 규격이 다르기 때문입니다.

3. Unicode

이런 MBCS를 갖고는 범용적인 프로그램을 만들수 없습니다.( MSDN에 이렇게 나와있죠 ^^; )

어떤 프로그램들은 언어를 선택하는 부분이 있고, 언어를 선택하자마자 그 나라의 언어로 나오는데, 이런 프로그램들은 UNICODE를 쓰고 있다고 보시면 됩니다.

UNICODE는 256 * 256 = 65536의 문자 map를 사용합니다. 이것은 모든 언어의 모든 문자를 담을 수 있게 잡힌 거죠.

map은 ... 찾고 나서 보충해 드립죠.

MSDN을 참조하시려면,

MSDN -> visual studio 6.0 Docu -> visual C++ Docu -> Using visual c++ -> visual c++ programmer's guide -> run time library reference -> run time routines by category -> interntionalization 을 찾아보세요.

msdn없으면 온라인 msdn을 이용하세요.

http://msdn.microsoft.com/default.asp

///////////////////////////////////////////////////////////////////////////////////////////////

위 내용은 옛날 예적에 제가 저장해놓은 자료입니다.

모르는 것이 무엇인지 스스로 정리하고 질문하는 습관을 가집시다.
무성의/광범위하거나 직접 해보지 않고 올리는 질문은 서로를 피곤하게 합니다.
질문쪽지는 사절이오니 게시판에 글을 남겨주세요. 그래야 다같이 공유할 수 있으니까요.

목록

컴쟁이 2013.02.02 00:03

잘보고 갑니다

댓글

시나브로69 2017.06.24 14:46

좋은 자료 감사합니다.

댓글

11시22분

2019.04.17 10:55

감사합니다.

댓글

-3948

2022.09.26 15:41

좋은자료 감사합니다

댓글

하드웨어 일반 : (15)

■ 유니코드에 대해서.. 2022-09-26 15:41

■ 마이크로 프로세서를 응용한 회로에서의 디버깅 2019-07-25 10:35

■ MCU에 헥사파일(HEX)파일이 다운로드가 안됩니다. 2019-07-25 10:37

■ 시계를 제작하는 방법은 무엇이 있나요? 2019-04-17 10:57

■ ISP란 무엇인가요? 2019-04-17 10:57

■ 같은 종류(Family)의 다른 MCU모델로 대체해도 되나요?? 2019-04-17 10:57

■ MCU의 인터럽트 핀이 부족할때는?? 2021-10-03 17:10

■ 8051은 AD컨버터가 없다. 2019-04-17 11:00

■ 3.3v를 5v와 인터페이스하려면? 2023-11-28 14:33

■ 전기/전자쪽으로 독학으로 공부하려면 뭐부터 시작해야 합니까? 2019-04-17 11:01

■ JTAG는 무엇인가요? 2019-04-17 11:03

■ RC low-pass filter(1차 필터)에 대하여 2018-11-26 13:25

■ Build Your Own Microcontroller Projects 2019-04-17 14:19

■ ASCII Table 2019-04-17 14:19

■ [알림] 강좌 등록/제휴하기 2014-05-06 13:07

ETC

목록

존경 없이 참된 연애는 성립되지 않는다.
- 피히테
덕이 없는 아름다움은 향기 없는 꽃이다.
- 프랑스 격언
사랑은 일에 굴복한다. 만일 사랑으로부터 빠져 나오기를 원한다면, 바쁘게 되라. 그러면 안전할 것이다.
- 오비디우스
태만이란 약한 마음을 가진 사람의 유일한 피난처이다.
- 체스터필드
사랑은 홍역과 같다. 우리 모두가 한번은 겪고 지나가야 한다.
- J.K 제롬

Link

Email

저작권법에 위배되는 콘텐츠는 등록 불가하며, 저작물에 대한 권리는 저작자에게 있습니다.

Copyright 2006-2021 © hardwareis.com, All rights reserved.