KTUGFaq

KTUG FAQ

로그인:
비밀번호:
가입
Even a hawk is an eagle among crows.
FrontPage › CP949
Code Page 949.

CP949는 MS의 확장완성형을 가리키는 말로 쓰이고 있다. 이것은 EUC-KR은 그대로 채용하고 한글 8822자를 여기에 두 개의 플레인( [0x81-0xA1], [0x41-0xFE] (Level 1), [0xA1-0xC6], [0x41-0xA0] (Level 2))에 추가함으로써, 완성형 형태의 모든 현대 한글을 표현할 수는 있게 되었다.

See UHC

오해

순차정렬을 위해서는 재배열(remapping)이 필요하다.
문자 인코딩의 코드 순서대로 정렬할 수 있는 경우는 단 한가지 경우도 없습니다. 예를 들어, 영어를 US-ASCII로 표현한 경우에도 ASCII 코드대로 정렬해서는 제대로 한 정렬이라고 볼 수 없습니다. 다른 보기로 한글과 한자가 섞인 문서나 한글과 괄호 혹은 원문자가 섞인 문서에서 정렬하면서 어느 character encoding을 쓰는 경우에도 바이너리 정렬을 해서는 올바른 결과를 얻을 수 없습니다. (한자는 발음에 따라 해당 발음에 대응하는 한글 음절과 같이 정렬되어야 하고, 괄호 문자나 원문자도 괄호나 원 안에 든 한글 음절과 같이 정렬되어야 합니다.). 따라서, 확장 완성형에 대한 비판 중에 정렬 문제는 언급할 가치도 없는 무의미한 것입니다. 확장 완성형의 진짜 문제는 윈도우즈 환경에서 Unicode로의 이행을 가로막고 있다는 점입니다. EUC-KR과 아울러 하루속히 역사의 뒤안길로 사라져야 할 것입니다.

Code Page란 IBM이나 MS에서 사용하는 자사 운영체제의 내부 코드번호를 가리키는 것이다. 원래는 coded character set을 의미하였지만 현재는 locale 설정까지를 의미하는 것으로 확대되었다.
또, 'CP'는 code page의 약어이고 coded character set은 상당히 다른 개념입니다. 또, code page가 locale 설정까지 같이 의미한다는 것도 올바른 얘기가 아닙니다. 비유니코드 플랫폼인 Windows 9x/ME나 Mac OS Classic이나 UTF-8이 아닌 다른 character encoding을 쓰던 시절의 유닉스에서 locale과 character encoding (혹은 code page)이 불가피하게 같이 묶여야 했습니다. 하지만, 그것은 이제 유니크드 기반 OS인 Windows 2k/XP, UTF-8을 쓰는 Unix, Mac OS X에서는 더 이상 성립하지 않는 얘기입니다.



^
Valid XHTML 1.0! Valid CSS! powered by MoniWiki
last modified 2006-04-18 18:24:58
Processing time 0.0311 sec