|
1. Unicode, UTF-8
Unicode에 대해 아주 피상적으로만 알고 있었는데, 이 위키피디아 문서는 한번 읽어볼 만하다. 원래 찾아보려던건, UTF-8은 유니코드를 표현하기는 하지만 유니코드가 아닌 유니코드의 변종인건가? 였는데, 결론은 UTF-8도 유니코드라는것. 좀더 정확히 표현하면 유니코드 표준 인코딩방식 중 하나다. 사실 유니코드 인코딩방식이 몇 개 안되고 그중에서 UTF-8이 가장 많이 쓰인다. 따라서 UTF-8이 가장 대표적인 유니코드 인코딩방식이다. 2. size UTF-8이 가장 많이 쓰이게 된건 ascii와 호환되고, ascii가 1byte로 표현되니 용량이 작기때문이다. 한글은 UTF-8에서 3byte로 표현되니 size면에서는 효율적이지 않다. 같은 기준으로 본다면 한글은 euc-kr이 가장 효율적이다. euc-kr은 ascii와 호환되고, ascii가 1byte로 표현되며, 한글은 2byte로 표현된다. 3. 호환성 호환성 면에서는 UTF-8이 euc-kr보다 좋을 것이다. 외국에서 만들어진 소프트웨어들은 euc-kr을 지원하지 않을 확률이 클테니까. 물론 어차피 한글을 지원하는 소프트웨어는 euc-kr을 지원할 것이고(아직까지는) 한글을 지원하지 못하는 소프트웨어는 한글을 UTF-8로 인코딩해봐야 제대로 보여주지 못한다. 국내 컴퓨터 환경만 고려한다면 UTF-8을 지원하지 못하는 소프트웨어들이 꽤 있기때문에 아직까지는 euc-kr이 좀더 호환성이 높을 수는 있으나 모든 환경이 유니코드로 가고 있는 것은 분명하다. 4. 어떤 인코딩인지 정체를 밝혀라 유니코드를 사용한다고 해서 호환성 이슈가 다 해결되는건 아니다. 유니코드를 실제로 인코딩하는 방식이 여러 개라서 해당 문서가 어떤 인코딩방식을 쓰는지를 따로 명시해야만 한다. UTF-8인지 16인지 32인지, 혹은 유니코드가 아니라 euc-kr 등인지.
이 글과 관련있는 글을 자동검색한 결과입니다 [?]
|
이글루 파인더
More Infomation
카테고리
최근 등록된 덧글
본문중에 'XBox 360은 M..
by 땅보 at 12/07 저도 AR 쪽에 관심이 있.. by 대한민국토리 at 12/01 머리 나빠도 숙제 열심히.. by conanoc at 11/20 30년만 일찍 이글을 쓰시.. by jimbo73 at 11/19 푸앙카레?.. 도저히 풀 .. by dcsds at 11/10 최근 등록된 트랙백
비트 토렌토의 도입
by Confluence: 김용진 휴대폰으로 블로그 읽기.. by SKT Story fitness참고합니다. by lovelove님의 이글루 내 손안의 PC - 자바가 .. by 上善若水 만박의 생각 by sumanpark's me2DAY 라이프로그
이전블로그
| |||