1.

일반적인 한글은 UTF-8 인코딩시 3bytes 다. UTF-16 인코딩시는 2bytes..

일본어도 마찬가지이나.. 특이한 한자는 4bytes이다..

 

2.

Horizontal Ellipsis (‘...’) 는 ASCII로도 3bytes이고, UTF-8 인코딩시 3bytes 짜리이다. UTF-16으로 가야 2bytes

 

3.

UTF8인지 확인하는 방법 (java)

  1. String의 값을 ISO-8859-1 방식으로 bytes[] 값을 얻어옴

  2. http://ko.wikipedia.org/wiki/UTF-8 UTF 표현의 특징 값을 찾아서 확인.

     image

 

4.

IOS4 Emoji(이모티콘) 와 IS5 Emoji(이모티콘)의 인코딩 값이 다르다.

 

예를 들어 아래 링크의 Emoji는 IOS4용이다

http://arashnorouzi.wordpress.com/2011/08/31/adding-graphics-and-emoji-characters-to-apple-push-notifications/

Posted by '김용환'
,