scribbling
가끔씩 까먹는 Encoding 이야기
'김용환'
2012. 7. 25. 11:26
1.
일반적인 한글은 UTF-8 인코딩시 3bytes 다. UTF-16 인코딩시는 2bytes..
일본어도 마찬가지이나.. 특이한 한자는 4bytes이다..
2.
Horizontal Ellipsis (‘...’) 는 ASCII로도 3bytes이고, UTF-8 인코딩시 3bytes 짜리이다. UTF-16으로 가야 2bytes
3.
UTF8인지 확인하는 방법 (java)
1. String의 값을 ISO-8859-1 방식으로 bytes[] 값을 얻어옴
2. http://ko.wikipedia.org/wiki/UTF-8 UTF 표현의 특징 값을 찾아서 확인.
4.
IOS4 Emoji(이모티콘) 와 IS5 Emoji(이모티콘)의 인코딩 값이 다르다.
예를 들어 아래 링크의 Emoji는 IOS4용이다