字符編碼的奧祕-------本文旨在講解常見的字符編碼,如:Unicode、UTF-8、GBK字符集,以及emoji。起初計算機在美國發明,自然大家考慮的是如何表示英文,英語字母總共 26 個,加上特殊字符,用 128 個字符,一個byte即足以表示出來。這個就是大家所熟知的ASCII編碼。對應關係很簡單,一個字符對應一個byte。但很快人們發現,其他非英語國家的文字遠遠超過ASCII碼,不同國家 ⌘ Read more
字符編碼的奧祕-------本文旨在講解常見的字符編碼,如:Unicode、UTF-8、GBK字符集,以及emoji。起初計算機在美國發明,自然大家考慮的是如何表示英文,英語字母總共 26 個,加上特殊字符,用 128 個字符,一個byte即足以表示出來。這個就是大家所熟知的ASCII編碼。對應關係很簡單,一個字符對應一個byte。但很快人們發現,其他非英語國家的文字遠遠超過ASCII碼,不同國家 ⌘ Read more