早期的计算机软件往往就是用ASCII编码。然而对于一些非英语国家而言,ASCII编码并不能满足计算机应用的需要。
以我国为例,我国使用的现代汉字包6763个基本汉字以及众多的扩展汉字。因此,在20世纪80年代初,国家标准总局规范和发布了GB2312编码,共收入6763个标准汉字以及682个非汉字图形符号。
与此同时,世界上的其他各国、各地区也推出了诸多的编码,例如日本推出了EUC编码和Shit-JIS编码,新加坡推出了HZ编码。我国的台湾地区也推出了基于繁体中文字的Big5编码等。
基于各国各行其是的编码造成的混乱,国际互联网工程工作组与各国政府协商,共同编制了包含目前世界上绝大多数语言的unicode字符集,即万国码字符集。其中主要包括8位的utf8、16位的utf-16以及32位的utf32等3种编码。
utf8作为目前最主要的编码方式,采用了8位的二进制数字为编码码元,成为目前国际上通行的编码方式。
发表评论