通信所设计的。
因为是针对英语设计的,别说处理汉字,就连处理带有音调标号的几种欧洲文字时都就会出现问题。
为了表示更多字符,人们打起了校验码的主意,让最高位也用作字符表示,这就是ASCII码扩字符集。
一种扩展是把值为128-255之间的字符用于画图和画线,以及一些特殊的欧洲字符。另一种扩展是把位于128-255之间的字符用于拉丁字母表中特殊语言字符。
随着信息技术在全世界各个国家的发展,这种修修补补的方法,其局限性就彻底暴露了出来。
作为脱离传统打字机的后生事物,UTF-8代表着信息技术新时代,即网络时代和无线通信时代的先进编码。
除了字符数量可以几乎不受约束地编制之外,它还可以通过屏蔽位和移位操作快速读写,也可以使排序变得更加容易。
但是UTF-8也不是一点问题都没有,比如目前的部分系统如ISO 2022,4873,6429和8859,会将UTF-8超过百分之五十使用率的码值100xxxxx解读成C1控制码,导致被过滤或者解读出错。
但是这个问题很好解决,就是通过一个字节对UTF-8进行修正,因而构成UTF-8修正码。
随着这些系统被新兴的系统取代,这个问题就和即将到来的“千年虫”问题一样,变得不复存在。
但是这个问题在UNIX系统,以及基于UNIX系统发展起来的linux系统,四叶草COS系统和MiniCOS系统中并不存在,因为UNIX系统一开始就是基于UNICODE设计的。
随着四叶草的系统在超算系统, java环境系统,各类服务器-终端型办公系统等应用场景中攻城略地,语言环境的独特优势一步步得以持续的凸显。
让其余开发商头疼的系统字符兼容性问题,在四叶草这里压根不存在,大家可以将力量集中在其余研发方向上。
但是麦明东之所以会问出这个问题,是因为周至在搞瀚文数据库的时候,UNICODE字符集对于全世界信息产业的影响都还没有完全体现出来,即便是到了现在,ASCII字符集都还是西方社会的主流,而最近两三年才出现的各大厂软件系统争相兼容UNICODE字符集的现象,主要还是因为捆绑在英文地区外的市场上销售操作系统的需要带来的。
如果没有周至后续引导四叶草集团对开发系统的研究
本章未完,请点击下一页继续阅读!