将本站设为首页
收藏笔迹官网,记住:www.bjqige.net
账号:
密码:

笔迹中文:看啥都有、更新最快

笔迹中文:www.bjqige.net

如果你觉得好,恳请收藏

您当前的位置:笔迹中文 -> 重生之乘风而起 -> 第三千一百零八章 统一码大会

第三千一百零八章 统一码大会

加入书签 上一章章节列表 我的书架

温馨提示:如果本章属于内容错误等情况,请点击下面的按钮发送报告,我们会在一分钟内纠正,谢谢

讲代表,却是麦小苗。

用周至的话说,自己搞出来瀚文大字库,只代表着过去,而麦小苗基于瀚文大字库上搞出来的搜索引擎,以及驱动引擎的非线性匹配算法,才真正代表着未来。

麦小苗演讲的题目叫做《汉语在未来信息世界里的重要性》。

“作为最古老的象形文字,汉语有一项对于信息技术来讲最神奇的特性,那就是它的单位信息量。”

“以《联合国宪章》为例,中文版的《联合国宪章》有26650个字符,而英文版则需要55600个字符,在排版统一的情况下,中文文件的厚度一般只有英文等字母形语言的一半。”

“因此作为书面文字,汉字是这个星球上最高效,信息密度最高的文字。”

“究其根本原因,是因为字母形文字是‘一维’的,只代表了声音,而汉字是二维的,不仅仅代表声音,还封装了海量的信息。”

“这种信息还可以自由组合,用极简的方式完成派生词的产生。”

“比如国际化这个词,用英文表述需要二十个字符,用中文只需要三个字符,换成信息技术的表述,英文需要二十比特,而中文只需要六比特。”

“根据香农信息熵的研究,字符的信息熵为4比特,而汉字的信息熵为9.65比特,也就是说,在以计算机技术为主的信息世界里,中文可以比其余文字,以更小容量的信息载体,更快的速度,记录和传播更大的信息量。”

“比如中文的舅舅一词,只有四个比特,而要用英文来准确瞄准,则需要以‘妈妈的哥哥’来表示,中文词汇在这里还包含了血缘,辈分,性别三个维度的信息量,这是声音记录类字符型文字所无法表达的。”

“除了记录的效率,还有读取的效率。”麦小苗在台上侃侃而谈:“中国有个成语叫做‘一目十行’,意思就是中文信息的读取可以是面积式的,图形化的。”

“四叶草实验室做过一个有趣的实验,那就是将固定中文词汇的排列顺序予以打乱,然后制作出文本交给读者阅读,读者们可以惊奇地发现,混乱的词汇语序搭配正确的中文语法,并不会对阅读理解造成任何影响。”

“也就是说,‘实验’和‘验实’在文章里的作用是一样的,错误的排序会被中文使用者在下意识层面完成自动纠正。”

“人类的大脑在阅读时主要涉及两条通路,一条叫背侧通路,主要进行语音识别,一条叫腹侧通路,主要进行视觉处理和语意连接。”


  本章未完,请点击下一页继续阅读!
加入书签 上一章章节列表 我的书架

看了《重生之乘风而起》的书友还喜欢看

从酒肆杂役开始武道化圣
作者:为你傲视蒼穹
简介: 江青河穿越大周王朝,成了临安县红叶酒肆里一个挣扎求生的杂役。

...
更新时间:2026-01-26 21:37:29
最新章节:第一卷 第346章 州城来人
未婚妻逃婚,我反手娶了千亿女总裁!
作者:被放逐的白云
简介: 【多女主+主角无敌+追夫火葬场+超级爽文】

相恋五年的未婚...
更新时间:2026-01-26 21:37:05
最新章节:第251章:不是真身!
手握空间聊天群,炮灰女配飞升了
作者:过眼云烟风玲
简介: 魏云曦熬夜看文后穿越了,还穿到她正在看的言情仙侠文中,成了第一女配!
更新时间:2026-01-26 19:41:00
最新章节:第1054章 白虎突破
多子多福,从娶妻开始争霸天下
作者:夏去秋来时
简介: 路辰穿越到大夏王朝,成为了大夏王朝的九皇子。

和小说中的穿...
更新时间:2026-01-26 21:24:37
最新章节:第1862章 此人名字之中带有星河二字,该不会……
锦鲤崽崽一挥手,王府气运炸翻全京城啦
作者:枝樊叶茂
简介: 【奶团+锦鲤+拯救全家+团宠】

小锦鲤晶晶被贬入人间历劫后...
更新时间:2026-01-26 21:36:44
最新章节:第一卷 第80章 削官离京
庶子凶猛
作者:扫码卖萌
简介: 下载客户端,查看完整作品简介。
更新时间:2026-01-26 21:24:10
最新章节:第1066章 异姓王