倚天中文网

手机浏览器扫描二维码访问

第十八章 语义识别的难点(第2页)

“智能小语1.0七天后正式上线!”

朱成很快就看到了顶端的信息。

“暂时推出的软件分个人版和企业版。

个人版免费使用,企业版有为期七天的试用期。”

在软件的下方还分别有个简介。

个人版对于生活方面的识别会更加精准,而企业版更注重于会议,可支持多人同时录入,抗噪音能力也更强,并且还可以选择去口语化,使会议内容更接近书面格式。

网页里面的信息不多,很快朱成就看完了。

对于七天后软件的发布十分期待,语音录入可是懒人必备的神器啊,以后估计都不用打字了。

“智能小语,也可以叫语音输入法吧?”

如果不用打字了,是不是意味着键盘也没用了?那笔记本岂不是可以做的更薄?不对,没了键盘不就成了平板么?朱成想到了这一点,感觉自家的电脑城可以多进一些平板电脑了。

在外界因为语音识别而震惊的时候,罗辑所在的机房却只能听到敲键盘的声音。

尽管语音识别已经做了出来,但对于写代码而言意义不大。

真正能将罗辑从这些繁重的任务中解救出来的只有语义识别!

开发语义识别,就如同罗辑预料的那样,并不是一块好啃的骨头。

更何况是中文体系上的语义识别,这比其它语言要难上几个级别。

光是分词这一项,就能让人死掉不少脑细胞。

中文不同于单词组成的拉丁文,拉丁文单词间的空格可以大幅度减少电脑的识别难度,而中文却不行。

在中文里面,一句话就有很多意思。

别说电脑了,有时候就连人也不好分辨。

比如那句著名的“下雨天留客天天留我不留”

,在没有标点符号的情况下,它至少有七种意思。

对于电脑而言,别说这种地狱级的分词,哪怕是一些人们看来再简单不过的句子也很难分辨。

比如“华科大学生前来应聘”

,电脑可能会理解为“华科大学,生前,来应聘”

中文语义识别的第一个难点,也可以说是最大的难点便在这里。

怎样的分词算法才是最完美的?

罗辑在科技树中找到了方案,一种基于统计学模型的算法,构建一个三维矩阵,选取概率最高的一个。

xy轴是任意两个词语的组合,而z轴则是场景状态,根据语气和语态选取的最佳方案。

“不过这需要联网。”

罗辑琢磨了一下,这似乎是目前最好的方案,虽然他的本意是打造一个可用于线下服务的智能,但是以现在的设备存储能力想要存下大量的语料库,根本就是天方夜谭。

电脑肯定是不行的,光脑还差不多。

本月排行榜
本周收藏榜
热门小说推荐
最强透视小仙医

最强透视小仙医

火爆畅销!小农民林昊,因为一场意外,获得黄帝甲乙经,并开启了透视神眼,从此嚣张的人生开启。校花你别过来,我一不小心,看到了你贴身小裤子,绣着一只小兔兔!警花别闹,我真的没在裤子里藏枪,那是天生自带的!小仙子,你身材那么好,我建议你穿无钢圈,E罩内衣!直到此时林昊才发现,原来男人太有魅力也是一种罪过普通书友群天星殿552790021...

逆天神医妃:鬼王,缠上瘾!

逆天神医妃:鬼王,缠上瘾!

王爷,不好了,王妃把整个皇宫的宝贝都给偷了。哦!肯定不够,再塞一些放皇宫宝库让九儿偷!王爷,第一药门的灵药全部都被王妃拔光了。王妃缺灵药,那还不赶紧医圣宗的灵药也送过去!王爷,那个...

向往之新生活

向往之新生活

余瑾睁开眼,发现自己正在拍的向往的生活。...

神秘老公,太危险!

神秘老公,太危险!

不到24小时,她被迫和豪门大Boss领证结婚。你以为这是中头奖?No,她掉进了一个狼坑,爬都爬不出来。...

玄幻之战神归来

玄幻之战神归来

星空大世界,亿万种族林立。人族已经从最巅峰,降到排名二三十位。然而对于人族的畏惧,仇恨,有的种族已经深入灵魂。是谁,挑起人族无量血劫。是谁,要进行种族血战,灭亡整个人族?半步主宰秦阳,在无量血劫之前,亡命敲响了轮回圣钟,竟然回到了少年时期!迷团终将解开。然而,能不能化解死局,还是一个问题!...

上古神门

上古神门

一个流传千百年的血脉契约,一个神秘莫测的上古之门,前赴后继的人们,究竟面对着怎样的秘密。主角最终追寻哥哥的足迹,踏入了上古之门,就此产生了一系列扣人心弦而匪夷所思的故事。...

每日热搜小说推荐