论文发表指导_期刊投稿推荐_期刊论文发表咨询_职称驿站

论文发表指导,期刊推荐,国际出版

职称驿站学术导航
关闭职称驿站导航

论文发表职称晋升 全方位咨询服务

学术出版,国际教著,国际期刊,SCI,SSCI,EI,SCOPUS,A&HCI等高端学术咨询

计算机信息处理论文浅谈中文信息处理的主流技术

来源:职称驿站所属分类:信息安全论文
发布时间:2015-12-09浏览:22次

   论文关键词:信息处理,N元模型,语音识别,句法分析,计算机信息处理论文

  论文摘要:本文是计算机信息处理论文,分析了中文信息处理的主流技术,尤其是几个重要的部分,即N元模型、语音识别和句法分析技术。

  一、中文信息处理的特点

  (一)汉字的特殊性

  我们都知道,英语在计算机信息处理方面的优势就是其字母数量有限,因而可以很容易的进行输入输出以及信息的加工和处理,而中文的汉字则数量庞大,且字形相对复杂,这就给汉字的编码带来了不小的困扰。因此我们根据汉字信息处理过程中的不同要求对汉字进行了不同形式的编码,总结来说有以下几种方案,即汉字输入编码,汉字标准编码,汉字内码和汉字形码。

  (二)书面汉语的特殊性

  汉语的另一个特征是在书面表达中,词语和记号之间没有明显的分隔标记,这就使自动分词在书面汉语分析中成立一个难题。分词需要将连续的字按照一定的规范进行有序的组合,比较英文我们会发现,英文单词之间都是用空格来做分隔符,而中文则是习惯通过字、整句以及段落进行简单的划分,而这其中的一个难点就是对词语的划分,我们都知道,英语中也有短语划分的问题,但是由于中文的词语远比英语的数量和范围要庞大,因而处理起来更为困难。

  (三)汉语语音的特殊性

  在语音方面,汉语的特征是音节结构相对简单,音节划分界限比较清晰,但是声调和变调是中文与英文的显着区别,因而在语音识别和语音合成方面来讲这是一个劣势,但是总体上来说汉语语音的处理比之其他方面来说还是相对容易的。

  (四)汉语语法的特殊性

  在语法方面,汉语词汇的句法功能相对来说难以判断,这与英语语言上的多变形态有着截然不同的表现。汉语主要依靠词序和虚词来表达不同的含义,因此如果不能很好的掌握句法,就特别容易产生歧义,因此汉语语句自动分析这一重要技术是一项难以攻克的技术。

  二、中文信息处理的若干技术

  (一)N元模型

  设wi是文本中的任意一个词,如果已知它在该文本中的前两个词wi-2w-1,便可以用条件概率P(wi|wi-2w-1)来预测wi出现的概率。这就是统计语言模型的概念。一般来说,如果用变量W代表文本中一个任意的词序列,它由顺序排列的n个词组成,即W=w1w2。。。wn,则统计语言模型就是该词序列W在文本中出现的概率P(W)。利用概率的乘积公式,P(W)可展开为:P(W)=P(w1)P(w2|w1)P(w3|w1 w2)。。。P(wn|w1 w2。。。wn-1)不难看出,为了预测词w n的出现概率,必须知道它前面所有词的出现概率。从计算上来看,这种方法太复杂了。如果任意一个词wi的出现概率只同它前面的两个词有关,问题就可以得到极大的简化。这时的语言模型叫做三元模型(tri-gram):P(W)≈P(w1)P(w2|w1)∏i(i=3,。。。,nP(wi|wi-2w-1)

  《计算机周刊》Computer Weekly(周刊)曾用刊名:上海微型计算机;计算机,1982年创刊,本刊集权威性、理论性与专业性于一体,具有很高的学术价值,是作者科研、晋级等方面的权威依据,欢迎广大作者积极撰写论文,踊跃投稿!征稿对象:全国高等学校、科研及推广院所站、各级党政机关、企事业单位的广大专家学者、工程技术人员、硕士博士研究生、管理人员等。《计算机周刊》主管单位:长江计算机(集团)公司,主办单位:长江计算机(集团)公司,国内统一刊号:31-1427/TP,国际标准刊号:1007-466X

搜狗截图15年12月09日1047_13.png

《计算机信息处理论文浅谈中文信息处理的主流技术》

本文由职称驿站首发,您身边的高端学术顾问

文章名称: 计算机信息处理论文浅谈中文信息处理的主流技术

文章地址: https://m.zhichengyz.com/p-29719

相关内容推荐
开源sci一般学校认可吗?开源不等于黑名单
通讯作者算不算排序
论文三大网站是哪三个
土壤相关的SCI期刊推荐
论文他引率,多少才正常?
论文过审必备!技术检查全攻略
一个ei会议能录用几篇?怎么查询了解
32开390页大概多少字
未能解决您的问题?马上联系学术顾问

未能解决您的问题?

不要急哦,马上联系学术顾问,获取答案!

免费获取
扫码关注公众号

扫码关注公众号

微信扫码加好友

微信扫码加好友

职称驿站 www.zhichengyz.com 版权所有 仿冒必究
冀ICP备16002873号-3