基于词频统计的中文分词的研究

费洪晓康松林朱小娟谢文彪

登录

免费注册

赞分享引用

科研之友

微信

新浪微博

Facebook

分享链接

基于词频统计的中文分词的研究

作者：费洪晓康松林朱小娟谢文彪

来源：计算机工程与应用, 2005, (07): 67.

摘要

论文介绍了一个基于词频统计的中文分词系统的设计和实现。通过这个系统,可以将输入的连续汉字串进行分词处理,输出分割后的汉语词串,一般是二字词串,并得到一个词典。词典中不重复地存储了每次处理中得到的词语,以及这些词语出现的频率。这个系统选用了三种统计原理分别进行统计:互信息,N元统计模型和t-测试。文中还对这三种原理的处理结果进行了比较,以分析各种统计原理的统计特点,以及各自所适合的应用场合。

单位
中南大学

分享分享被引浏览

更新时间：2017-03-30 16:04

Similar
Related
Reference

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号