文本分类中TF-IDF方法的改进研究

免费注册

科研之友

微信

新浪微博

Facebook

作者：覃世安; 李法运

来源：现代图书情报技术, 2013, (10): 27-30.

摘要

针对TF-IDF在待分类文本类的数量分布不均时提取特征值效果差的问题,提出使用特征值在类间出现的概率比代替特征值在类间出现的次数比以改进TF-IDF算法。实验证明利用改进后的TF-IDF方法提取网页文本特征值,并配合简单累加求和的分类器,使得网页文本分类的准确率有明显提高,且分类速度加快。

更新时间：2018-09-14 14:58

科研之友科研之友机构版科创云

科研成果科研人员科研机构

帮助中心隐私政策服务条款

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号