摘要
针对借助TRIZ理论进行发明创新的专利检索需要,提出利用文本挖掘技术实现对中文专利进行面向TRIZ发明原理的自动分类.文中首先对40个基本的TRIZ发明理论进行分析和重新分组,然后依据中科院的ICTCLAS分词系统对专利文本进行分词处理,采用信息增益IG和交叉熵CE特征选择算法进行特征降维,最后使用AlphaMiner基于最流行的SVM、NB和C4.5.分类算法对中文专利进行分类测试,结果表明借助于文本分类技术可以实现依据TRIZ发明原理对中文专利自动分类.
-
单位哈尔滨理工大学; 东北林业大学