ScholarMate
客服热线:400-1616-289

采用无标注语料的动词和形容词主观性评级

徐戈; 蒙新泛; 王厚峰
中国知网
北京大学; 闽江学院; 北京大学计算语言学研究所

摘要

为了自动区分中文主观词和客观词,采用主观性线索和汉字的主观性两种手段对动词和形容词进行主观性度量.主观性的线索进一步被分成级差(gradability)线索和主体(subject)线索;根据这些线索,使用基于图的算法进行评级(ranking).在汉语主观性词表构建中,提出使用主体线索和汉字主观性.5个标注人员对随机选择的500个单词进行主观性标注,据此构建主客观标准集,并将其用于各种设置下的实验结果评估.实验结果显示,当被标注的单词出现频率较高时,所提出的方法能够超过或者匹配人工标注.此外,尽管文中只使用了无标注的数据,但还有更多的先验知识(如语义词典等)可以被引入到该方法中.

关键词

主观性 无标注语料 级差线索 主体线索 评级 汉字主观性 subjectivity unlabeled corpus gradability clue subject clue ranking subjectivity of Chinese characters