ScholarMate
客服热线:400-1616-289

基于数据流的网页内容分析技术研究

王佰玲; 曲芸; 张永铮; 田志宏
中国知网
北京大学; 中国科学院计算技术研究所

摘要

提出针对网络数据流中活跃信息进行话题相关数据采集与分析方法.首先给出面向论坛话题的定义;然后对网络数据流进行分析、对用户访问行为进行分类;并给出基于数据流的用户行为识别方法及话题相关数据抽取、存储算法;最后给出实验分析,结果表明,所提出的基于数据流的论坛话题数据采集方法能够很好地反映用户行为,并对基于数据流的网络舆情热点话题发现、突发事件检测与实时跟踪等应用提供有利的数据资源.

关键词

网络舆情 热点话题 突发事件 网络数据流 public opinion hot topic emergent event network traffic