ScholarMate
客服热线:400-1616-289

基于Python的涉台大数据获取与处理

杨斌; 李文慧
万方
-

摘要

当前涉台宣传、言论及经济信息发布与共享等,地方事务人员难以完全掌握国家权威部门或其它省市部门对类似问题的法律法规、指示发言等。本文主要研究当前互联网环境下,使用大数据技术对涉台相关事宜进行抓取分析,辅助相关部门和人员有理有据有节的处理相关涉台事件。本文基于Python实现了涉台信息的数据获取、网站信息挖掘、自然语言分词、文本聚类、词云辅助显示等功能,为提高涉台工作的规范性与进一步研究提供基础。

关键词

数据抓取 分词 文本聚类 Python Data Grabbing Word Segmentation Text Clustering