基于碎片化阅读的网络百科全书研究
中国知网
-
摘要
随着信息时代的飞速发展,碎片化阅读已成为一种学习的新趋势。在了解HTML语法的同时,利用网络爬虫、Python语言对互联网信息进行大量爬取的同时利用3种筛选方式对数据实现快速搜索匹配,并将信息存入数据库,然后对这些原始信息,通过机器算法与人工审核结合的方式进行二次浓缩加工,最终得出简洁易懂的信息,是提高碎片化学习效率的有效途径。
关键词
碎片化阅读 网络爬虫 数据筛选 二次加工 fragmented reading web crawler data screening secondary processing
