基于碎片化阅读的网络百科全书研究

摘要

随着信息时代的飞速发展,碎片化阅读已成为一种学习的新趋势。在了解HTML语法的同时,利用网络爬虫、Python语言对互联网信息进行大量爬取的同时利用3种筛选方式对数据实现快速搜索匹配,并将信息存入数据库,然后对这些原始信息,通过机器算法与人工审核结合的方式进行二次浓缩加工,最终得出简洁易懂的信息,是提高碎片化学习效率的有效途径。

关键词

碎片化阅读网络爬虫数据筛选二次加工 fragmented reading web crawler data screening secondary processing