ScholarMate
客服热线:400-1616-289

利用频率特征的Trie树索引快速构造算法

张启飞; 吴吉义; 李文娟; 吕红兵; 潘雪增
中国知网
浙江大学; 杭州师范大学

摘要

随着物联网技术的日益成熟和云计算标准的确立以及各种智能终端的大规模出现,互联网数据呈指数增加,为数据建立索引至关重要,为此提出一种基于词频的Trie树索引快速构造算法,首先对索引字符串进行排序,然后对排序文件进行预处理,预处理生成一个三元组,分别由相同字符横向偏移、纵向偏移及字符组成.快速算法依次扫描预处理数据的每一列,根据三元组的偏移跳过相同的字符前缀.实验结果显示,本算法的时间明显少于传统构造算法,优于Aoe的双数组Trie构造算法.

关键词

索引构造 快速算法 Trie树 字符频率 双数组Trie index construction fast algorithm Trie-tree character frequency double-array Trie