摘要
针对现有基于频繁项挖掘的协议字段格式划分方法以字节作为划分的基本单位,不能完全适用于二进制私有协议数据,以及在挖掘得到频繁项集合后缺乏有效的格式划分定界方法的问题,该文提出了一种改进的基于频繁项挖掘的协议字段格式划分方法.通过构建半字节为最小长度的、长度逐渐增加的最大项集,并采用常见度和位置熵指标进行频繁项筛选,最后基于正向最大匹配进行投票以及对投票结果进行筛选来完成格式划分.仿真实验结果表明,该文方案能够得到比传统的AutoRe Engine方案更高的精确度.
-
单位东南大学