Summary
针对大数据环境下DCNN(Deep convolution neural network)算法中存在网络冗余参数过多、参数寻优能力不佳和并行效率低的问题,提出了大数据环境下基于特征图和并行计算熵的深度卷积神经网络算法——MR-FPDCNN(Deep convolutional neural network algorithm based on feature graph and parallel computing entropy using MapReduce)。首先,该算法设计了基于泰勒损失的特征图剪枝策略FMPTL(Feature map pruning based on Taylor loss),预训练网络,获得压缩后的DCNN,有效减少了冗余参数,降低了DCNN训练的计算代价;其次,提出了基于信息共享搜索策略ISS(Information sharing strategy)的萤火虫优化算法IFAS(The improved firefly algorithm based on ISS),根据“IFAS”算法初始化DCNN参数,实现DCNN的并行化训练,提高网络的寻优能力;最后,在Reduce阶段提出了基于并行计算熵的动态负载均衡策略DLBPCE(Dynamic load balancing strategy based on parallel computing entropy),获取全局训练结果,实现了数据的快速均匀分组,从而提高了集群的并行效率。实验表明,该算法不仅降低了DCNN在大数据环境下训练的计算代价,而且提高了并行系统的并行化性能。
-
Institution中国地质调查局西安地质调查中心; 江西理工大学