一种DNA数据存储编码解码方法

Authors:樊隆; 蒋浩君; 刘家栋; 王建鹏; 盛夏; 张丽华; 吴政宪; 柳振宇
Source:2017-07-25, 中国, CN201710611123.2.

Summary

一种DNA数据存储的编码解码方法,它包括数据编码和数据解码,其特征是所述的数据编码包含以下步骤:数据压缩,即先将一个或多个电子文档打包成单个文件。数据转码,即压缩文件以二进制形式读取,然后将二进制数据转成整数型数值串。数据加冗余,即利用RS编码系统进行纠错编码,生成数据冗余增加的整数型数值串。数据第二次转码,即将加冗余后的整数型数值串转码成可以用于芯片合成的DNA序列集。数据读取为数据编码的反向过程。与其他算法相比,该框架通过全新的5比特编码框架更好的对接CustomArray高通量合成平台,其编码潜力(Coding potential)为1.67;同时该算法利用TAR和LZMA压缩算法以及RS编码系统的联合使用策略,在降低数据冗余和增加纠错能力之间保持好平衡。