Summary
一种DNA数据存储的编码解码方法,它包括数据编码和数据解码,其特征是所述的数据编码包含以下步骤:数据压缩,即先将一个或多个电子文档打包成单个文件。数据转码,即压缩文件以二进制形式读取,然后将二进制数据转成整数型数值串。数据加冗余,即利用RS编码系统进行纠错编码,生成数据冗余增加的整数型数值串。数据第二次转码,即将加冗余后的整数型数值串转码成可以用于芯片合成的DNA序列集。数据读取为数据编码的反向过程。与其他算法相比,该框架通过全新的5比特编码框架更好的对接CustomArray高通量合成平台,其编码潜力(Coding potential)为1.67;同时该算法利用TAR和LZMA压缩算法以及RS编码系统的联合使用策略,在降低数据冗余和增加纠错能力之间保持好平衡。