ScholarMate
客服热线:400-1616-289

一种改进距离的局部线性嵌入算法的基因表达谱数据分类

蔡先发; 韦佳; 文贵华; 李洁
中国知网
广东药学院; 华南理工大学

摘要

针对基因表达谱样本数据少、维度高、噪声大的特点,维数约减十分必要。由于基因表达谱数据是以一种高维非线性的向量存在,传统的降维方法使得一些本质维数较低的高维数据无法投影到低维空间中,为此本文引入一种改进距离的局部线性嵌入(LLE)算法对其进行降维。由于原始的LLE方法对近邻个数参数非常敏感,为了增强算法对近邻参数的鲁棒性,文中提出了一种改进距离来度量样本点之间的距离,从而降低了样本点分布不均匀对算法的影响。实验结果表明,改进距离的LLE方法能够有效地提取分类特征信息,并能够在保持较高的分类正确率的前提下大幅度地降低基因数据的维数。

关键词

局部线性嵌入 基因数据分类 特征提取 改进距离 Locally linear embedding(LLE) Gene data classification Feature extraction Improved distance