论著
杨澜, 张科, 曾阔, 李晶, 钱倩, 刘俊, 刘京, 李彩霞
法医SNP系谱推断技术可基于SNP芯片数据推断远亲缘关系。为明确基于SNP芯片数据的系谱推断技术对法医微量DNA的检测能力,本研究采用Illumina CGA芯片检测样本,基于DNA投入量、检出率、样本杂合度等指标对样本初步评估,使用IBS、IBD算法进行系谱推断,通过与参考样本比较分型一致性,分析影响推断准确性的因素,确定该技术体系对不同投入量DNA的检测能力。最后通过数据分析的手段,基于信号比等指标筛选低质量数据中的准确SNP分型数据,以提升微量DNA检测数据的使用价值。研究结果发现当DNA投入量高于1.95 ng时,IBS算法推断1~5亲缘关系的平均置信区间准确率为94.33%,IBD可达91.96%;当DNA投入量为781~488 pg时,IBS算法对1~5亲缘关系平均置信区间准确率为23.11%,IBD算法为30.13%;当DNA投入量低于488 pg时,IBS、IBD两种算法均不能进行系谱推断。等位基因插入为影响系谱推断准确性的主要因素,当纯合子错误达到22.5%将使样本无法用于系谱推断。通过信号比筛选,去除信号比大于1.5的杂合子SNP位点,可提高低投入量样本的系谱推断能力。本研究基于Illumina CGA芯片真实家系数据,分析了样本投入量对系谱推断准确性的影响,通过信号比优化SNP数据,提高低投入量样本在系谱推断方面的应用价值。