首页 养生问答 疾病百科 养生资讯 女性养生 男性养生

全基因组测序数据获取后应该怎么分析?

发布网友 发布时间:2022-04-25 19:23

我来回答

2个回答

热心网友 时间:2023-10-14 09:35

你需要明确你最终要得到什么输出。
如果想用你现有的数据建模型进行诊断或预测,出门左拐生统和机器学习。
如果想用你现有的数据注释新的基因,出门右拐自然语言处理与基因组组装。
如果想用你现有的数据找疾病相关的基因/通路/网络,出门直走差异表达分析。然而首先你得有一架跑得起来的服务器,
其次,你得有自己看文献、不做伸手党的态度,
最后,如果刚开始接触NGS,建议先从某一类数据(比如RNA-seq)入手,吃透一类前不要动其他数据,不然做出来全是type I error时你是真的会哭的。

热心网友 时间:2023-10-14 09:35

需注意这几点:组装软件在组装过程中,是将测序数据看作来自同一个基因组的前提下进行组装的;如果有外源DNA污染,其中不同来源的DNA中会有不同程度的相似性序列和非相似性序列,这些复杂的关系会对组装软件产生干扰,而软件为保证组装的准确性,只能将可疑的部分切断成不同的碎片序列,导致最终组装结果只能获得碎片化的序列,而失去了组装本身想要达到的效果;如果能够找到足够近缘的参考基因组用于污染分离,也可以对上述的结果进行一定程度的改善。然而,由于外源DNA本身可能携带一定的相似序列,并且目标基因组和参考基因组间会存在潜在的差异,进而导致分离的结果会产生一定的假阳性和假阴性;综上所述,即使是在污染分离后进行组装,也是无法达到纯DNA的组装标准的。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com