X 注册生物链会员

扫描二维码关注生物链
推荐:二代测序数据常用的4种pipeline浅谈
来源: 科学网   发布者:张荐辕   日期:2015-07-10  
测序的发展以及成本的降低迅速地推动了微生物生态的研究和发展,使之在过去的十年里成为一个研究热点。 下面就介绍下目前用于二代数据分析常用的pipeline: 1. Mothur (http://www.mothur.org/) 由密西根大学(University of Michigan) 的Dr. Patrick Schloss领衔的团队开发的,其团队还开发有DOTUR和SONS软件。Mothur的特点是可以本地运行,相对易学,有非常详细的SOP,比较适用于新入门的研究人员。且其团队每隔一定时间会更新软件的版本,增加一些新的命令,在二代测序数据分析方面有较强的竞争力。配合一些数据可视化的软件,诸如R语言,SPSS,Origin, Sigmaplot等,就可以做出很多高质量的图。 2. QIIME (http://qiime.org/) 由科罗拉多大学博尔德分校(Univeristy of Colorado at Boulder) 的Professor Rob Knight领衔的团队开发的,其全称是Quantitive Isights Into Microbial Ecology, 该软件的特点是安装及命令较Mothur要繁琐一些,运用软件的自由度也高一些,但是其融合了一些统计分析的命令,且可以直接生成一些可直接用于发表的高质量的图。此外,我想补充一点的是,该校是坐落在山脚下的一所非常美丽的学校。 3.Uparse (http://drive5.com/usearch/manual/uparse_pipeline.html) 由来自Tiburon, California的独立研究员Robert C Edgar开发的,他还开发了一些非常优秀实用的软件(http://www.drive5.com/),Uparse的特点就是数据处理速度快,但是难免出错的概率就会大一些。对于大量数据的处理,有一定的帮助。 4. RDP pipeline (http://pyro.cme.msu.edu/) 由密西根州立大学的美国科学院院士James M. Tiedje以及Jame R. Cole领衔的团队开发的,RDP的特征是在线的,对于国外用户,要首先将自己的数据传输到他们在美国的服务器上,然后才能开始分析,这是制约利用他们这个pipeline分析数据的主要因素,但是近年来他们也在考虑做一些命令,以实现在本地的运行及处理数据。该团队还做了一些功能基因的数据库以及分析流程 (http://fungene.cme.msu.edu/),推动了功能基因多样性的研究和发展。这个团队里面有两个非常厉害的中国人,Qiong Wang和Bneli Chai。 此处,分享一个运用Uparse和QIIME来进行分析的pipeline (http://www.brmicrobiome.org/#!16s-profiling-pipeline-new-illumina/czxl)。 总结,Mothur和QIIME还是相对用得较多的软件来分析二代测序的数据,但是各有千秋,没有谁比谁更好这一说。这里引用一下胡兴伟在科学网上发表的一篇博文(http://blog.sciencenet.cn/blog-871198-677805.html),以供大家学习。同时也有很多的工作人员来解决研究人员在分析过程中遇到的问题,bug(有专门的论坛供研究人员交流)以及软件的更新,举办workshop等等来推动这些软件的应用和发展。
相关新闻