Getorganelle是一款由郁文斌老师开发的一套全新的细胞器基因组组装工具,可以对大规模的细胞器基因组进行快速、准确及自动化组装。本文主要用于对本人在学习使用Getorganelle过程中的一些步骤记录,同时也方便自己下次使用时能更快的熟悉流程。另外,本文所列举的操作步骤只是我个人在使用过程中的操作,本文的内容也是根据自身情况做了一个学习链接中内容的整合,如果大家有需要可以直接看郁文斌老师的微信公众号链接,链接我会放于文末。
【小白安装方法】
1.Miniconda的下载和安装
Miniconda是“迷你版”Anaconda,是一款基于Python环境的管理器,可以非常便捷地安装海量Anaconda或bioconda库中的软件包(下面我会附上一些常用的conda命令)。
安装Miniconda的前提下首先需要在Linux或者MacOs环境下,我这边是Linux环境。
1.1 Miniconda3 下载
官网地址:https://docs.conda.io/en/latest/miniconda.html 如下图所示进行安装包对应链接的复制
复制完链接后:
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
1.2 Miniconda3 安装
sh Miniconda3-latest-Linux-x86_64.sh
# 1) 出现选项时敲击“Enter”查看license agreement;
# 2)查看完license agreement后,需要输入“yes”表示接受才能继续;
# 3)需要确认安装路径,可以使用”Enter键”确认安装在根目录(建议不更改);
# 4)经过1-2分钟安装完成后,需要同意安装器是否初始化miniconda,需要输入“yes”同意后,miniconda的“PATH”才能加入到~/.bashrc ;
# 5)source ~/.bashrc 配置到环境中方便调用。
在source之后可以使用命令 conda -V 查看Minconda3 的版本以用来检验是否安装并配置成功,也可以输入vim ~/.bashrc查看是否配置到环境中,配置成功则如下图
###常用conda命令:
https://zhuanlan.zhihu.com/p/363904808 up主“凄凄惨惨戚戚”已经整理的很全面啦~
2.GetOrganelle的下载安装
# 1)首先在conda中创建一个环境
1 conda create -n getorganelle
效果图:
# 2)激活conda环境
2 conda activate getorganelle
# 3)在conda下载getorganelle
3 conda install getorganelle
效果图:
在下载过程中会为你罗列出需要下载的包以及一些附加的包,全部选择yes,自动下载安装就行,最终出现如下结果
全部完成后可以使用 conda info -e 来查看当前conda中有哪些环境,从下图看出getorganelle环境已经配置好了。
# 4)下载参考序列库,用于质体细胞器组装的参照,我以高等植物质体和线粒体基因组库为例:
4 get_organelle_config.py --add embplant_pt,embplant_mt
其他库如下:
get_organelle_config.py --add embplant_pt #配置高等植物质体基因组库
get_organelle_config.py --add embplant_mt #配置高等植物线粒体基因组库
get_organelle_config.py --add other_pt #配置其他植物质体基因组库
get_organelle_config.py --add fungus_mt #配置真菌线粒体基因组库
get_organelle_config.py --add animal_mt #配置动物线粒体基因组库
get_organelle_config.py --add embplant_nr #配置高等植物核糖体DNA库
get_organelle_config.py --add fungus_nr #配置真菌核糖体DNA库
效果图:
# 5)以郁文斌老师给的无油樟的叶绿体基因组的fastaq文件来查看Getorganelle是否安装成功
下载无油樟叶绿体基因组
#5 wget https://github.com/Kinggerm/GetOrganelleGallery/raw/master/Test/reads/Arabidopsis_simulated.1.fq.gzwget https://github.com/Kinggerm/GetOrganelleGallery/raw/master/Test/reads/Arabidopsis_simulated.2.fq.gz
# 6)输入组装命令,进行demo的运行
6 get_organelle_from_reads.py -1 Arabidopsis_simulated.1.fq.gz -2 Arabidopsis_simulated.2.fq.gz -F embplant_pt -o output -R 10 -t 1 -k 21,45,65,85,105
运行结束后会出现以下文件,命令ls之后所展示的,由此可看出getorganelle安装成功!!!
主要使用到的为两个fasta文件以及一个gfa文件,fasta文件为组装好的叶绿体基因组序列文件,gfa文件可以使用软件Bandage查看叶绿体基因组组装是否成环。成环图如下
大功告成,之后就可以用getorganelle跑自己的叶绿体基因组啦~,在使用的过程中还需要养成一些比如将所需文件都放在同一个文件夹中等一些小习惯,方便自己查找使用。
参考链接:
https://mp.weixin.qq.com/s/NpY7LP5HT_8xq3japmeW1w
https://mp.weixin.qq.com/s/0kIQtQvNQsACTRhdajd2lQ
https://mp.weixin.qq.com/s/hDS3ZDOnIFTBGMVs6-HKQw
https://www.jianshu.com/p/bab69c3889b5
https://github.com/Kinggerm/GetOrganelle