高血压专题网,内容丰富有趣,生活中的好帮手!
高血压专题网 > 基因组组装程序linux 基因组组装软件SOAPdenovo安装使用

基因组组装程序linux 基因组组装软件SOAPdenovo安装使用

时间:2024-01-16 00:43:52

相关推荐

基因组组装程序linux 基因组组装软件SOAPdenovo安装使用

一.下载并安装这个软件

下载地址进下面,但是下载源码安装总是很困难,我直接下载bin文件可执行程序。

解压进入目录

首先make

然后makeinstall即可

安装总是失败,我也不知道怎么回事,懒得解决了。

直接去我老师那里把这个程序拷贝进来了。

也可以直接下载bin程序

二.准备测试数据

类似于这样的几个文库的左右两端测序数据。

我这里用一个小样本的单端数据做测试

三,参考命令

Youmayrunitlikethis:

总共就四个步骤,介绍如下。

./pregraph_sparse[parameters]

./SOAPdenovo-63mercontig[parameters]

./SOAPdenovo-63mermap[parameters]

./SOAPdenovo-63merscaff[parameters]

i)preparingthepregraph.Thisstepissimilartovelvethforvelvet.

ii)Determiningcontigs.Thisstepissimilartovelvetgforvelvet.

iii)Mappingbackreadsontocontigs.

iv)Assemblingcontigsintoscaffolds.

SOAPdenovo-63mersparse_pregraph-sconfig_file-K45-p28-z1100000000-ooutPG

SOAPdenovo-63mercontig-goutPG

SOAPdenovo-63mermap-sconfig_file-goutPG-p28

SOAPdenovo-63merscaff-goutPG-p28

官网给出的步骤如下

这个命令还需要一个配置文件

max_rd_len=99设置最大reads长度,具体情况具体定义

[LIB]第一个文库数据

avg_ins=225

reverse_seq=0

asm_flags=3

rank=1

q1=runPE_1.fq

q2=runPE_2.fq

[LIB]第二个文库数据

avg_ins=2000

reverse_seq=1

asm_flags=2

rank=2

q1=runMP_1.fq

q2=runMP_2.fq

也可以全部一次性的搞一个命令

all-sconfig_file-K63-R-ograph_prefix1>ass.log2>ass.err

我简单修改了一下参考博客的代码跟官网的代码,然后运行了我自己的代码

/home/jmzeng/bio-soft/SOAPdenovo2-bin-LINUX-generic-r240/SOAPdenovo-127mer

all-sconfig_file-K63-R-ograph_prefix1>ass.log2>ass.err

反正我也不懂,就先跑跑看咯

我选取的是7个单端数据,所以我的配置文件是

max_rd_len=500

[LIB]

avg_ins=225

reverse_seq=0

asm_flags=3

rank=1

p=SRR07.fa

p=SRR07.fa

p=SRR07.fa

p=SRR07.fa

p=SRR07.fa

p=SRR07.fa

p=SRR072029.fa

四.输出数据解读

好像我的数据都比较小,就7个三百多兆的fasta序列,几个小时就跑完啦

四个步骤都有输出数据

好像组装效果惨不忍睹呀!共86万的contig,50多万的scaffold

scaffolds>100 505473 99.60%

scaffolds>500 113523 22.37%

scaffolds>1K 48283 9.51%

scaffolds>10K 0 0.00%

scaffolds>100K 0 0.00%

scaffolds>1M 0 0.00%

这其实都相当于没有组装了,因为我的测序判断本来就很多是大于500的!

可能是我的kmer值选取的不对

Kmer为63跑出来的效果不怎么好,86万的contig,50万的scaffold的

Kmer为35跑出来的效果更惨,203万的contig,近60万的scaffold。

我觉得问题可能不是这里了,可能是没有用到那个20k和3k的双端测序库,唉,其实我习惯了illumina的测序数据,不太喜欢这个454的

感觉组装好难呀,业余时间搞不定呀,希望有高手能一起交流,哈哈,我自己再慢慢来试试。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。