提问

根据基因名批量下载蛋白质序列

生物&化学  / 倒序浏览   © 著作权归作者本人所有

#楼主# 2019-1-23

跳转到指定楼层


使用R语言的biomart包,可以完成这个任务。


```r
# 安装biomaRt包
source("http://bioconductor.org/biocLite.R")
biocLite("biomaRt")
# 加载biomaRt包
library(biomaRt)
# 定义数据库
mart <- useMart("ensembl", dataset="hsapiens_gene_ensembl")
# 根据基因名,批量提取蛋白质序列
seq = getSequence(id = c("BRCA1","TP53"),
                  type = "hgnc_symbol",
                  seqType = "peptide",
                  mart = mart)
# 显示基因名和蛋白质序列
show(seq)
# 默认目录下输出fasta格式seq
exportFASTA(seq, file="seq")
```


转播转播 分享淘帖
回复

使用道具

B Color Link Quote Code Smilies
Archiver|手机版|小黑屋|MakerTime 创客时代  
Powered by Discuz! X3.3  © 2001-2017 Comsenz Inc.