JBrowse使用说明:参考基因组准备

简介: 准备参考序列注意:这一步必须在后续步骤之前运行。通常,我们需要准备一个物种的基因组fasta文件,当然RNA和protein都是没有问题。通过prepare-refseqs.pl格式化生成的track,这为后续所有文件提供一个坐标,一直放大后参考序列的碱基也会显示出来。

准备参考序列

注意:这一步必须在后续步骤之前运行。

通常,我们需要准备一个物种的基因组fasta文件,当然RNA和protein都是没有问题。通过prepare-refseqs.pl格式化生成的track,这为后续所有文件提供一个坐标,一直放大后参考序列的碱基也会显示出来。生成的track 会为后续所有文件提供一个坐标,一直放大后参考序列的碱基也会显示出来。

主要用到工具是prepare-refseqs.pl,他的用法很多,如下:

prepare-refseqs.pl --gff <GFF file>  [options]
# OR:
prepare-refseqs.pl --fasta <file1> --fasta <file2>  [options]
# OR:
prepare-refseqs.pl --indexed_fasta <file>  [options]
# OR:
prepare-refseqs.pl --twobit <file>  [options]
# OR:
prepare-refseqs.pl --conf <JBrowse config file>  [options]
# OR:
prepare-refseqs.pl --sizes <sizes file>  [options]

更多内容用prepare-refseqs.pl -h查看。

# 以下操作在jbrowse家目录,序列文件根据实际情况修改
bin/prepare-refseqs.pl --fasta ~/lyrata/Sequence/Alyrata_384_v1.fa

这就会在当前生成data文件夹,直接访问I地址所看到的序列就来源于该文件夹。

准备特征序列

特征序列一般以"gff|gbk|bed"格式存放,用于注明序列的信息。所需工具为flatfile-to-json.pl

bin/flatfile-to-json.pl --gff ~/lyrata/Annotation/Alyrata_384_v2.1.gene.gff3 --trackType CanvasFeatures --trackLabel lyrata

结果是在当前目录下生成data,data里包括序列track配置文件. 同样可以用--out参数输出到指定文件夹。

bin/flatfile-to-json.pl --gff ~/Athalina/TAIR10/TAIR10_GFF3_genes.gtf --tracklabel gene --out ./Athaliana/

快捷搜索

除了在JBrowse上通过具体位置定位外,我们还可以0JBrowse上通过基因名快速定位到目标区间,只需要在上两步的基础上运行下面程序即可。

bin/generate-names.pl

推荐阅读:

目录
相关文章
|
6月前
|
存储 自然语言处理 API
LlamaIndex使用指南
LlamaIndex是一个方便的工具,它充当自定义数据和大型语言模型(llm)(如GPT-4)之间的桥梁,大型语言模型模型功能强大,能够理解类似人类的文本。LlamaIndex都可以轻松地将数据与这些智能机器进行对话。这种桥梁建设使你的数据更易于访问,为更智能的应用程序和工作流铺平了道路。
1106 0
|
C语言 Perl 存储
优化求解器之MPS文件的格式简介
在使用MindOpt优化求解器解决实际问题时,其中重要的一环在于如何建立优化模型,以及存储优化模型以便于作为求解器的输入文件。存储优化模型的文件,其关键在于定义一种清晰的格式,用来说明优化模型的数学结构和相关的数据。接下来我们将发布一系列文章,对常见的MPS/LP等格式的模型文件和命名规范进行简要的介绍。
优化求解器之MPS文件的格式简介
|
12天前
基因组组装:Hifiasm 使用教程
基因组组装:Hifiasm 使用教程
24 1
|
1月前
|
网络协议 Linux 网络安全
实验内容参考
实验内容参考
|
8月前
|
数据采集 存储 索引
转录组分析丨一套完整的操作流程简单案例(上)
转录组分析丨一套完整的操作流程简单案例
|
7月前
|
弹性计算 前端开发 Linux
实验手册指导文档
主要介绍实验手册中的基本信息、实验资源配置、实验手册编写三项信息的填写规范,测试并提交审核和操作指南功能的使用方式。
103 0
|
8月前
|
Go 索引 Perl
转录组分析丨一套完整的操作流程简单案例(下)
转录组分析丨一套完整的操作流程简单案例(下)
|
8月前
|
数据可视化 数据挖掘 Go
RNA-seq丨转录组分析标准流程与常用工具
RNA-seq丨转录组分析标准流程与常用工具
|
8月前
|
算法 关系型数据库 数据挖掘
Sentieon | 应用教程: 关于读段组的建议
Sentieon | 应用教程: 关于读段组的建议
42 0
|
9月前
|
数据处理
InVEST模型的下载及入门操作(以InVEST3.13.0为例)
InVEST是一套免费的开源软件模型,是美国自然资本项目组开发的、用于评估生态系统服务功能量及其经济价值、支持生态系统管理和决策的一套模型系统,用于绘制和评估维持和实现人类生活的自然商品和服务。包括商品生产(如食物)、生命维持过程(如水净化)和充实生命的条件(如美丽、娱乐机会)以及选择的保护(如未来使用的遗传多样性)等模块。(翻译自模型官网)
1501 1