UCSC genome browser session
能方便的将测序数据结果的track文件展现出来,有一些文章也要求有全基因组测序数据的投稿,要附带session链接,如 Nucleic Acids Research (NAR)
本篇blog就介绍一下如何在UCSC genome browser中制作session
数据存储
将数据存储到一些网站上,能够获取到public link,将public link交付给UCSC genome browser
我用的是CyVerse
将本地的文件上传到该数据库后,就可以获取public link
UCSC: Where to host your data?
UCSC genome browser
创建一个账号
这里就不详细介绍了
创建 session
首先 My Data
->My Sessions
进入session界面,然后你会看到Save Settings
,主要修改就是name。然后记得submit。submit
一定要记得,后续很多操作都要submit。及时提交是个好习惯。另外,如果你发现有些步骤你没有保存,可以通过回退网页的方式,回到你之前的操作,再进行保存,这样也是可以的。
!!! 后续所有的操作,都是针对目前的session进行的。不同session间的,track、collection都不互通。离开session前,记得保存你的操作。
上传track
通过 my Data
->Custom Tracks
进入到track上传界面
在新界面中点击add custom tracks
,进入到上传界面
在这里,就涉及到了,上传track的信息。从图上可以看到,track文件的格式,已经有了限定。
另外,也可以对其他属性进行设置,官网也对track line
做了注释: Defining track lines for annotations
格式为,A track line begins with the word **track**, followed by one or more attribute=value pairs.
(每条track记录,以track开头,后跟属性的键值对)
browser position chr21:33,031,597-33,041,570
track type=bigBed name="bigBed Example One" description="A bigBed file" bigDataUrl=http://genome.ucsc.edu/goldenPath/help/examples/bigBedExample.bb
主要的属性有:
- name
- description
- type
- visibility. hide, dense, full, pack, squish
- color=<RRR,GGG,BBB>
- bigDataUrl. for BAM, CRAM, bigBed, bigWig or VCF tracks.
当你熟悉了这些后,再上传数据前,你可以先整理数据,将属性设置好,并将这些设置写入一个文本。
上传时,直接上传一个文本就可以了。
建立track collection
当你的track很多时,就会有分组的想法,并且,有时候还需要将多个track纵坐标设成一致的,类似IGV里面的group autoscale
,以方便比较变化差异。
track collection可以很好地解决这个问题。
如上图,左侧显示可获得的track(上一步上传的),右侧是collection界面,点解 Add Collection
,新增collection,并设置属性
选择一个collection,然后在左侧的文件中,选择要添加的track,加入到该collection
建立好所有的collection,以及分配好文件,就可以GO到主界面检查效果
配置track
你可以注意到,主界面的下方,就有你新建的collection的列表,点击collection,进入到collection的设置界面
可以设置track高度,透明度等等。如果需要的话,把Data view scaling
选定为group auto-scale。
!最后记得submit
点击主界面上的configure,或者View
->Configure Browser
进入到整体的设置界面
最上方是主要是对图像宽度,标签字体大小的设置,下面就是对你上传的track、建立的collection以及UCSC genome browser自己的数据资源,进行设置。具体设置,大家可自行摸索。
!记得submit
保存session
当你完成好设置,回到主页面,看着自己做出来的漂亮track图,不要忘记保存session。
方法和创建session一致,用相同的名字进行取代,或者另存为一个session。
UCSC小工具
除了上面说的外,在菜单栏View
下面也有一些使用的小工具
你可以用 PDF 保存图像,用 DNA 获取当前区域的基因组序列。