6.RNA Regulation - I
1) Features from conventional RNA-seq
1a) Introduction
在本节中,我们将介绍一系列从二代测序数据出发分析RNA调控的生物信息学方法。基因表达的调控指的是细胞通过改变不同蛋白的表达水平来响应外界的变化。这里的RNA调控指的是在RNA水平上的基因调控。利用二代测序来对RNA调控进行分析,有些利用常规的RNA-seq数据就可以完成,例如:
在不同组织中或不同条件下,真核生物的转录本普遍存在可变剪接(alternative splicing),这就可能导致蛋白产物也相应的发生变化。除此之外,还存在一些跨转录本的剪接事件,导致不同基因的转录本被嵌合到一条RNA中,产生嵌合RNA(chimeric RNA);以及反向剪接(back splicing)事件,使得一部分转录本首尾相连形成环状(circular RNA)等。这些剪接产物有些会被表达出来,直接导致蛋白的改变;也有一些会发挥调控作用。常规RNA-seq数据就可以用来做以上这些剪接事件的分析。
真核生物mRNA的polyA加尾的位置也会有可变性,这一般被称为alternative poly adenylation(APA)。这样产生的转录本3' UTR就会存在序列差异,从而可能导致mRNA翻译效率,稳定性,定位等发生变化,最终调控蛋白的表达。常规RNA-seq数据可以用来做APA的分析,也有专门针对APA分析设计的测序方法,如PAT-seq等。
1b) Pipelines
Multiple features can be derived from conventional RNA-seq data:
Abundance (Expression Level)
Alternative Splicing (AS)
Alternative Polyadenylation (APA)
Chimeric RNA
RNA editing
Mutation (SNV/INDEL of DNA)
Alternative Promoter
Allele-specific expression (ASE)
TE-RNA (Transposable Elements, i.e., Repeats)
mbRNA (microbial RNA)
...
Basic methods of RNA feature calculation for features 2-6 will be introduced in 6.1-6.5 of this book.
Advanced analysis pipelines for more RNA features are introduced in Github by Lulab members:
RNA analyses by YF Jin
RNA/Multi-Omics analyses by YH Tao
1c) Literatures
2) Files Needed
Method 1: Use Docker
docker images的下载链接如附表所示:
(1) 6.1 Alternative Splicing: bioinfo_PartI-PartII-PartIII1-3.tar.gz
(2) 6.2 APA, 6.8 Ribo-seq, 6.9 Structure-seq:bioinfo_tsinghua_6.2_apa_6.3_ribo_6.4_structure.tar.gz
(3) 6.3.Chimeric RNA Detection: bioinfo_chimeric.tar.gz
需要下载原始数据和基因组文件ctat_genome_lib_build_X_docker.zip,ref_genome.fa.star.idx.zip,请把 ref_genome.fa.star.idx 移到 ctat_genome_lib_build_X_docker文件中。下载解压后需要挂载。
(4) 6.4 RNA Editing: bioinfo_rnaeditor.1.8.tar.gz
(5) 6.6.SNV/INDEL Detection: bioinfo_snv.tar.gz
Method 2: Directly Download
如果不使用docker,也可以直接从 Files needed 中的Files/ 路径下的相应文件夹中下载所需要的文件。
Last updated