2.4.Integration
这章主要内容是不同类型数据之间的整合分析 (data integration):
1 转录本丰度变化和翻译效率(TE)变化程度之间关系
绘制Log2FoldChange(TE)和Log2FoldChange(RNA-seq)的关系图。
2 转录本结构改变程度和翻译效率TE变化程度之间关系
通过假设检验计算结构改变程度是否影响翻译效率TE变化程度。
结构改变程度和翻译效率TE变化程度关系图。
3 翻译效率变化基因的motif分析
TE上/下调的3'UTR和5'UTR的motif富集。
1) 转录本丰度变化和翻译效率(TE)变化程度之间关系
我们通过散点图表示转录本丰度光照前后变化和翻译效率(TE)光照前后变化程度之间关系,横轴为log2FC(RNA-seq),这里仅比较WT。如下图

1.1) 计算所需文件
2.1.RNA-seq Analysis 中(DESeq)计算得到WT的差异表达数据(使用自己计算得到文件),参考文件/data/TA_QUIZ_RNA_regulation/result/PartI.RNA-seq_analysis/differential_expression/5.DESeq2/wt/wt_rawdata.csv
2.2.Ribo-seq Analysis 中计算得到的差异翻译矩阵(使用自己计算得到文件),参考文件/data/TA_QUIZ_RNA_regulation/result/PartII.Ribo-seq_analysis/7.TE/wt.0-vs-1.TE_new.csv
1.2) 计算过程
这里我们给出参考脚本。
Questions:
1)你得到的转录本丰度变化和翻译效率(TE)变化关系图是怎样的?
2)二者是否存在相关关系,若存在,试解释产生这种相关性的原因。
提示:可以尝试利用Riboseq count matrix计算Riboseq丰度的差异,然后画出了logFC(RNA-seq)和logFC(Ribo-seq)之间的关系。 提示:可思考翻译效率计算方式解释。
2) 结构改变程度是否影响翻译效率TE变化程度
这里我们利用假设检验来检验结构改变程度是否影响翻译效率TE变化程度。
Whether translation up-regulation is related to structural down-regulation
Whether translation down-regulation is related to structural up-regulation
我们需定义结构改变基因为hit level>1且Have structure changed region(|delta gini index|>0.1)。当delta gini index>0.1时为structural up-regulation,当delta gini index<-0.1时为structural down-regulation。
我们需定义翻译效率改变基因为P0.5。
这里我们仅计算WT数据。
2.1) 计算所需文件
2.2.Ribo-seq Analysis计算得到的差异翻译矩阵(使用自己计算得到文件),参考文件/data/TA_QUIZ_RNA_regulation/result/PartII.Ribo-seq_analysis/7.TE/wt.0-vs-1.TE_new.csv
2.3.SHAPE Data Analysis计算得到的结构改变区域数据(使用自己计算得到文件),参考文件/data/TA_QUIZ_RNA_regulation/result/PartIII.SHAPE-seq_analysis/merge/merge_data_WT.csv
2.2) 计算过程
这里我们给出参考脚本。
给出假设检验结果
由此可知,结构变多可导致翻译效率下降。我们接下来用图片表示富集程度。计算脚本参考如下。
结果如下图

3) 翻译效率变化基因的motif分析
本节我们将分别对TE上调和TE下调的所有基因的3‘UTR和5'UTR富集序列motif。
3.1) 数据说明
2.2.Ribo-seq Analysis中计算得到的差异翻译矩阵(使用自己计算得到文件),参考文件/data/TA_QUIZ_RNA_regulation/result/PartII.Ribo-seq_analysis/7.TE/wt.0-vs-1.TE_new.csv
所有基因3’UTR/5'UTR的fastq文件
5'UTR的fastq文件:/data/TA_QUIZ_RNA_regulation/data/gene_list/motif/merge_5UTR.fasta
3'UTR的fastq文件:/data/TA_QUIZ_RNA_regulation/data/gene_list/motif/merge_3UTR.fasta
3.2) 提取所有3’UTR/5'UTR的fastq文件(可跳过)
input:
/data/TA_QUIZ_RNA_regulation/data/ATH/GFF/Ath_genes.gff:参考基因组注释文件/data/TA_QUIZ_RNA_regulation/data/riboshape_liulab_batch4/final.modified_umodified/col_nouv/:包含转录本全长序列信息文件/data/TA_QUIZ_RNA_regulation/data/ATH/GTF/shape_map/result/transcript_exon_location.csv:转录本位置信息文件
output:
merge_5UTR.fasta:汇总的所有5‘UTR的序列信息merge_3UTR.fasta:汇总的所有3’UTR的序列信息
3.3) 提取TE变化区域的3‘UTR、5’UTR序列信息
请自行根据Part II 得到的TE上/下调的gene list,在merge_5UTR.fasta和merge_3UTR.fasta中筛选,最终得到的即为TE变化基因的5'UTR,3‘UTR序列信息。
output:
merge_TE_up_5UTR.fasta/merge_TE_down_5UTR.fasta:汇总的TE上/下调的所有基因5’UTR的fasta信息。参考:/data/TA_QUIZ_RNA_regulation/data/gene_list/motif/TE_DOWN/merge_TE_down_5UTR.fasta;/data/TA_QUIZ_RNA_regulation/data/gene_list/motif/TE_UP/merge_TE_up_5UTR.fastamerge_TE_up_3UTR.fasta/merge_TE_down_3UTR.fasta:汇总的TE上/下调的所有基因3’UTR的fasta信息。参考:/data/TA_QUIZ_RNA_regulation/data/gene_list/motif/TE_DOWN/merge_TE_down_3UTR.fasta;/data/TA_QUIZ_RNA_regulation/data/gene_list/motif/TE_UP/merge_TE_up_3UTR.fasta
MEME在线motif分析
我们利用MEME在线版进行motif分析,地址为http://meme-suite.org/tools/meme。 使用MEME的Motif discovery工具,预测输入序列上的motif信息

我们上传merge_TE_up_5UTR.fasta/merge_TE_down_5UTR.fasta后提交运算。

在得到的结果中我们根据Evalue进行筛选,Sites为找到的motif在几个结构改变区域中出现过,由此可以计算出该motif的覆盖率。我们选择覆盖率较高的motif,这里取大于4%。
4) 更多思考和分析
翻译效率(TE)发生变化的基因的3‘UTR和5'UTR分别富集到的motif是什么?有什么不同?有没有之前的研究的支持?
教程中利用 MEME分析的是 sequence motif,我们能否利用一些预测structure motif 的软件和方法探索一些影响和调控翻译的structure motif?
Last updated
Was this helpful?