2.4.Integration

这章主要内容是不同类型数据之间的整合分析 (data integration):

  • 1 转录本丰度变化和翻译效率(TE)变化程度之间关系

    • 绘制Log2FoldChange(TE)和Log2FoldChange(RNA-seq)的关系图。

  • 2 转录本结构改变程度和翻译效率TE变化程度之间关系

    • 通过假设检验计算结构改变程度是否影响翻译效率TE变化程度。

    • 结构改变程度和翻译效率TE变化程度关系图。

  • 3 翻译效率变化基因的motif分析

    • TE上/下调的3'UTR和5'UTR的motif富集。

1) 转录本丰度变化和翻译效率(TE)变化程度之间关系

我们通过散点图表示转录本丰度光照前后变化和翻译效率(TE)光照前后变化程度之间关系,横轴为log2FC(RNA-seq),这里仅比较WT。如下图

1.1) 计算所需文件

  • 2.1.RNA-seq Analysis 中(DESeq)计算得到WT的差异表达数据(使用自己计算得到文件),参考文件/data/TA_QUIZ_RNA_regulation/result/PartI.RNA-seq_analysis/differential_expression/5.DESeq2/wt/wt_rawdata.csv

  • 2.2.Ribo-seq Analysis 中计算得到的差异翻译矩阵(使用自己计算得到文件),参考文件/data/TA_QUIZ_RNA_regulation/result/PartII.Ribo-seq_analysis/7.TE/wt.0-vs-1.TE_new.csv

1.2) 计算过程

这里我们给出参考脚本。

Questions:

  • 1)你得到的转录本丰度变化和翻译效率(TE)变化关系图是怎样的?

  • 2)二者是否存在相关关系,若存在,试解释产生这种相关性的原因。

提示:可以尝试利用Riboseq count matrix计算Riboseq丰度的差异,然后画出了logFC(RNA-seq)和logFC(Ribo-seq)之间的关系。 提示:可思考翻译效率计算方式解释。

2) 结构改变程度是否影响翻译效率TE变化程度

这里我们利用假设检验来检验结构改变程度是否影响翻译效率TE变化程度。

  • Whether translation up-regulation is related to structural down-regulation

  • Whether translation down-regulation is related to structural up-regulation

我们需定义结构改变基因为hit level>1且Have structure changed region(|delta gini index|>0.1)。当delta gini index>0.1时为structural up-regulation,当delta gini index<-0.1时为structural down-regulation。

我们需定义翻译效率改变基因为P0.5。

这里我们仅计算WT数据。

2.1) 计算所需文件

  • 2.2.Ribo-seq Analysis计算得到的差异翻译矩阵(使用自己计算得到文件),参考文件/data/TA_QUIZ_RNA_regulation/result/PartII.Ribo-seq_analysis/7.TE/wt.0-vs-1.TE_new.csv

  • 2.3.SHAPE Data Analysis计算得到的结构改变区域数据(使用自己计算得到文件),参考文件/data/TA_QUIZ_RNA_regulation/result/PartIII.SHAPE-seq_analysis/merge/merge_data_WT.csv

2.2) 计算过程

这里我们给出参考脚本。

给出假设检验结果

由此可知,结构变多可导致翻译效率下降。我们接下来用图片表示富集程度。计算脚本参考如下。

结果如下图

3) 翻译效率变化基因的motif分析

本节我们将分别对TE上调和TE下调的所有基因的3‘UTR和5'UTR富集序列motif。

3.1) 数据说明

  • 2.2.Ribo-seq Analysis中计算得到的差异翻译矩阵(使用自己计算得到文件),参考文件/data/TA_QUIZ_RNA_regulation/result/PartII.Ribo-seq_analysis/7.TE/wt.0-vs-1.TE_new.csv

  • 所有基因3’UTR/5'UTR的fastq文件

    • 5'UTR的fastq文件:/data/TA_QUIZ_RNA_regulation/data/gene_list/motif/merge_5UTR.fasta

    • 3'UTR的fastq文件:/data/TA_QUIZ_RNA_regulation/data/gene_list/motif/merge_3UTR.fasta

3.2) 提取所有3’UTR/5'UTR的fastq文件(可跳过)

input:

  • /data/TA_QUIZ_RNA_regulation/data/ATH/GFF/Ath_genes.gff:参考基因组注释文件

  • /data/TA_QUIZ_RNA_regulation/data/riboshape_liulab_batch4/final.modified_umodified/col_nouv/:包含转录本全长序列信息文件

  • /data/TA_QUIZ_RNA_regulation/data/ATH/GTF/shape_map/result/transcript_exon_location.csv:转录本位置信息文件

output:

  • merge_5UTR.fasta:汇总的所有5‘UTR的序列信息

  • merge_3UTR.fasta:汇总的所有3’UTR的序列信息

3.3) 提取TE变化区域的3‘UTR、5’UTR序列信息

请自行根据Part II 得到的TE上/下调的gene list,在merge_5UTR.fasta和merge_3UTR.fasta中筛选,最终得到的即为TE变化基因的5'UTR,3‘UTR序列信息。

output:

  • merge_TE_up_5UTR.fasta/merge_TE_down_5UTR.fasta:汇总的TE上/下调的所有基因5’UTR的fasta信息。参考:/data/TA_QUIZ_RNA_regulation/data/gene_list/motif/TE_DOWN/merge_TE_down_5UTR.fasta;/data/TA_QUIZ_RNA_regulation/data/gene_list/motif/TE_UP/merge_TE_up_5UTR.fasta

  • merge_TE_up_3UTR.fasta/merge_TE_down_3UTR.fasta:汇总的TE上/下调的所有基因3’UTR的fasta信息。参考:/data/TA_QUIZ_RNA_regulation/data/gene_list/motif/TE_DOWN/merge_TE_down_3UTR.fasta;/data/TA_QUIZ_RNA_regulation/data/gene_list/motif/TE_UP/merge_TE_up_3UTR.fasta

MEME在线motif分析

我们利用MEME在线版进行motif分析,地址为http://meme-suite.org/tools/meme。 使用MEME的Motif discovery工具,预测输入序列上的motif信息

我们上传merge_TE_up_5UTR.fasta/merge_TE_down_5UTR.fasta后提交运算。

在得到的结果中我们根据Evalue进行筛选,Sites为找到的motif在几个结构改变区域中出现过,由此可以计算出该motif的覆盖率。我们选择覆盖率较高的motif,这里取大于4%。

4) 更多思考和分析

  • 翻译效率(TE)发生变化的基因的3‘UTR和5'UTR分别富集到的motif是什么?有什么不同?有没有之前的研究的支持?

  • 教程中利用 MEME分析的是 sequence motif,我们能否利用一些预测structure motif 的软件和方法探索一些影响和调控翻译的structure motif?

Last updated

Was this helpful?