5.2.miRNA Targets

1) Background

  • microRNA(miRNA)在于动物、植物、病毒中广泛存在,是一类能够调节基因表达的单链内源非编码小RNA(约22nt),它通过与靶标mRNA的选择性结合抑制蛋白的表达。miRNA在发育、细胞分化、增殖、凋亡、肿瘤转移等许多生物过程中起到了关键作用。

  • 我们可以用实验方法确定miRNA的靶标,如degradome sequencing和针对AGO蛋白的CLIP-seq;也可以用生物信息学方法预测。

  • 目前已有多个数据库整合计算和实验的证据,提供了一些物种中miRNA和相应mRNA靶标的对应关系。

  • 在生物信息分析的实践中,为了获得miRNA的靶标的对应关系,我们可以从已有的数据库中下载,也可以用生物信息学工具预测。本节中我们将对这两种方式进行介绍。

2) Download data from databases

我们这里介绍两个常用的数据资源:

2a) miRTarBase: the experimentally validated microRNA-target interactions database

introduction of miRTarBase

As a database, miRTarBase has accumulated more than three hundred and sixty thousand miRNA-target interactions (MTIs), which are collected by manually surveying pertinent literature after NLP of the text systematically to filter research articles related to functional studies of miRNAs. Generally, the collected MTIs are validated experimentally by reporter assay, western blot, microarray and next-generation sequencing experiments. While containing the largest amount of validated MTIs, the miRTarBase provides the most updated collection by comparing with other similar, previously developed databases.

2b) miRWalk2.0: a comphrehensive atlas of microRNA-target interactions

http://mirwalk.umm.uni-heidelberg.de/

introduction of miRWalk2.0

miRWalk2.0 is a comprehensive archive, supplying the largest available collection of predicted and experimentally verified microRNA(miRNA)-target interactions(~949 million).

3) Prediction using bioinformatics tools

  • miRNA与靶标的相互作用通常是通过碱基的互补配对实现的。除此之外,其他因素也会对miRNA和靶标的相互作用产生影响。

  • 以下列举了一些用于预测miRNA-靶标相互作用的常见特征:

    • miRNA与靶基因的互补性

    • miRNA靶位点在不同物种之间的保守性

    • miRNA-mRNA双链之间的热稳定性

    • miRNA靶位点不会有复杂的二级结构

    • miRNA的5'端于靶基因的结合能力强于3’端

    • ...

  • 本节我们将介绍如何使用mirandapsRobot这两个工具预测给定miRNA的靶标。

3a) getting software & data

文件和软件获取方式

3b) miRanda

miRNA的输入是两个fasta文件,一个对应miRNA序列(这里的miRanda.miRNA.fa),一个对应mRNA序列(这里的miRanda.target_sequence.fa);输出是mRNA上可能的miRNA靶标:

cd /home/test/mirna
miranda miRanda.miRNA.fa miRanda.target_sequence.fa > miRanda.output.txt

运行这一行命令后我们会得到类似下面这样的输出:

   Forward:    Score: 167.000000  Q:2 to 20  R:3340 to 3360 Align Len (18) (83.33%) (94.44%)

   Query:    3' gtCGAAAGTTTTACTAGAGTg 5'
                  |:||||| |||||||||: 
   Ref:      5' taGTTTTCACAATGATCTCGg 3'

   Energy:  -24.540001 kCal/Mol

Scores for this hit:
>gi|29565487|emb|AJ550546.1|    gi|945100|gb|U31226.1|DMU31226    167.00    -24.54    2 20    3340 3360    18    83.33%    94.44%

mirna Target Score Energy-Kcal/Mol Query-Aln(start-end) Subjetct-Al(Start-End) Al-Len Subject-Identity Query-Identity

3c) psRobot

和miRanda类似,psRobotmiRNA的输入是也是两个fasta文件,一个是需要预测其靶标的miRNA(psRobot.miRNA.fa),一个对应mRNA序列(psRobot.target_sequence.fa)。

psRobot_tar -s psRobot.miRNA.fa -t psRobot.target_sequence.fa -o psRobot.output.txt

psRobot.output.txt中,我们将得到类似下面这样的输出:

其中Score对应"target penalty score",这个数值越低,说明是靶标的可能性越大。

>smRNA01    Score: 1.0    tar02

Query:          1 TGACAGAAGAGAGTGAGCAC 20
                  |||||||||||||*||||||
Sbjct:       2387 ACTGTCTTCTCTCTCTCGTG 2368


>smRNA02    Score: 0.8    tar01

Query:          1 TGCCAAAGGAGATTTGCCCTG 21
                  |||||||||||||||||*||:
Sbjct:        963 ACGGTTTCCTCTAAACGAGAT 943


>smRNA02    Score: 1.0    tar01

Query:          1 TGCCAAAGGAGATTTGCCCTG 21
                  |||||||||||||||||*|*|
Sbjct:        906 ACGGTTTCCTCTAAACGAG-C 887


>smRNA02    Score: 0.8    tar01

Query:          1 TGCCAAAGGAGATTTGCCCTG 21
                  |||||||||||||||||||*:
Sbjct:        849 ACGGTTTCCTCTAAACGGGTT 829


>smRNA02    Score: 1.2    tar01

Query:          1 TGCCAAAGGAGATTTGCCCTG 21
                  |||||||||||||*||||||:
Sbjct:        760 ACGGTTTCCTCTATACGGGAT 740


>smRNA02    Score: 0.8    tar01

Query:          1 TGCCAAAGGAGATTTGCCCTG 21
                  ||||||||:|||||||||||:
Sbjct:        627 ACGGTTTCTTCTAAACGGGAT 607

4) Homework

  • 根据提供的miRNA序列和target sequence序列,使用miRanda方法预测miRNA在这些target sequence上的靶标位点 (该作业的文件位于该链接Files needed by this Tutorial中的清华云Bioinformatics Tutorial / Files路径下的相应文件夹下。)。

Last updated