Bioinformatics Tutorial
Files Needed
  • Getting Started
    • Setup
    • Run jobs in a Docker
    • Run jobs in a cluster [Advanced]
  • Part I. Programming Skills
    • 1.Linux
      • 1.1.Basic Command
      • 1.2.Practice Guide
      • 1.3.Linux Bash
    • 2.R
      • 2.1.R Basics
      • 2.2.Plot with R
    • 3.Python
  • PART II. BASIC ANALYSES
    • 1.Blast
    • 2.Conservation Analysis
    • 3.Function Analysis
      • 3.1.GO
      • 3.2.KEGG
      • 3.3.GSEA
    • 4.Clinical Analyses
      • 4.1.Survival Analysis
  • Part III. NGS DATA ANALYSES
    • 1.Mapping
      • 1.1 Genome Browser
      • 1.2 bedtools and samtools
    • 2.RNA-seq
      • 2.1.Expression Matrix
      • 2.2.Differential Expression with Cufflinks
      • 2.3.Differential Expression with DEseq2 and edgeR
    • 3.ChIP-seq
    • 4.Motif
      • 4.1.Sequence Motif
      • 4.2.Structure Motif
    • 5.RNA Network
      • 5.1.Co-expression Network
      • 5.2.miRNA Targets
      • 5.3. CLIP-seq (RNA-Protein Interaction)
    • 6.RNA Regulation - I
      • 6.1.Alternative Splicing
      • 6.2.APA (Alternative Polyadenylation)
      • 6.3.Chimeric RNA
      • 6.4.RNA Editing
      • 6.5.SNV/INDEL
    • 7.RNA Regulation - II
      • 7.1.Translation: Ribo-seq
      • 7.2.RNA Structure
    • 8.cfDNA
      • 8.1.Basic cfDNA-seq Analyses
  • Part IV. MACHINE LEARNING
    • 1.Machine Learning Basics
      • 1.1 Data Pre-processing
      • 1.2 Data Visualization & Dimension Reduction
      • 1.3 Feature Extraction and Selection
      • 1.4 Machine Learning Classifiers/Models
      • 1.5 Performance Evaluation
    • 2.Machine Learning with R
    • 3.Machine Learning with Python
  • Part V. Assignments
    • 1.Precision Medicine - exSEEK
      • Help
      • Archive: Version 2018
        • 1.1.Data Introduction
        • 1.2.Requirement
        • 1.3.Helps
    • 2.RNA Regulation - RiboShape
      • 2.0.Programming Tools
      • 2.1.RNA-seq Analysis
      • 2.2.Ribo-seq Analysis
      • 2.3.SHAPE Data Analysis
      • 2.4.Integration
    • 3.RNA Regulation - dsRNA Code
    • 4.Single Cell Data Analysis
      • Help
  • 5.Model Programming
  • Appendix
    • Appendix I. Keep Learning
    • Appendix II. Databases & Servers
    • Appendix III. How to Backup
    • Appendix IV. Teaching Materials
    • Appendix V. Software and Tools
    • Appendix VI. Genome Annotations
Powered by GitBook
On this page
  • 1) Setup OS
  • 2) Learn an Text Editor
  • Vim
  • 3) Homework
  • Have a break

Was this helpful?

Edit on GitHub
  1. Getting Started

Setup

工欲善其事,必先利其器

PreviousGetting StartedNextRun jobs in a Docker

Last updated 3 months ago

Was this helpful?

1) Setup OS

  • 由于历史原因,就生物信息数据分析而言,linux操作系统的软件生态比windows好得多,有很多生物信息的工具只支持linux系统。所以熟悉linux操作系统的使用对于学习生物信息是很有必要的。

  • 除了需要linux环境,在我们的学习中还会遇到各种软件的依赖。鉴于在自己的笔记本上使用linux环境的同学不多,为了给大家提供linux的操作环境,并且节约一些软件安装的时间,我们提供了两种解决方案:

    • (1) Working in a Docker

    • (2) Working in a Cluster for advanced users

2) Learn an Text Editor

学会用文本编辑器(Editor)编辑和存储程序编码是开始工作的第一件事。一些常用的编辑器在Windows,MacOS,Linux等系统里都有。

例如,网上有人推荐的 7 Best Code Editors For Mac:

  1. CodeLobster — best of the best (我不这么认为)

  2. Typora — best markdown editor

  3. Codeanywhere — best collaboration features

  4. Visual Studio Code — best for full stack devs (recommended theme: One Dark Pro, Github theme)

  5. JetBrains Fleet — best up-and-coming alternative

  6. Sublime Text — best for beginners

  7. Brackets — best for web developers

上述都是在窗口界面下运行的图形界面的编辑器,例如 Visual Studio Code (VS Code)的示例如下图(VS Code还推出了AI 插件 Copilot):

此外,我们这里特别介绍一下在 Terminal 下最常用的 Vim。

Vim

"It is hard to learn, but incredible to use. "

Vim也有Windows和MacOS的版本,可以兼容鼠标,例如 MacVim。

Vim 的更重要的应用场景是在Linux Terminal中的使用(Linux系统自带 Vim 无需单独安装),它不依赖鼠标,完全靠键盘就可以操作各种编辑,主要就是模式之间的切换,如下图所示:

Tips: 如果你是第一次使用 Vim,发现熟悉的 Terminal 不见了不要慌,按 :q 退回即可。 具体操作请参见 这里。

You can learn vim progressively, and it will be your last text editor. There isn’t any better text editor that I know of. It is hard to learn, but incredible to use.I suggest you teach yourself Vim in 4 steps:

  1. Survive

  2. Feel comfortable

  3. Feel Better, Stronger, Faster

  4. Use superpowers of vim

3) Homework

  1. 在Windows、MacOS下安装和练习使用Typora, Sublime Text等编辑器。

  2. 安装和学习使用Docker (Install Docker, load an image and create a container)。利用 Mac 和 Windows 系统自带的录屏工具录制一个不超过15秒的使用录屏(示例:Run Jobs in a Docker 中的动画)。请用自己的姓名的拼音命名 container,例如 zhangsan_linux,否则判零分。

  3. 在Docker的Linux Terminal里面打开 Vim,练习完全通过键盘来完成各种编辑操作。

注: 作业提交的文件中可以是一系列关键步骤的截图(注意要标好顺序并配文字解释),也可以是一个不超过15秒的录屏文件,建议录屏文件上传清华云(或者其他云)提供一个可观看的共享链接即可。

Have a break

Craig Venter & Francis Collins 人类基因组计划竞赛的故事

2000年6月26日,美国总统Clinton等六国领导人共同宣布人类基因组计划的草图完成。在新闻发布会现场,站在Clinton身侧的两位“科研明星”分别是人类基因组计划的官方领导人Collins和Celera 公司的领导人Venter。

此后,这两个人还共同出现在《时代》杂志的封面上。作为一个民间团体,并且是一个饱受争议的民间团体的领导人,Venter能够获得和政府资助的Collins平起平坐的机会。不论围绕在他身上的争议如何,正是由于他引发的这场“科研竞赛”,使原本预计 15年才能完成的计划,整整提前3年即告完成。

Francis Collins和Craig Venter两位杰出科学家身上的标签并不仅限于“人类基因组计划”。

Craig Venter

Craig Venter是一位极富有商业头脑的“科学狂人”,在Celera 公司之后,他又先后创建了合成基因组Synthetic Genomics 公司、J. Craig Venter 研究院和Human Longevity公司。他带领团队带领团队成功地把一个合成的基因组转移到了细胞里,这是全球第一个。 如今他也正在向延长人类寿命发出挑战。

Craig Venter 这位科学天才并不是一路优秀着长大的。他高中时期学习成绩并不理想,经常考C和D。据他自己所述,对他人生改变最大的是越南战争。

20岁的时候,他在越战中的海军医院服役,负责对从前线回来的受伤战士进行分组,他能决定哪些可以得到优先治疗。战争是残酷的,生命是如此脆弱,这种决定这谁能活谁会死的事情却让他承受了很大的心理压力,甚至多次想要自杀来逃避……在最艰苦、最恶劣的环境下,他对医学和科学开始产生兴趣。战场上生命如此廉价,这个二十岁的少年开始思考生命的意义,在越战的硝烟与血腥中他树立了自己人生的第一个小目标:如果活着离开越南就去研究生死。

经历了战争的九死一生之后, Craig Venter,这个当初高中都差点无法毕业的小伙子居然用6年是将拿到了生理和药理学的双料博士学位

Francis Collins

Francis Collins是优秀的医学-遗传学家,第一个受到两任美国总统(奥巴马和唐纳德川普)直接任命的美国国立卫生研究院院长(NIH director),领导美国精准医疗计划,向人类健康发出新挑战。

Francis Collins是美国国立卫生研究院院长(NIH director),领导人类基因组计划,并发现了多种疾病基因。

去年The David Rubenstein Show采访了 Francis Collins 。Rubenstein问他当年领导人类基因组计划的意义,他说到这些年癌症治疗的变化,个体化用药(personalized medicine),还举了个人例子。他做了基因测序,发现自己糖尿病的风险比普通人高许多,但父母都没有糖尿病,于是改变饮食增加运动,减了35磅体重,变成了另一个人。

Francis Collins是一位低调的科学家,但是他的两大爱好众所周知。他非常喜爱摇滚音乐,他和NIH同事组织了一个摇滚乐队,将生物研究的日常写进他们的歌词里面。摩托骑行是他的另一大爱好,据他自己所述,骑摩托车对他而言是一种享受生命的感觉,这种感觉难以用别的方式来代替。

⭐
⭐
⭐
⭐
Vim 模式切换