Help

0) 编程环境

  • cellrangerigblast安装在路径/data/2023-bioinfo-shared/software

  • 包含一些单细胞分析常用的python和R package的conda环境,可以在本地通过以下命令创建。

conda env create -f ITP.yml

1) 参考基因组

  • cellranger比对的参考基因路径

# GEX Reference
/data/2023-bioinfo-shared/genome/refdata-cellranger-vdj-GRCh38-alts-ensembl-7.1.0
# VDJ Reference
/data/2023-bioinfo-shared/genome/refdata-gex-GRCh38-2020-A
  • Igblast database路径

/data/2023-bioinfo-shared/genome/igblast

2) 构建count matrix和BCR contig组装

  • 对于10x基因表达数据可以使用cellranger count对fastq进行比对

cellranger count --id={sample_id}-5LIB \
  --transcriptome={ref} \
  --fastqs={input.fastq} \
  --sample={sample_id}-5LIB \
  --localcores=20 \
  --localmem=120 
  • 对于10x V(D)J数据可以使用cellranger vdj进行BCR contig的组装

3) GEX分析

  • R包Seurat使用教程 使用R语言Seurat包进行分析的同学可以参考Seurat官网提供的PBMC3K数据分析标准流程代码,该教程没有提供批次校正的代码,可以查阅官网中其他教程或是其他论坛的代码进行学习:https://satijalab.org/seurat/articles/pbmc3k_tutorial.html

  • 批次效应校正 批次校正的方法有许多并且对于不同的样本、数据可能会有不同的选择,常见的有harmony、CCA等,在一次分析中往往选择一种方法使用,但可能需要对比不同方法对后续分析产生的影响,感兴趣的同学可以查阅有关批次效应校准方法的对比的文献:

Tran H T N, Ang K S, Chevrier M, et al. A benchmark of batch-effect correction methods for single-cell RNA sequencing data[J]. Genome biology, 2020, 21: 1-32.

  • python相关库导入

  • 导入cellranger结果文件到scanpy

  • Quality control

  • Normalization

  • Feature Selection and Dimensionality Reduction

  • Clustering

  • Major cell type annotation

4) BCR分析

  • Analysis using Change-O toolkit

  • Converting 10X V(D)J data into the AIRR Community standardized format

  • Identifying clones from B cells in AIRR formatted 10X V(D)J data

  1. Splitting into separate light and heavy chain files. To group B cells into clones from AIRR Rearrangement data, the output from MakeDb must be parsed into a light chain file and a heavy chain file:

  1. Calculating nearest neighbor distances based on heavy chains

  1. Clonal assignment using shazam

  • Reconstructing germline sequences

  • Define SHM (mutation analysis)

  • Clonal abundance and diversity

Last updated

Was this helpful?