Help
0) 编程环境
cellranger和igblast安装在路径/data/2023-bioinfo-shared/software包含一些单细胞分析常用的python和R package的conda环境,可以在本地通过以下命令创建。
conda env create -f ITP.yml1) 参考基因组
cellranger比对的参考基因路径
# GEX Reference
/data/2023-bioinfo-shared/genome/refdata-cellranger-vdj-GRCh38-alts-ensembl-7.1.0
# VDJ Reference
/data/2023-bioinfo-shared/genome/refdata-gex-GRCh38-2020-AIgblast database路径
/data/2023-bioinfo-shared/genome/igblast2) 构建count matrix和BCR contig组装
对于10x基因表达数据可以使用cellranger count对fastq进行比对
cellranger count --id={sample_id}-5LIB \
--transcriptome={ref} \
--fastqs={input.fastq} \
--sample={sample_id}-5LIB \
--localcores=20 \
--localmem=120 对于10x V(D)J数据可以使用cellranger vdj进行BCR contig的组装
3) GEX分析
R包Seurat使用教程 使用R语言Seurat包进行分析的同学可以参考Seurat官网提供的PBMC3K数据分析标准流程代码,该教程没有提供批次校正的代码,可以查阅官网中其他教程或是其他论坛的代码进行学习:https://satijalab.org/seurat/articles/pbmc3k_tutorial.html。
批次效应校正 批次校正的方法有许多并且对于不同的样本、数据可能会有不同的选择,常见的有harmony、CCA等,在一次分析中往往选择一种方法使用,但可能需要对比不同方法对后续分析产生的影响,感兴趣的同学可以查阅有关批次效应校准方法的对比的文献:
Tran H T N, Ang K S, Chevrier M, et al. A benchmark of batch-effect correction methods for single-cell RNA sequencing data[J]. Genome biology, 2020, 21: 1-32.
python相关库导入
导入cellranger结果文件到scanpy
Quality control
Normalization
Feature Selection and Dimensionality Reduction
Clustering
Major cell type annotation
4) BCR分析
Analysis using Change-O toolkit
Converting 10X V(D)J data into the AIRR Community standardized format
Identifying clones from B cells in AIRR formatted 10X V(D)J data
Splitting into separate light and heavy chain files. To group B cells into clones from AIRR Rearrangement data, the output from MakeDb must be parsed into a light chain file and a heavy chain file:
Calculating nearest neighbor distances based on heavy chains
Clonal assignment using shazam
Reconstructing germline sequences
Define SHM (mutation analysis)
Clonal abundance and diversity
Last updated
Was this helpful?