
本教程基于银白杨顶芽单细胞测序数据,聚焦 CYC 和 CDK 基因家族参与叶片发育的分子机制,适配有少量生信基础(了解 Linux 基本操作、R 语言入门)的读者。教程共4节,遵循 “软件准备→基础分析→细胞注释→高级挖掘” 的分析流程,代码均来自实际研究,注释结合发表文章核心结果,确保 “代码可复现、结果可解读”。
第 1 节:环境搭建,软件安装,参考基因组构建
1.1 核心软件与 R 包安装
#1.1.1 Linux 环境(细胞定量核心)#代码如下:
# 1. 安装cellranger(10x单细胞定量工具)
wget -O cellranger-7.1.0.tar.gz"https://cf.10xgenomics.com/releases/cell-exp/cellranger-7.1.0.tar.gz?Expires=1693501070&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9jZi4xMHhnZW5vbWljcy5jb20vcmVsZWFzZXMvY2VsbC1leHAvY2VsbHJhbmdlci03LjEuMC50YXIuZ3oiLCJDb25kaXRpb24iOnsiRGF0ZUxlc3NUaGFuIjp7IkFXUzpFcG9jaFRpbWUiOjE2OTM1MDEwNzB9fX1dfQ__&Signature=Fjmu-V9q97ffbFeqNxeiI95GmusN90g-~OxoQW8lFLh3fqIeMKCZwmgjRTw9XXSB8ZG133zB5XmEBAzeEHLUIupwM9Kxtfd5mWd0GHzL1t6n7adbulUSpTZ2BrROlQrjyHMMcCPnjb1ysjQ2-j2578HnX6yY~7u2kwqlY8SE6gUlcMp0xn0x5JQmW9AsNBiWwgdCaTmoNvkev6neKYkwvng~x6qOk6ofakITlaJp7x5s00XlGNvuiH8sK3nWLHw6KBKxQWgAbIoPzYPnieBBv7Ow3DLrmIGeUrwcBfSTGloSH9UeG5MNRx~eQlewUBR5xKQXzllZHJUcsFK9D-7hPw__&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA"
tar -zxvf cellranger-7.1.0.tar.gz
echo 'exportPATH=/home/liangjinghui/software/cellranger-7.1.0/:$PATH' >> ~/.bashrc
source ~/.bashrc # 配置环境变量(永久生效)
# 2. 安装blastp(序列比对工具,用于基因注释)
conda install -c bioconda blast -y
#1.1.2 R 环境(下游分析核心)代码如下:
# 激活R环境(建议用conda创建专属环境)
source activate R
# 安装基础依赖包
install.packages("pak")
library(pak)
pak::pkg_install(c("Seurat","dplyr", "patchwork", "ggplot2","tidyverse"))
# 安装单细胞专用包
pak::pkg_install("chris-mcginnis-ucsf/DoubletFinder") #双细胞过滤
BiocManager::install(c("monocle","ComplexHeatmap", "SingleCellExperiment")) #拟时序与可视化
pak::pkg_install(c("clustree","clusterProfiler", "org.Palb.eg.db")) #聚类优化与功能富集
# 安装植物单细胞专用包
devtools::install_github("compbioNJU/scPlant")
devtools::install_github("Jasonxu0109/PlantPhoneDB")
# 验证安装(查看核心包版本)
packageVersion("Seurat") #需≥4.3.0
packageVersion("monocle") #需≥2.28.0
#1.2 参考基因组构建(植物单细胞关键步骤)植物单细胞分析需整合核基因组与细胞器基因组,避免线粒体污染干扰细胞注释,步骤如下:
# 1. 数据准备(整合核基因组与线粒体基因组)
# 核基因组:来源中国林科院。线粒体基因组:NCBI(登录号NC_041085.1)。使用notepad合并林科院和NCBI下载的文件,形成整合基因组和线粒体基因组的总文件,线粒体手动过滤删除tRNA和rRNA的注释,重叠的基因保留part1一个,exon同CDS,55个。
cd /home/workdirectory #工作目录
# 2. GFF转GTF(cellranger要求输入格式)
gffread -T Poalb_combine_genome.gff -oPoalb_combine_genome.gtf
# 3. 构建cellranger参考基因组
cellranger mkref --genome=Poalb.genome \
--fasta=Poalb_combine_genome.fa \
--genes=Poalb_combine_genome.gtf
#封面:出包王女