中文核心吧 关注:531贴子:8,880
  • 0回复贴,共1

文献解析 | 在单细胞水平上对发育中的人类大脑皮层进行多组学分

只看楼主收藏回复

大家好,今天给大家介绍的这一篇题为 Multi-omic profiling of the develo ping human cerebral cortex at the single-cell level(在单细胞水平上对发育中的人类大脑皮层的多组学分析)人脑的细胞复杂性是通过整个发育过程中基因表达的动态变化而建立的,这种变化部分是由顺式调控元件(CRE)的时空活动介导的。
01
研究背景
人脑的细胞复杂性是通过整个发育过程中基因表达的动态变化来建立的,这在一定程度上是由顺式调节元件(CRE)的时空活动介导的。我们同时分析了从胎儿到成人的六个广泛发育时间点的 45,549 个皮质核的基因表达和染色质可及性。我们确定了染色质可及性与基因表达高度相关的细胞类型特异性结构域。分化伪时间轨迹分析表明,CREs的染色质可及性先于转录,染色质结构的动态变化在神经元谱系承诺中起着关键作用。此外,我们还绘制了与神经精神特征(包括精神分裂症和双相情感障碍)有关的细胞类型特异性和时间特异性遗传位点。总之,我们的研究结果描述了谱系确定关键阶段细胞组成的复杂调控,并揭示了基因表达的时空改变对神经精神疾病的影响。
见图一
人类新皮层RNA表达和染色质可及性的联合单细胞谱分析。

图一
(A) 来自六个发育时间点的冷冻人类皮质脑标本由 FANS 匀浆和纯化,然后使用 10x 基因组学平台标记并分裂成单核。snRNA-seq和snATAC-seq的文库被独立制备、测序和分析。
(B) 分别由 RNA-seq 和 ATAC-seq 数据定义的单细胞的 UMAP 可视化。单元格类型注释独立地从任一模态派生。
(C) 热图显示两个聚类结果之间细胞成员的一致性,以 F1 分数衡量。
(D) 通过使用 WNN 分析整合两种模式来定义的单细胞的 UMAP 可视化。细胞类型注释是根据标记基因确定的。(E) 每个年龄组的细胞类型比例。
(F) 点图显示不同细胞类型的选定标记基因表达和染色质衍生基因活性。
见图二
顺式调节模式的全局和局部表征。

图二
(A)显示染色质可及性的方差成分分析解释了基因表达的变异。基因按表观基因组(增强子和启动子)解释的方差递减比例排序,括号中显示每个成分解释的平均方差。
(B)从每个峰到链接基因TSS的距离分布。
(C)直方图显示(从左到右)每个基因显著连接的峰数的分布;每个峰显著连接的基因数量分布;基因数量的分布“跳过”一个峰值以达到其连接基因。
(D) 每个基因的显著连接峰的数量,基因按递增顺序排序。
(E) 热图显示 500 个假散装样品(列,按细胞类型排序)中 DORC 中连接峰-基因对的染色质可及性和基因表达(行,左:聚集峰可及性,右:链接基因表达);值是 z 分数归一化。
(F) 与 DORC 相关的基因的前 15 个 GO 富集结果。
见图三
神经元发育过程中基因调控的轨迹。

图三
(A)在神经元亚群中鉴定的轨迹,显示在RNA基因表达坐标上(根节点被注释为“1”;细胞被着色为注释的细胞类型)。
(B) 分别沿兴奋性神经元(“EN 谱系”)和抑制性神经元(“IN-谱系”)谱系推断假时间。
(C) 染色质可及性和基因表达之间的平均残差与神经元群体中鉴定的 DORC 中涉及的每个基因的显着连接峰的数量。正残差和负残差分别以红色和灰色着色。
(D) 热图显示了 EN 谱系沿伪时间显着变化的峰-基因链接的基因表达和 DORC 染色质可及性。行(基因)使用 k 均值聚类 (k = 4) 进行聚类,列(细胞)按伪时间排序。对每个簇(km1/2/3/4)中差异表达最多的前五个基因进行注释。
(E) EN谱系的四个峰基因链接簇中代表的基因的各自GO富集。
(F) 根据TF基序活性与CUX2 DORC评分的Spearman相关性绘制的km2峰中TF基序富集的P值。
(G) EN谱系的峰-基因链接簇中代表的峰的TF基序富集。
(H) 在 EN 谱系中,从 km2 阶段的开始到结束,NEUROD1基序活性和表达的谱系动力学先于 CUX2 DORC 染色质可及性和基因表达,使用伪时间的最小-最大归一化平滑值。
见图四
评估 NEUROD1 和 CUX2 在区分 NPC 方面的关系。

图四
(A) 分化后 2 周用加扰 gRNA、NEUROD1特异性 gRNA 和 CUX2 特异性 gRNA 处理的 NPC 中 CUX2(红色)和 NEUROD1(绿色)表达的最大强度投影图像(来自 ×63 倍放大倍率获得的 200 nm z 堆栈)。图表显示了用加扰 gRNA(n = 444 个细胞)、NEUROD1特异性 gRNA(n = 111 个细胞)和 CUX2 特异性 gRNA(n = 183 个细胞)处理的细胞中每个细胞核的 CUX2 和 NEUROD1 RNAscope 点的频率分布。% ON 对应于具有可检测 RNA 的细胞核的百分比。
(B)所有条件下核RNA频率分布的小提琴图。进行了具有连续性校正的双侧 Wilcoxon 秩和检验。中心线(黄色)表示中位数,框表示四分位距,胡须表示四分位距 1.5 ×内的最高/最低值。
见图五
使用单细胞来源的标记基因和峰将与神经精神特征相关的风险变异映射到致病基因。

图五
(A)神经精神疾病和不相关控制性状中脑细胞类型的遗传性富集。热图突出显示了GWAS衍生的常见遗传变异与snATAC-seq数据(左)中的细胞特异性开放染色质区域和snRNA-seq数据中的细胞标记基因(右)的显著共定位(材料和方法)。“*”:在所有测试中校正后显著(FDR < 0.05)。
(B)在选定的神经精神疾病中胎儿和成人神经元信号之间的比较(特征需要在胎儿或成人类别中丰富;因此,不涉及强迫症和焦虑症)。胎儿和成体神经元由峰集/基因集表示,这些峰集/基因集由每个胎儿神经元(即 EN-fetal-early、EN-fetal-late 和 IN-fetal)和成人神经元(即 EN、IN-CGE 和 IN-MGE)类别的前 2500/500 个细胞特异性峰/基因的联合汇编而成。为了计算“胎儿神经元/成人神经元”的比率(y轴),我们使用了LDsc回归系数(snATAC-seq)和MAGMA β系数(snRNA-seq);联合评分是 snATAC-seq 和 snRNA-seq 评分的平均值。
(C) 风险变异的候选致病基因子集,这些变异要么在两种疾病中被优先考虑,要么在神经元谱系的发育轨迹上显示出显着改变的表达(km1/2/3/4;表S12中的完整致病基因列表)。
(D) 将与神经精神疾病相关的风险变异与其致病基因联系起来的总体策略示意图(材料和方法)。
(E) 归一化的 snATAC-seq 衍生的假体积轨迹,表明 DCLK3 基因的复杂细胞特异性调控,该基因被预测为 SCZ 和 BD GWAS 风险变异(rs75968099 和 rs75968099)的致病基因。
02
研究结论
总之,我们从六个发育时间点生成了一个单核中基因表达和染色质可及性的数据集,为人类大脑皮层中的细胞命运决定和神经精神疾病的分子基础提供了额外的见解。我们将我们的数据呈现为一个交互式网络浏览器,科学界可以使用它来探索发育和疾病中基因表达的时空变化。
好了,今天的文献解读就到这儿来,我们下期再见!如果你正在开展临床研究.需要方案设计.数据管理. 数据分析等支持.也随时可以联系我们。


IP属地:广东1楼2024-05-07 16:44回复