子宫内膜癌代谢组学分析(2025 年 10 月版)¶
出品:一诺一康生物医药科技有限公司 · 生物信息团队
数据版本:2025-10-20(仅保留全局 FDR 检验通过的基础分析结果)
主要依据:子宫内膜癌代谢组学分析报告_最终版v2.docx、results/differential/*.csv
1. 项目背景与数据来源¶
- 研究焦点:比较子宫内膜癌五个 TCGA 分子亚型(Benign、POLEmut、NSMP、MMRd、P53abn)与良性对照之间的代谢差异,尤其关注 P53abn 亚型的独特代谢特征。
- 数据总体:131 例临床样本(良性 53、P53abn 15、POLEmut 13、NSMP 36、MMRd 14),另含 17 个质控 (QC) 样本。
- 代谢特征:预处理后保留 1,045 个真实代谢物峰,涵盖氨基酸、脂质、糖类及多肽等多个类别。
- 分析范围:仅保留经过脚本复跑验证的基础分析(预处理、差异统计、通路注释、可视化),排除所有被确认存在缺陷的高级分析模块。
2. 样本分布与数据质量控制¶
| 指标 | 数值 | 说明 |
|---|---|---|
| 样本数 | 131 | 五个分组全部纳入差异分析 |
| QC 样本 | 17 | 用于漂移校正和重复性评估 |
| 代谢特征数 | 1,045 | 移除技术字段与冗余峰后的有效特征 |
| 全局缺失率 | 4.0% | QC 校正后缺失率低,说明采集稳定 |
| QC 中位 RSD | 25.8% | 低于 30%,定量重复性满足行业标准 |
| KEGG 注释率 | 36% | 381 个代谢物带有 KEGG ID,可用于通路解释 |
数据预处理流程包括:
- 零值处理:将原始矩阵中“0”统一视为缺失,避免仪器背景影响。
- 漂移校正:利用 17 个 QC 样本执行 LOWESS 校正,减少批次漂移。
- 归一化与转换:对所有样本进行 log₂ 转换与中位数归一化,使不同批次的强度分布可比。
- 缺失填补:采用 MinProb(q = 0.01)针对左删失缺失进行保守填补,避免引入过大偏差。
质量控制图(figures/qc/)显示校正后样本间分布一致;主成分分析图(figures/main/01_pca.pdf)中,各分组样本在 PC 空间分离清晰,说明组间信号大于批次噪声。
3. 统计分析方法说明¶
- 核心模型:使用 limma 线性模型 + 经验贝叶斯估计,模型中包含五个分组指标以适配不平衡样本量。
- 对比组合:针对五个分组设置全部 10 个两两比较(例如 P53abn vs Benign、MMRd vs NSMP 等)。
- 多重校正:10 个对比总共产生 10,450 次检验,采用全局 FDR(Benjamini-Hochberg)一次性校正,避免重复使用数据导致的假阳性膨胀。
- 显著性判定:本文所有结论仅引用全局 FDR < 0.05 的代谢物。在讨论具体代谢物时同时报告 log₂ 倍数变化,便于理解差异的实际幅度。
4. 差异结果总览¶
| 对比 | 全局 FDR < 0.05 代谢物数 | 上调 | 下调 |
|---|---|---|---|
| P53abn vs Benign | 20 | 15 | 5 |
| POLEmut vs Benign | 22 | 20 | 2 |
| NSMP vs Benign | 62 | 43 | 19 |
| MMRd vs Benign | 38 | 22 | 16 |
| P53abn vs NSMP | 8 | 6 | 2 |
| MMRd vs NSMP | 16 | 1 | 15 |
| 其余比较 | ≤ 2 | - | - |
数据来源:
summary_enhanced_global_fdr.csv。
总体解读:
- 五个亚型均与良性对照存在显著的代谢差异,说明代谢组层面的亚型特征非常明显。
- NSMP 与良性对照的差异数量最多(62 个),表明“无特异分子特征”只针对基因层面,代谢层依然有丰富变化。
- P53abn 的显著代谢物数量少于 NSMP,但倍数变化普遍极端,整体呈现“高幅度但选择性”的代谢重编程。
- P53abn 与 POLEmut 几乎无显著差异,提示两者在代谢层面较为接近;与 NSMP、MMRd 的差异主要集中于特定代谢通路。
下文先聚焦 P53abn vs Benign 的主要结果,再依次描述其他亚型。
5. P53abn 与良性对照的关键差异¶
5.1 整体概况¶
- 显著代谢物 20 个,其中 15 个上调、5 个下调。
- 多数上调代谢物属于胆碱衍生物、鞘脂及含硫氨基酸;下调代谢物以肉碱及部分能量代谢产物为主。
- 火山图(
figures/main/volcano_P53abn_vs_Benign_enhanced.pdf)显示,上调代谢物集中在图的右上角,表明不仅显著性高,而且倍数变化大。
5.2 Top 5 上调代谢物¶
| 代谢物 | log₂FC | 线性倍数变化 | 全局 FDR | 备注 |
|---|---|---|---|---|
| Choline_Peak1 | 8.38 | 3.3×10² ↑ | 1.29×10⁻⁴ | 胆碱,磷脂合成前体 |
| delta-Valerobetaine | 5.04 | 3.3×10¹ ↑ | 1.25×10⁻³ | 胆碱类似物 |
| Pro-Leu / Pro-Ile / Ile-Pro | 4.20 | 1.8×10¹ ↑ | 3.18×10⁻⁴ | 含脯氨酸二肽,提示蛋白降解活性 |
| Sphingosine | 3.03 | 8.2 ↑ | 4.81×10⁻⁴ | 鞘脂代谢核心分子 |
| Cystathionine | 2.62 | 6.1 ↑ | 8.07×10⁻³ | 转硫途径中间产物 |
这些代谢物的剧烈升高,揭示 P53abn 肿瘤细胞在膜合成、鞘脂信号和含硫氨基酸代谢方面的明显需求。其中胆碱及其衍生物呈指数级上升,是本数据集中最突出的特征。
5.3 Top 5 下调代谢物¶
| 代谢物 | log₂FC | 线性倍数变化 | 全局 FDR | 备注 |
|---|---|---|---|---|
| Acetylcarnitine (C2:0)_Peak3_mz204.1 | -3.29 | 0.10 ↓ | 3.35×10⁻³ | 短链酰基肉碱,参与 β-氧化 |
| Propionylcarnitine (C3:0)_Peak5_mz218.1 | -2.84 | 0.14 ↓ | 3.95×10⁻² | 短链酰基肉碱,反映脂肪酸进入线粒体受限 |
| cis-5-Tetradecenoylcarnitine | -2.36 | 0.19 ↓ | 4.60×10⁻² | 长链酰基肉碱 |
| N-oleoyl-serine | -2.36 | 0.19 ↓ | 4.60×10⁻² | N-酰基氨基酸,提示脂质信号重塑 |
| cis-4-Decenoylcarnitine (C10:1)_Peak3_mz314.2 | -1.78 | 0.29 ↓ | 2.23×10⁻² | 中链酰基肉碱 |
肉碱类分子的广泛下降说明线粒体脂肪酸进入 β-氧化途径的能力受限,肿瘤细胞可能更依赖糖酵解满足能量需求。
5.4 代谢主题解释¶
- 胆碱 / 磷脂代谢显著激活
- 胆碱是磷脂酰胆碱 (PC) 合成的关键前体。倍数达到 332–334 倍,说明 P53abn 肿瘤细胞具有极高的膜构建和信号转导需求。
- 对比 NSMP、MMRd、POLEmut,这一特征在所有肿瘤亚型中均存在,但 P53abn 的变化幅度最大。
-
图 3(Top25 热图)显示胆碱在 P53abn 样本中呈现深红色高表达,与良性组的蓝色低水平形成强烈对比。
-
鞘脂信号双向重构
- Sphingosine 显著升高,说明神经酰胺向鞘氨醇的转换加速。
- NSMP 亚型中存在多种鞘磷脂下降,代表膜结构和信号通路发生重构。
-
该模式提示肿瘤细胞在调节凋亡与存活之间进行动态平衡。
-
一碳与转硫路径增强
- Methionine 与 Cystathionine 同时升高,说明蛋氨酸循环加速,S-腺苷甲硫氨酸 (SAM) 储备增加。
- 这类变化会影响 DNA 和组蛋白甲基化状态,也能通过谷胱甘肽提供抗氧化能力。
-
热图中相关代谢物在 P53abn 及部分 NSMP 样本中同时高表达。
-
肉碱介导的脂肪酸转运下降
- 几乎所有短链、中链、长链酰基肉碱均下降,说明脂肪酸进入线粒体被限制。
- 这与上调的胆碱、鞘氨醇共同构成“偏向膜合成、弱化脂肪酸氧化”的代谢格局。
这些主题互相呼应,描绘了 P53abn 亚型的关键代谢特征:细胞倾向于积累膜脂和信号分子,同时降低对 β-氧化的依赖。
6. 其他分子亚型的代谢特征¶
6.1 NSMP vs Benign¶
- 显著代谢物最多(62 个),涉及胆碱、鞘脂、含硫氨基酸、多肽等多个类别。
- 胆碱在该亚型中同样显著上调(log₂FC 6.82,折合 113 倍),但幅度仍低于 P53abn。
- 下调代谢物包括多种二肽和糖胺类,表明 NSMP 在蛋白降解与糖代谢方面也存在高动态变化。
- 火山图显示显著点密集分布在右侧,说明上调占主导;下调的 19 个代谢物主要集中在氨基酸衍生物。
6.2 MMRd vs Benign¶
- 共有 38 个显著代谢物,上调 22 个、下调 16 个。
- 胆碱对比良性升高 10.42 log₂(折合 1,371 倍),为所有比较中最大幅度。
- 下调代谢物多为肉碱及糖胺类,说明 MMRd 也存在 β-氧化受限的迹象。
- 与 NSMP 的比较中,有 16 个代谢物显著差异,其中 15 个在 MMRd 中低于 NSMP,说明两者在脂质转运和糖代谢方向存在分化。
6.3 POLEmut vs Benign¶
- 显著代谢物 22 个,以胆碱、含硫氨基酸和部分二肽为主。
- 整体差异幅度小于 P53abn 和 NSMP,符合 POLEmut 预后较好的临床特征。
- 与 P53abn 的直接比较下未检出全局 FDR 显著信号,说明两者在代谢层面较接近。
6.4 P53abn vs NSMP / MMRd / POLEmut¶
- 与 NSMP 的差异主要集中在胆碱衍生物与肉碱类(8 个显著代谢物,P53abn 更偏向胆碱高、肉碱低)。
- 与 MMRd 的比较中仅有 1 个代谢物显著(下调),说明两者在整体代谢轮廓上较为相似。
- 与 POLEmut 无显著差异,再次证明 P53abn 与 POLEmut 在该数据集中难以通过全局 FDR 分辨。
7. 通路注释与一致性说明¶
由于全局 FDR 策略非常严格,KEGG 富集分析未获得显著的 p 调整值,但通路注释仍然揭示了与单个代谢物一致的主题:
- 胆碱相关通路(癌症中的胆碱代谢、甘油磷脂代谢):解释胆碱及其衍生物大幅升高的背景。
- 鞘脂信号通路:匹配 Sphingosine 及多种鞘磷脂的方向性变化。
- 半胱氨酸和蛋氨酸代谢、一碳单位库:支撑 L-甲硫氨酸、胱硫醚等含硫代谢物的同步升高。
- 脂肪酸降解、胰岛素抵抗:呼应肉碱类下降和 β-氧化受限的观察。
通路注释文件位于 results/pathway_enrichment/。在向客户解释时,可强调通路层面的变化与单代谢物证据“方向一致、互相验证”,而不是基于统计显著性做结论。
8. 关键可视化图解释¶
01_pca.pdf:PC1 和 PC2 清晰区分良性、P53abn、NSMP、MMRd 四组,说明代谢表型在主要成分上差异明显。volcano_P53abn_vs_Benign_enhanced.pdf:右上角集中大片红色点(上调代谢物),其中胆碱、鞘氨醇等被自动标注。02_heatmap_top25_metabolites.pdf:胆碱、胱硫醚、鞘氨醇在 P53abn 及部分 NSMP 样本中呈现整体高表达模式,与良性组形成明显差异。03_boxplots_top6_metabolites.pdf:对胆碱、乙酰肉碱等关键代谢物的分组箱线图,直观展示不同亚型之间的数量差异,便于客户理解统计结果与原始强度之间的对应关系。
9. 小结¶
- P53abn 亚型呈现“胆碱极度升高 + 鞘脂信号增强 + 含硫氨基酸富集 + 肉碱下降”的组合特征,描绘出向膜合成和信号分子的重编程趋势。
- NSMP 与 MMRd 虽然基因层面差异明显,但在代谢层同样存在大幅度重塑,说明“无特异分子特征”并不意味着“无代谢特征”。
- POLEmut 与 P53abn 在代谢层相似度较高,与 NSMP 和 MMRd 的差异主要体现在脂质及糖代谢方向。
- 这些代谢特征与外泌体、组织蛋白的观察在多个主题(胆碱、一碳代谢、脂肪酸氧化)上保持一致,为后续整合分析提供了坚实基础。
10. 资料索引¶
results/differential/P53abn_vs_Benign_enhanced.csv:P53abn 核心代谢物明细。results/differential/summary_enhanced_global_fdr.csv:10 个比较的显著性统计。figures/main/:主图(PCA、火山图、热图、箱线图等)。figures/qc/:质量控制图。results/pathway_enrichment/:代谢物与 KEGG 通路映射结果。
以上内容可直接嵌入 mkdocs,供客户在网站端查阅。如需补充英文摘要、术语解释或多组学对照表格,可在后续章节添加,但需保证与当前基础分析结论一致。***