目的:用公共数据库研究Hp感染相关基因在胃腺癌中的作用,筛选出具有预后价值的目的基因。构建多指标联合预测模型以更准确地预测肿瘤的进展和转移以及对免疫治疗的反应。方法:(1)在基因表达综合数据库(GEO;https://www.ncbi.nlm.nih.gov/geo/,GSE84437)和癌症基因组图谱(TCGA;https://portal.gdc.cancer.gov/)数据库下载共876例胃腺癌患者基因表达数据和完整的临床注释,并对数据进行批次矫正和均一化处理。从Gene Card数据库(https://www.genecards.org/)下载了2014个Hp感染相关基因和GSEAMSig DB(https://www.gsea-msigdb.org/gsea/msigdb)网站获得73个Hp相关基因。(2)然后使用差异表达基因分析、生存分析、单因素Cox回归分析、Lasso回归分析和多因素Cox回归分析筛选Hp感染相关预后基因。(3)多指标联合模型预测胃腺癌患者术后生存。(4)通过ROC曲线、生存曲线、校准曲线和DCA曲线,在外部及内部数据集中评估胃腺癌预后模型预测胃腺癌患者术后生存时间的效能。(5)采用实时定量PCR(Quantificational real time-PCR,q RT-PCR)和免疫组织化学(immunohistochemistry,IHC)检测预后模型中的关键基因在胃腺癌组织中的表达水平;采用卡方检验和Fisher精确检验分析关键基因的表达与患者临床特征及预后之间的相关性。(6)经基因群富Tissue Slides集分析(Gene Set Enrichment Analysis,GSEA)和CIBERSORT算法探索胃腺癌预后模型中关键基因影响胃腺癌发生发展的机制。结果:(1)筛选获得Hp相关的胃腺癌预后标志物分别为SERPINE1(丝氨酸蛋白酶抑制E1)、CLDN1(紧密连接蛋白1)、CTHRC1(胶原三股螺旋重叠蛋白1)、NRP1(神经纤毛蛋白1)。(2)建立多指标联合胃腺癌预后模型:年龄、分化、SERPINE1、NRP1、CLDN1和CTHRC1。该模型预测训练组和验证组胃腺癌患者预后的敏感性分别为83.33%、76.92%,特异性分别为84.81%、55.0%。(3)获悉更多内、外部数据集评估胃腺癌预后模型,ROC曲线判断该模型的准确性的1年、3年、5年的AUC分别为为0.678、0.843、0.882;Kaplan-Meier法示高、低死亡风险组之间生存曲线不同且差(P<0.001,P=0.002)。内、外部数据集中校准曲线分析校结果显示模型拟合度高。DCA曲线可以看出模型的临购买AZD2281床收益好。(4)根据q RT-PCR证实了在胃腺癌组织中SERPINE1、CTHRC1、NRP1和CLDN1的m RNA表达升高(P<0.05)且与Hp感染相关。(5)免疫组织化学观察到CTHRC1、NRP1和CLDN1在胃腺癌组织的细胞质和细胞膜染色,SERPINE1在胃腺癌组织的细胞质染色(P<0.05)且它们与Hp感染相关,同时均与患者的肿瘤的侵袭等临床特征及预后显著相关。(6)SERPINE1、CTHRC1、NRP1和CLDN1的m RNA高表达样本均富集在细胞外基质(Extracellular Matrix,ECM)受体相互作用通路,并且与多种免疫细胞存在相关性。结论:本研究通过生物信息学分析获得SERPINE1、CLDN1、CTHRC1、NRP1这四个与胃腺癌患者预后相关的Hp相关基因,其可能成为潜在的预后标志物,并建立多指标胃腺癌预后模型可以从“临床因子-蛋白质-组织”三个层面进行评估,这有利于医生为胃腺癌患者制定最佳的治疗方案。