目的:本研究旨在通过随机生存森林(RSF)与COX比例风险回归相结合的方法,探讨糖尿病肾脏疾病(DKD)G3a-G4期患者发生肾脏替代治疗、肌酐翻倍等复合终点事件的影响因素,及中医药干预对其预后的影响,并以此构建其风险预测模型,进一步绘制可视化列线图,提高精准筛选高风险人群的机率,实现早期个体化干预,改善残余肾单位的存活率,为临床工作中风险预测提供参考。方法:本研究为回顾性队列研究,于2019年1月至2022年4月,通过院内科研一体化平台检索诊断为DKD的患者,对满足纳排标准的患者的相关病例资料进行数据预处理及数据库的搭建。将纳入研究患者按治疗方案分为中医干预组和西医治疗组采用Kaplan-Meier法进行生存分析,log-rank检验比较两组患者总体生存函数之间差异有无统计学意义。使用R4PF-6463922.2.2软件,建立传统COX回归模型及RSF-COX模型,首先通过COX单因素法对所有纳入变量进行筛选,将有意义的单因素纳入COX回归进行多因素的分析并建立传统COX回归模型。再运用RSF筛选出的对预测有益的变量,纳入COX多因素回归中进行RSF-COX模型的建立。通过C指数即一致性指数(C-index)评估两组模型的预测能力,结果以列线图的形式呈现,同时对列线图模型绘制一致性校准曲线,对预测模型准确性进行评估。结果:本研究共纳入DKD患者91例,发生复合终点共40(43.96%)例,中位随访时间769天,平均年龄63.51±10.66岁,其中男性69例(75.82%),女性22例(24.18%)。在中医干预组(n=49例)中,平均年龄63.22±9.63岁,其中男性37例(75.51%);在西医治疗组(n=42例)中,平均年龄63.84±11.87岁,其中男性32例(76.19%)。两组间变量均无统计学差异(P>0.05)。采用随机生存森林法对20个变量全部进行重要性排序,通过重要性评分(VIMP)法,最终筛选出11个VIMP大于0的变量:依次为血清白蛋白、尿蛋白定量、血沉、血红蛋白、糖化血红蛋白、低密度脂蛋白胆固醇、有无糖尿病视网膜病变、胱抑素C、尿素氮、治疗方式、肾小球滤过率。并将这些有助于模型预测的变量,纳入COX多因素分析,构建RSF-COX模型,最终筛选出的有明显相关性的影响因素如下:治疗方案(P=0.033<0.05),Bioaccessibility test尿蛋白定量(P=0.019<0.05),血沉(P=0.039<0.05),糖化血红蛋白(P=0.035<0.05)。同时采用单因素COX回归分析,其中血清白蛋白、尿蛋白定量、血沉、血红蛋白、糖化血红蛋白、年龄、甘油三酯、治疗方式、有无视网膜病变、空腹血糖共10个变量P值<0.1。再次进行COX多因素分析最后筛选出的有明显相关性的影响因素如下:治疗方案(P=0.Ras抑制剂043<0.05),尿蛋白定量(P=0.032<0.05),血沉(P=0.045<0.05)。通过C-index评价两组模型的预测能力,RSF-COX模型评分为0.794,传统COX模型评分为0.782,均属于中等准确度,但前者较高于后者,故将前者筛选出的变量构建列线图。两组的模型拟合曲线显示校准曲线和标准曲线基本贴合,证明模型所预测的糖尿病肾病患者发生复合终点事件的概率与实际情况相仿,模型可获得较好的临床效益。结论:本研究中治疗方式的KM曲线提示中医干预组累计生存率高于西医治疗组,虽然在单因素分析时P>0.05,但经过多因素分析减少了混杂因素的影响后,中医干预组的肾脏存活率较西医治疗组更高,并具有统计学意义。此次运用RSF与COX比例风险回归共同筛选出对结局事件有密切影响的因素,如治疗方案、尿蛋白定量、血沉、糖化血红蛋白。我们构建的DKD预后风险预测列线图,对DKD预后的早期预测和高危患者早期识别具有重要的临床价值。