生物活性玻璃纳米CSF-1R抑制剂颗粒(BGNP)因具有优越的骨和软组织诱导再生能力和再矿化潜力,在口腔及颅颌面外科得到了广泛的应用。随着生物材料的研究从Belnacasan分子量传统的“试错模式”(trial and error)逐渐向基于高通量实验、高通量理论预测的数据驱动模式转变,理解BGNP的结构-组成-性质关系,对于预测材料体内命运,辅助材料筛选和优化材料设计至关重要。由于BGNP化学组成多样,理化性质间相互关联,逐一合成不同成分和形态结构的BGNP,以研究特定理化性质的生物学效应的传统方式面临巨大挑战。机器学习是一种通过计算手段或学习算法“自行”从数据中发现规律,以完成分类任务或求得问题的最优解Biogenic resource的方法。机器学习擅长处理高通量多维度的数据,可以从BGNP复杂多样的理化性质和高度异质的毒理学研究中提取规律,从而预测细胞对材料的反应。为理解作为口腔和骨再生修复材料的BGNP的结构-组成-细胞毒性关系,通过文献检索,从既往研究中提取BGNP体外细胞毒性研究数据样本及相关属性,通过随机森林(RF)算法分别建立回归和分类模型,基于BGNP理化性质和实验条件预测体外细胞毒性;此外,还通过递归特征消除算法(RFE)筛选影响BGNP细胞毒性的关键属性。对Pubmed和Web of science数据库进行检索,得到697篇相关文献。根据纳入排除标准筛选出33篇符合条件的研究,从中提取出944条BGNP细胞毒性数据样本,以及包括合成方法、理化性质、形貌结构、和实验条件在内的共计37条定量或定性属性。特征重要性分析结果表明,与BGNP细胞毒性关系最密切的前5个属性是剂量、时间、Zeta电位、Ca O含量、比表面积。RFE分别为回归和分类模型筛选了两组关键属性,基于15个特征的回归模型可以解释测试集75.8%样本差异,误差(MAE)为0.075;基于15个特征的分类模型,在测试集上分类的精度(Accuracy)为96%,宏观F1分数(Macro-F1)为87%,受试者工作特征曲线下面积(ROC-AUC)为96%。本研究的结果表明通过文献数据挖掘和机器学习结合的方法,可以从既往研究中提取BGNP理化特性-生物活性/毒性关系,建立合适的模型以预测BGNP的体外细胞毒性,从而为材料筛选和设计提供指导。