| 摘要: |
| 目的 构建2型糖尿病(T2DM)患者发生糖尿病肾病(DKD)风险的机器学习预测模型并筛选最优模型,结合沙普利加
性解释(SHAP)分析量化特征贡献。 方法 回顾性收集2021年10月至2024年5月绍兴第二医院收治的1 081例T2DM患者的临床
资料,按8∶2随机分为训练集864例和验证集217例。采用基于L1正则化的最小绝对收缩和选择算子(LASSO)回归筛选DKD发生
的关键特征变量,并采用逻辑回归、决策树、随机森林、支持向量机、梯度提升决策树、极限梯度提升(XGBoost)6种算法构建机器学习
模型。采用ROC曲线、AUC、精确度、灵敏度、特异度、准确率、F1值等指标评价模型预测效能,并依托SHAP对最优模型进行可解释性
分析。 结果 经LASSO回归筛选出13个重要特征变量,包括估算的肾小球滤过率(eGFR)、糖尿病病程、血尿素氮、尿酸、收缩压、年
龄、高密度脂蛋白胆固醇、丙氨酸氨基转移酶(ALT)、总胆固醇、甘油三酯、空腹血糖、糖化血红蛋白、体重指数。ROC曲线结果显示,无
论训练集还是验证集,XGBoost模型预测T2DM患者发生DKD的AUC均最高(训练集为0.950,验证集为0.884)。综合准确率、F1
值、精确度、灵敏度、特异度多项评价指标可见,XGBoost模型在模型拟合中兼具良好的鉴别能力与临床应用价值。SHAP分析显示,
对DKD发生影响最大的前5个特征依次为eGFR、血尿素氮、糖尿病病程、甘油三酯和ALT。 结论 基于SHAP可解释性的机器学习
模型能有效预测T2DM患者发生DKD的风险,XGBoost模型预测效能最优,结合SHAP分析可量化特征贡献,有助于早期识别可能发
生DKD的高危T2DM患者。 |
| 关键词: |
| DOI: |
| 分类号: |
| 基金项目:浙江省医学会临床医学科研专项资金项目(2024ZYC-A457) |
|
|
|
|
| Abstract: |
|
| Key words: |