引用本文:
【打印本页】   【下载PDF全文】   查看/发表评论  【EndNote】   【RefMan】   【BibTex】
←前一篇|后一篇→ 过刊浏览    高级检索
本文已被:浏览 238次   下载 67 本文二维码信息
码上扫一扫!
基于机器学习构建 2 型糖尿病 肾病发病风险预测模型及验证
钟司宇 杨磊 孙中帅 陈瑜腾1
绍兴第二医院医共体总院内分泌科
摘要:
目的 构建2型糖尿病(T2DM)患者发生糖尿病肾病(DKD)风险的机器学习预测模型并筛选最优模型,结合沙普利加 性解释(SHAP)分析量化特征贡献。 方法 回顾性收集2021年10月至2024年5月绍兴第二医院收治的1 081例T2DM患者的临床 资料,按8∶2随机分为训练集864例和验证集217例。采用基于L1正则化的最小绝对收缩和选择算子(LASSO)回归筛选DKD发生 的关键特征变量,并采用逻辑回归、决策树、随机森林、支持向量机、梯度提升决策树、极限梯度提升(XGBoost)6种算法构建机器学习 模型。采用ROC曲线、AUC、精确度、灵敏度、特异度、准确率、F1值等指标评价模型预测效能,并依托SHAP对最优模型进行可解释性 分析。 结果 经LASSO回归筛选出13个重要特征变量,包括估算的肾小球滤过率(eGFR)、糖尿病病程、血尿素氮、尿酸、收缩压、年 龄、高密度脂蛋白胆固醇、丙氨酸氨基转移酶(ALT)、总胆固醇、甘油三酯、空腹血糖、糖化血红蛋白、体重指数。ROC曲线结果显示,无 论训练集还是验证集,XGBoost模型预测T2DM患者发生DKD的AUC均最高(训练集为0.950,验证集为0.884)。综合准确率、F1 值、精确度、灵敏度、特异度多项评价指标可见,XGBoost模型在模型拟合中兼具良好的鉴别能力与临床应用价值。SHAP分析显示, 对DKD发生影响最大的前5个特征依次为eGFR、血尿素氮、糖尿病病程、甘油三酯和ALT。 结论 基于SHAP可解释性的机器学习 模型能有效预测T2DM患者发生DKD的风险,XGBoost模型预测效能最优,结合SHAP分析可量化特征贡献,有助于早期识别可能发 生DKD的高危T2DM患者。
关键词:  
DOI:
分类号:
基金项目:浙江省医学会临床医学科研专项资金项目(2024ZYC-A457)
Abstract:
Key words: