您的位置: 首页 > 中文期刊论文 > 详情页

基于LASSO回归与随机森林算法的2型糖尿病发病风险因素分析

作   者:
苏宇腾吕世云谢文涵李元欧阳逸馨薛咏茜胡美玲李舒婷周航刘相佟
作者机构:
首都医科大学公共卫生学院
关键词:
随机森林回顾性队列研究风险因素2型糖尿病
期刊名称:
环境卫生学杂志
i s s n:
2095-1906
年卷期:
2023 年 13 卷 07 期
页   码:
485-495
摘   要:
目的 基于LASSO回归与随机森林算法分析2型糖尿病的发病风险因素,为临床决策提供参考。方法 以中国健康与养老追踪调查数据库2011年和2015年的数据进行队列研究,调查45岁及以上人群2型糖尿病的风险因素,共纳入3 803名研究对象。研究以人口学变量、生活习惯、血生化指标、2010—2015年气象数据、空气质量监测数据为自变量,糖尿病结局为因变量,采用LASSO回归与随机森林重要性排序进行特征变量选择,构建随机森林预测模型并进行效能评价。结果经随机森林算法分析,空腹血糖、相对湿度、腰围、体质指数、黑碳、硝酸盐、风速、总胆固醇、温度和供暖燃料是2型糖尿病排名前10的重要危险因素。结合LASSO回归与随机森林变量重要性排序构建预测模型。经十折交叉验证,模型灵敏度为62.1%、特异度为98.8%、准确度为95.4%、阳性预测值为89.6%、阴性预测值为96.0%,AUC达84.8%。决策曲线结果显示,模型在阈值0~0.85范围内具有较高的净收益率。结论 高龄、女性、肥胖情况、血检监测数据异常、高血压或卒中病史和环境污染物暴露可能指示2型糖尿病的发生发展,为临床医生对糖尿病高危人群的早期干预提供一定参考依据。
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充