您的位置: 首页 > 中文期刊论文 > 详情页

基于SMOTE算法和条件生成对抗网络的到港航班延误分类预测

作   者:
刘博卢婷婷张兆宁张健斌
作者机构:
中国南方航空股份有限公司运行指挥中心中国民航大学空中交通管理学院
关键词:
XGBoost模型分类问题合成少数类过采样技术(SMOTE)算法航班延误非平衡数据集条件生成对抗网络
期刊名称:
科学技术与工程
i s s n:
1671-1815
年卷期:
2021 年 034 期
页   码:
14843-14852
摘   要:
由于航班延误数据集类别分布不均,传统分类器的性能受到一定程度的制约。为了能够对到港航班延误情况进行精准预测,提出了一种基于合成少数类过采样技术(synthetic minority oversampling technique, SMOTE)算法和条件生成对抗网络(conditional generative adversarial nets, CGAN)的航班延误预测模型。首先,利用SMOTE算法对原始数据集进行上采样,并融合经过训练的CGAN生成指定样本数据集,缓解原始数据集中某些类别样本量少和数据非平衡等问题;再次,采用XGBoost模型在4种模式训练集上进行训练和超参数寻优;最后,以K近邻、支持向量机和随机森林为基准模型进行性能对比分析。经试验分析,通过分类器在融合样本集的训练,整体上可以在一定程度上提高模型的泛化性,尤其在轻度延误和中度延误类别中提升较为明显,与不采用融合方法比较,宏平均下的Precision、Recall、F1-score值分别提升了0.16、0.29、0.24个百分点。实验结果表明,该方法能够有效地对航班延误非平衡数据进行建模,在保持模型整体性能较高的前提下,能够显著地提升少数类的预测能力,可以为空管、航空公司和机场等提供决策依据。
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充