您的位置:
首页
>
中文期刊论文
>
详情页
基于SMOTE算法和条件生成对抗网络的到港航班延误分类预测
- 作 者:
-
刘博;
卢婷婷;
张兆宁;
张健斌;
- 作者机构:
-
中国南方航空股份有限公司运行指挥中心;
中国民航大学空中交通管理学院;
- 关键词:
-
XGBoost模型;
分类问题;
合成少数类过采样技术(SMOTE)算法;
航班延误;
非平衡数据集;
条件生成对抗网络;
- 期刊名称:
- 科学技术与工程
- i s s n:
- 1671-1815
- 年卷期:
-
2021 年
034 期
- 页 码:
- 14843-14852
- 摘 要:
-
由于航班延误数据集类别分布不均,传统分类器的性能受到一定程度的制约。为了能够对到港航班延误情况进行精准预测,提出了一种基于合成少数类过采样技术(synthetic minority oversampling technique, SMOTE)算法和条件生成对抗网络(conditional generative adversarial nets, CGAN)的航班延误预测模型。首先,利用SMOTE算法对原始数据集进行上采样,并融合经过训练的CGAN生成指定样本数据集,缓解原始数据集中某些类别样本量少和数据非平衡等问题;再次,采用XGBoost模型在4种模式训练集上进行训练和超参数寻优;最后,以K近邻、支持向量机和随机森林为基准模型进行性能对比分析。经试验分析,通过分类器在融合样本集的训练,整体上可以在一定程度上提高模型的泛化性,尤其在轻度延误和中度延误类别中提升较为明显,与不采用融合方法比较,宏平均下的Precision、Recall、F1-score值分别提升了0.16、0.29、0.24个百分点。实验结果表明,该方法能够有效地对航班延误非平衡数据进行建模,在保持模型整体性能较高的前提下,能够显著地提升少数类的预测能力,可以为空管、航空公司和机场等提供决策依据。
相关作者
载入中,请稍后...
相关机构
载入中,请稍后...