信用工程经济建设论文提纲

2022-08-29

论文题目:基于随机森林-Adaboost融合算法的不平衡分类问题研究

摘要:随着我国更加安全稳健的货币体系建设和人民币走向国际货币的进程推进,我国信用贷款业务的蓬勃发展促进了国民经济的发展以及社会经济效益的提升。同时,信贷业务需求的增加带来了一系列新的风险,如何开展更为有效安全的信贷资质审查也变得至关重要。由于实时化、安全化、高容量的数据存储红利,金融机构能够在复杂的业务场景中持续获取各种交易数据,并基于业务数据进行准确的信贷风险评估。在大数据时代,各类金融信贷平台能够在安全的闭环环境中提取海量业务数据,如何充分利用借款人的用户画像数据进行精准的信贷风险预测已经成为一项具有现实意义的课题。目前,机器学习算法已经广泛应用于商业、工程、经济、医学和交通等多个领域。然而,在金融风险预测场景中,真实的信贷数据经常存在数据类分布极端不平衡的问题,从而导致直接应用机器学习模型及其评价指标效果欠佳。在此背景下,需要从不平衡数据处理、分类模型评价指标选择、机器学习算法改进等方面展开研究。本文的主要工作是运用数据挖掘算法,利用真实信贷数据对借款者进行有效分类,帮助投资者决定是否接受贷款。本文采用多种过采样、欠采样以及混合方法对数据集进行平衡处理,该数据处理方法能够结合机器学习模型进行准确的信贷风险评估预测。通过对数据集平衡处理,机器学习模型预测分类的性能大幅度提升,可以辅助信贷平台进行更加可靠安全的贷款决策。本文的主要贡献是提出了一种混合增强融合的机器学习模型,该模型是对主流机器学习算法的深度耦合,能够有效地提高识别和检测不良贷款的能力。实验结果表明,与传统的逻辑回归、随机森林、Adaboost模型相比,本文提出的方法能够在具有明显不平衡类分布的个人信贷数据集上更加有效地识别高风险贷款,分类器整体在多项评价指标中性能更优。

关键词:信贷风险;分类模型;随机森林;Adaboost

学科专业:统计学

摘要

abstract

第一章 绪论

第一节 研究背景及意义

第二节 国内外研究现状

第三节 研究思路与主要内容

第二章 模型相关理论

第一节 逻辑回归

第二节 随机森林

2.2.1 决策树

2.2.2 集成学习

2.2.3 随机森林

第三节 Adaboost算法

第四节 不平衡数据处理

2.4.1 过采样

2.4.2 欠采样

2.4.3 混合方法

第五节 分类模型性能评估

第三章 不平衡数据集处理

第一节 特征选择

3.1.1 变量初选

3.1.2 基于方差的特征选择

3.1.3 基于共线性的特征选择

3.1.4 基于树模型的特征选择

第二节 描述性分析

3.2.1 目标变量分布

3.2.2 可视化分析

第三节 划分训练集和测试集

第四节 训练集平衡处理

3.4.1 基于过采样的训练集平衡处理

3.4.2 基于欠采样的训练集平衡处理

3.4.3 基于混合方法的训练集平衡处理

第五节 评价指标选择

第四章 模型构建与评估

第一节 逻辑回归模型实证分析

4.1.1 模型构建

4.1.2 小结

第二节 随机森林模型实证分析

4.2.1 模型构建

4.2.2 小结

第三节 Adaboost模型实证分析

4.3.1 模型构建

4.3.2 小结

第四节 随机森林-Adaboost融合模型实证分析

4.4.1 基础模型构建

4.4.2 模型改进

4.4.3 消融实验

4.4.4 小结

第五节 模型评估

4.5.1 模型对比

4.5.2 实验分析与总结

第五章 总结与展望

第一节 本文总结

第二节 未来展望

参考文献

致谢

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:广播电视大学教学管理论文提纲下一篇:研究生基础医学论文提纲