求知
文章
文库
Lib
视频
iPerson
课程
认证
咨询
工具
讲座
Model Center
模型库
会员
找课
开班计划
|
认证培训
|
技术学院
|
管理学院
|
嵌入式学院
|
机械
|
军工学院
|
定向培养
|
专家指导
|
角色培养
电话
English
成功案例
品质保证
成功案例
中航信 数据湖架构原理与应
某医疗磁 数据采集与处理
某科技公 大数据(Hadoo
诺基亚 Python基础
天津电子 Elasticse
中国电信 数据仓库与数据挖掘
某航天科 MySQL性能优化
更多...
相关课程
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
更多...
全部课程
>
大数据
Python信用评分模型及模型优化实战
38 次浏览
2 次
付老师
大数据专家
地点时间:
北京、上海、 深圳根据报名开班
课程费用
:
4000元/人
报公开课
要内训
企业内训:
可以根据企业需求,定制内训,详见
内训学习手册
认证方式:
培训前了解能力模型。
培训后进行能力评测:
在线考试
能力分析,给出学习建议
合格者颁发证书,作为职业技能资格证明
课程简介:
本课程专注于金融行业的数据建模,包括客户行为预测模型、风控识别与风控预测模型、信用评分模型等,面向数据分析部等专门负责数据分析与建模的人士。
本课程的主要目的是,培养学员的大数据意识和大数据思维,掌握常用的数据分析方法和数据分析模型,并能够用于对客户行为作分析和预测,提升学员的数据分析综合能力。
课程目标:
通过本课程的学习,达到如下目的:
1、 掌握数据分析和数据建模的基本过程和步骤
2、 掌握数据分析框架的搭建,及常用分析方法
3、 掌握业务的影响因素分析常用的方法
4、 掌握常用客户行为预测模型,包括逻辑回归、决策树、神经网络等等
5、 掌握模型优化的思路及措施,包括特征优化、超参优化、集成优化等
6、 掌握金融行业信用评分卡模型,构建信用评分模型
本课程突出数据挖掘的实际应用,结合行业的典型应用特点,从实际问题入手,引出相关知识,进行大数据的收集与处理;探索数据之间的规律及关联性,帮助学员掌握系统的数据预处理方法;介绍常用的模型,训练模型,并优化模型,以达到最优分析结果。
培训对象:
风险控制部、金融科技部、IT系统部、数据分析部等对数据建模有较高要求的相关领域人员。
学员要求:
要求熟悉Python语言,熟悉numpy/pandas/sklearn库的使用。
1、 每个学员自备一台便携机(必须)。
2、 环境要求:Python3.10版本以上(建议ananconda+VsCode)
注:讲师可以提供课堂上演示使用数据源及代码
授课方式:
理论知识+ 案例演练 + 操作实战
培训
内容:2天
主题
详细内容
第一部分: 数据分析基础
目的:掌握数据分析基本步骤和过程,学会如何构造数据分析框架
1、 数据决策的三个关键环节
业务数据化:将业务问题转化为数据问题
数据信息化:提取数据中的业务规律信息
信息策略化:基于规律形成业务应对策略
2、 数据分析的六步曲
步骤1:明确目的--理清思路
步骤2:数据收集—理清思路
步骤3:数据预处理—寻找答案
步骤4:数据分析--寻找答案
步骤5:数据展示--观点表达
步骤6:报表撰写--观点表达
第二部分: 搭建业务分析框架
1、 数据分析思路来源于业务模型
2、 分析框架来源于业务模型
商业目标(粗粒度)
分析维度/关键步骤
业务问题(细粒度)
涉及数据/关键指标
案例:搭建精准营销的分析框架(6R)
如何寻找目标客户群
如何匹配合适的产品
如何确定推荐的最佳时机
如何判断合理的价格
案例:搭建用户购买行为分析框架(5W2H)
3、 信用评估需要采集的数据
身份信息、认证数据
消费数据、行为数据
社交数据、设备数据
金融数据
第三部分: 数据建模步骤
1、 预测建模六步法
2、 选择模型
基于业务选择恰当的数据模型
常见模型简介
3、 特征工程
选择对目标变量有显著影响的属性来建模
降维的两种方式:特征选择、因子合并
4、 训练模型
采用合适的算法对模型进行训练,寻找到最优参数
常用模型原理
5、 评估模型
进行评估模型的质量,判断模型是否可用
评估指标、评估方法
6、 优化模型
如果评估结果不理想,则需要对模型进行优化
7、 应用模型
如果评估结果满足要求,则可应用模型于业务场景
第四部分: 银行客户信用卡模型
1、 信用评分卡模型简介
2、 评分卡的关键问题
3、 信用评分卡建立过程
筛选重要属性
数据集转化
建立分类模型
计算属性分值
确定审批阈值
4、 筛选重要属性
属性分段
基本概念:WOE、IV
属性重要性评估
5、 数据集转化
连续属性最优分段
计算属性取值的WOE
6、 建立分类模型
训练逻辑回归模型
评估模型
得到字段系数
7、 计算属性分值
计算补偿与刻度值
计算各字段得分
生成评分卡
8、 确定审批阈值
画K-S曲线
计算K-S值
获取最优阈值
案例:构建银行小额贷款的用户信用模型
9、 信用评分卡的优化方向
改变属性重要性评估方法
采用其他更精准的模型,如决策树、神经网络、集成模型等
第五部分: 其他分类预测模型
问题:如何评估客户购买产品的可能性?如何预测客户的购买行为?如何提取某类客户的典型特征?如何向客户精准推荐产品或业务?
1、 分类模型概述及其应用场景
2、 常见分类预测模型
3、 逻辑回归(LR)
逻辑回归的适用场景
逻辑回归的模型原理
逻辑回归分类的几何意义
逻辑回归的种类:二项、多项
如何解读逻辑回归方程
逻辑回归算法的实现及优化
迭代样本的随机选择
变化的学习率
逻辑回归+正则项
求解算法与惩罚项的互斥有关系
带分类自变量的逻辑回归分析
多项逻辑回归/多分类逻辑回归
ovo, ovr
案例 :用sklearn库实现银行贷款违约预测
案例:订阅者用户的典型特征(二元逻辑回归)
案例:通信套餐的用户画像(多元逻辑回归)
4、 分类决策树(DT)
问题:如何预测客户行为?如何识别潜在客户?
风控:如何识别欠贷者的特征,以及预测欠贷概率?
客户保有:如何识别流失客户特征,以及预测客户流失概率?
决策树分类简介 演练:识别银行欠货风险,提取欠贷者的特征
决策树分类的几何意义
决策树算法(三个关键问题)
如何选择最佳属性来构建节点:熵/基尼系数、信息增益
如何分裂变量:多元/二元划分、最优切割点
修剪决策树:剪枝原则、预剪枝与后剪枝
决策树的解读
决策树的超参优化 案例:商场用户的典型特征提取
案例:客户流失预警与客户挽留
案例:识别拖欠银行货款者的特征,避免不良货款
多分类决策树
案例:识别不同理财客户的典型特征,实现精准推荐
5、 人工神经网络(ANN)
神经网络的结构
神经网络基本原理
加法器,激活函数
神经网络分类的几何意义
神经网络的结构
隐藏层数量
神经元个数
神经网络实现算法
案例:评估银行用户拖欠货款的概率
第六部分: 模型超参优化
1、 模型优化的三大方向
超参优化
特征工程
集成优化
2、 超参优化的方法比较
交叉验证类(RidgeCV/LassoCV/LogisticRegressionCV/…)
网格搜索GridSearchCV
随机搜索RandomizedSearchCV
贝叶斯搜索BayesSearchCV
3、 超参调优策略
第七部分: 特征工程优化
1、 数据清洗技巧
异常数据的处理方式
缺失值的填充方式
不同填充方式对模型效果的影响
2、 降维的两大方式:特征选择和因子合并
3、 特征选择的模式
基于变量本身的重要性筛选
Filter式(特征选择与模型分离)
Wrapper式(利用模型结果进行特征选择)
Embedded式(模型自带特征重要性评估)
确定特征选择的变量个数
案例:客户流失预测的特征选择
4、 因子合并(将多数变量合并成少数几个因子)
因子分析(FactorAnalysis):原理、适用场景、载荷矩阵
主成份分析PCA:原理、几何含义、扩展KernelCA/ICA/…
案例:汽车油效预测
5、 变量变换
为何需要变量变换
因变量变换对模型质量的影响
特征标准化:作用、不同模型对标准化的要求、不同标准化对模型的影响
其它变换:正态化、正则化等
6、 变量派生:基于业务经验的派生、多项式派生
7、 特征工程的管道实现
管道类Pipeline
列转换类ColumnTransformer
特征合并类FeatureUnion
第八部分: 集成算法优化
1、 模型的优化思路
2、 集成算法基本原理
单独构建多个弱分类器
多个弱分类器组合投票,决定预测结果
3、 集成方法的种类:Bagging、Boosting、Stacking
4、 Bagging集成:随机森林RF
数据/属性重抽样
决策依据:少数服从多数
5、 Boosting集成:AdaBoost模型
基于误分数据建模
样本选择权重更新公式
决策依据:加权投票
6、 高级模型介绍与实现
GBDT梯度提升决策树
XGBoost
LightGBM
结束
课程总结与问题答疑。
报公开课
要内训
38 次浏览
2 次
其他人还看了课程
大数据分析挖掘建模 实战训练营
2870 次浏览
企业数字化转型(数据治理、分析&应用)
4623 次浏览
大数据落地技术系列课程
4121 次浏览
数据驱动:数字化转型策略与落地实践
2633 次浏览
《企业级Hadoop大数据处理最佳实践》
2728 次浏览
Python数据建模及模型优化实战(金融版)
35 次浏览
Python数据分析与可视化实战培训
68 次浏览
咨询服务:数据库设计与性能优化
咨询目标
对客户的数据库进行性能评价,设计优化,管理优化
咨询范围
数据库性能评价,数据库结构优化,数据访问SQL优化。
咨询方式
现有数据库调查,问题诊断,性能评价。
对数据库进行逻辑结构优化,对数据库进行访问SQL优化。
建立数据库运行监控平台。运行监控与优化方法指导。
成功案例
建设银行,中国农业银行,中国工商银行,中航信
详情咨询:010-62670969, zhgx@uml.net.cn
课程计划
大模型RAG、MCP与智能体 8-14[厦门]
图数据库与知识图谱 8-28[北京]
OCSMP认证:OCSMP-MBF 8-29[北京]
基于 UML 和EA进行分析设计 9-9[北京]
软件架构设计方法、案例实践 9-24[北京]
需求分析师能力培养 10-30[北京]