首页 首页 资源教程 数据资源 查看内容

2017年最新Kaggle 神器:XGBoost 从基础到实战,资源教程下载

木马童年 2021-1-13 16:11 18 0

课程名称XGBoost是极端梯度提升(eXtreme Gradient Boosting)的简称。XGBoost源于梯度提升框架,但是更加高效,秘诀就在于算法能并行计算、近似建树、对稀疏数据的有效处理以及内存使用优化,这使得XGBoost至少比现有 ...

image.png

课程名称

XGBoost是极端梯度提升(eXtreme Gradient Boosting)的简称。XGBoost源于梯度提升框架,但是更加高效,秘诀就在于算法能并行计算、近似建树、对稀疏数据的有效处理以及内存使用优化,这使得XGBoost至少比现有梯度提升实现有至少10倍的速度提升。XGBoost可以处理回归、分类和排序等多种任务。由于它在预测性能上的强大且训练速度快,XGBoost已屡屡斩获Kaggle各大竞赛的冠军宝座。

面向人群:

数学要求低,初级Python编程基础; 想深入学习XGBoost原理及调参; 对机器学习(尤其是竞赛)感兴趣的学生或从业人员。

课程目标:

从数学原理到项目实战: 1)理解模型基本原理,掌握XGBoost参数调优 2)进击Kaggle竞赛 举一反三,更快更好学习其他机器学习模型 1)掌握机器学习模型的一般原理及XGBoost的特别之处

课程目录:

第一讲: 初识XGBoost

一、XGBoost简介 Gradient Boosting简介 XGBoost的特别之处 二、XGBoost的优势 速度 性能 三、与XGBoost的第一次亲密接触 数据科学任务的一般处理流程 XGBoost独立使用 与scikit-learn一起使用(学习率、交叉验证) 四、案例:XGBoost安装包自带数据集(蘑菇分类)

第二讲:暂别XGBoost

一、监督学习 模型 参数 目标函数(损失、正则、过拟合/欠拟合) 优化:梯度下降、常用损失函数的梯度推导 二、分类回归树 模型/参数/目标函数/优化(分裂与剪枝) 三、随机森林 Bagging/行、列随机采样 四、案例:Kaggle蘑菇分类任务

第三讲:重回XGBoost

一、Boosting 基本思想 AdaBoost 二、Gradient Boosting 基本框架 L2Boosting/AdaBoost 三、XGBoost 性能改进:规范的正则、损失函数二阶近似、建树&剪枝、缺失值处理 速度改进:稀疏特征、并行、Cache、分布式 四、案例:Kaggle的Allstate Instance Claim任务

第四讲:XGBoost实战

一、特征工程 常规数据检查流程 特征类型变换编码 特征工程一般原则 二、XGBoost参数调优 评估准则 复习交叉验证 三、XGBoost其他高级应用 多线程,并行 四、案例:Kaggle的Two Sigma Connect:Rental Listing Inquiries任务

并行计算 机器学习 机器学习模型 数据科学 XGBoost 随机森林
0
为您推荐
大数据技术怎么学习,在学习大数据之前,需要具备什么基础?

大数据技术怎么学习,在学习大数据之前,需要具备什么

  大数据又称黑暗数据,是指人脑无法处理的海量数据聚合成的信息资产,在民生、IT、…...

大数据现在处于什么阶段,入行大数据,需要学习哪些基础知识?

大数据现在处于什么阶段,入行大数据,需要学习哪些基

大数据的发展历程总体上可以划分为三个重要阶段,萌芽期、成熟期和大规模应用期…...

对于大数据开发的学习,最经典的学习路线是什么?

对于大数据开发的学习,最经典的学习路线是什么?

对于现代社会,大数据开发的重要性不言而喻,通过大量的数据处理、分析获取有价值的信…...

大数据时代,主要需要什么类型的人才?

大数据时代,主要需要什么类型的人才?

什么是大数据,大数据是主要指的是,无法在可承受的时间范围内用常规软件工具进行捕捉…...

什么样的人才是大数据人才呢?我们应该怎么定义和分类?

什么样的人才是大数据人才呢?我们应该怎么定义和分类

在未来世界,国家之间、区域之间甚至是公司之间的大数据人才的争夺战,将是愈演愈烈的…...

数据科学,数据分析和机器学习之间,有什么本质区别?

数据科学,数据分析和机器学习之间,有什么本质区别?

我们都知道机器学习,数据科学和数据分析是未来的发展方向。有些公司不仅利用大数据帮…...