上海艾纵企业管理咨询有限公司 - 课程体系 - 专题课程 - 大数据 云计算专题


您好!欢迎来到上海艾纵企业管理咨询有限公司!

加入收藏

登录注册

400-676-1955

专题课程

机器学习(Maching Learning)培训

我要报名

编辑日期 2018-06-14  阅读次数:425 次


 

【培训方式】

以课堂讲解、演示、案例分析为主,辅以互动研讨、现场答疑、学以致用。

 

【目标收益】

    1、 课程从Maching Learning方面的基础知识讲起,结合工作中的事实开始,能让没有Maching Learning知识基础的同学听懂、听会、并能动手实操,不仅从理论上理解Maching Learning也通过实际操作加深理解;

    2、 老师引导学员将Maching Learning知识如何结合工作内容进行思考与使用;

    3、 课程还会在同学们掌握了Maching Learning知识之后,对深度学习和神经网络进行简单介绍,为学员将来深入学习机器学习知识打下坚实基础;

    4、 使学员掌握数据基础和数据挖掘知识;

    5、 使学员更好地理解机器学习的概念、技术、模型、应用等;

    6、 机器学习等相关框架在企业研发、设计与实现等方面的应用经验分享;

使学员具备数据收集、数据分析、数据挖掘、信息提取的能力;

【培训对象】

     1、 本课程适合于想通过数据化决策制定企业战略的决策者;

     2、 适合于经常需要汇报工作的管理者;

     3、 对数据分析、数据挖掘算法等感兴趣的人士;

 

【培训时长】

3


【课程大纲】

课程体系

课程内容是讲师多年经验的总结,通过该课程可以提升学员数据分析与挖掘能力。并且课程理论与实践紧密结合,避免了空洞乏味的技术传授。



时间

内容

第一天

 

第1个主题: 什么是Maching Learning介绍(深入理解Maching Learning的思想)30分钟

1、 什么是Maching Learning

2、 Maching Learning到底能学习什么

3、 Maching Learning到底不能学习什么

4、 深度学习

5、 神经网络

6、 人工智能

7、 数据挖掘

 

第2个主题: 数据挖掘基础(介绍数据挖掘基础知识)30分钟

1、 数据挖掘的基本任务

2、 数据挖掘建模过程

a)      定义挖掘目标

b)     数据取样

c)      数据探索

d)     数据预处理

e)     数据质量与元数据管理

f)      挖掘建模

g)     模型评价

3、 大型企业数据挖掘存在的问题剖析

4、 实例分享:马云预测经济危机案例剖析(10分钟)

 

 

第3个主题: 机器学习算法介绍典型的大数据机器学习算法介绍30分钟

1、 监督式学习

2、 非监督式学习

3、 半监督式学习

4、 回归(预测)与分类

5、 决策树与随机森林

6、 聚类分析

7、 关联规则

8、 协同过滤算法解析

9、 关联规则算法

10、 神经网络

11、 深度学习

 

第4个主题: 回归与分类(深入剖析数据的回归与分类算法)90分钟)

1、 回归与分类

2、 回归分析概念

3、 线性回归模型及其参数估计

4、 一元线性回归

5、 一元线性回归模型

6、 一元线性回归模型求解参数

7、 损失函数

8、 求偏导

9、 回归方程的显著性检验

10、 残差分析

11、 误差项的正态性检验

12、 残差图分析

13、 统计推断与预测

14、 回归模型的选取

15、 穷举法

16、 逐步回归法

17、 岭回归分析

18、 Scikit-learn实现一元线性回归

19、 课堂实操案例:Scikit-learn实现一元线性回归模型检验

20、 多元线性回归概述

21、 多元线性回归模型

22、 金融案例:Scikit-learn实现多元线性回归实现

23、 非线性回归

a)      双曲线函数

b)     幂函数

c)      指数函数

d)     对数函数

e)     S型曲线

24、 案例:Scikit-learn实现非线性回归实现

25、 课堂实操案例:Scikit-learn实现非线性回归实现(时长50分钟;老师带领学员一起操作,及学员问题指导员)

 

第5个主题: Logistic回归算法剖析与实现(剖析Logistic回归与其它回归分析方法)30分钟)

1、 Logistic回归介绍

2、 Logistic函数

3、 二分类与多分类

4、 Logistic回归模型

5、 案例:Scikit-learn实现Logistic回归实现

6、 课堂实操案例:Scikit-learn实现Logistic回归实现(时长20分钟;老师带领学员一起操作,及学员问题指导员)

 

 

时间

内容

第二天

 

第6个主题: 数据建模常用距离(深入剖析数据建模过程中常用的距离模型)30分钟)

1、 数据挖掘常用距离

2、 欧氏距离

3、 曼哈顿距离

4、 切比雪夫距离

5、 闵可夫斯基距离

6、 标准化欧氏距离

7、 马氏距离

8、 夹角余弦

9、 汉明距离

10、 杰卡德距离 & 杰卡德相似系数

11、 相关系数 & 相关距离

12、 信息熵

 

第7个主题: 聚类算法剖析(深入剖析聚类算法以及通过Scikit-learn实现聚类算法模型)60分钟)

1、 什么是聚类算法

2、 样品间相近性的度量

3、 快速聚类法

4、 快速聚类法的步骤

5、 Lm距离进行快速聚类

6、 谱系聚类法

7、 类间距离及其递推公式

8、 谱系聚类法的步骤

9、 变量聚类

10、 案例:Scikit-learn实现聚类实现及绘图

11、 案例:kmeans应用案例剖析

12、 课堂实操:kmeans应用案例剖析(时长30分钟;老师带领学员一起操作,及学员问题指导员)

 

第8个主题: 决策树算法与实现(深入剖析决策树分析以及通过Scikit-learn实现决策树模型分析数据)30分钟)

1、 什么是决策树

2、 决策树构成要素

3、 决策树算法原理

4、 决策树法的决策过程

5、 决策树算法

6、 决策树算法ID3

7、 决策树算法C4.5

8、 案例:Scikit-learn实现实现决策树分析

9、 课堂实操:Scikit-learn实现实现决策树分析(时长30分钟;老师带领学员一起操作,及学员问题指导员)

10、 随机森林

 

 

第9个主题: 支持向量机(SVM)算法剖析(深入剖析SVM以及通过Scikit-learn实现SVM模型分析数据)30分钟)

1、 什么是支持向量机(SVM

2、 支持向量机(SVM)算法原理

3、 超平面

4、 支持向量(SV

5、 SVM线性分类器

6、 对偶优化

7、 核函数

8、 容错

9、 支持向量机(SVM)输入数据格式

10、 支持向量机(SVM)输出结果解析

11、 课堂实操:Scikit-learn实现鸢尾花SVM特征分类

 

第10个主题: Scikit-learn机器学习库概述(深入理解Scikit-learn架构、实现原理及特征)30分钟

1、 Scikit-learn概述

2、 Scikit-learn发展历史

3、 Scikit-learn算法介绍

4、 Scikit-learn架构剖析

5、 Scikit-learn机器学习算法剖析

6、 数据类型

7、 基本统计算法

8、 分类与回归

9、 协同过滤

10、 聚类

11、 降维

12、 特征提取与转换

13、 频繁模式挖掘

14、 评价指标

15、 Scikit-learn编程

16、 Scikit-learn APIs介绍

17、 Scikit-learn机器学习算法应用实战

18、 Scikit-learn实战案例:数据聚类分析案例剖析

 

时间

内容

第三天

 

第11个主题: Scikit-learn协同过滤算法剖析与实践(深入理解Scikit-learn Collaborative Filtering算法的实现原理及开发实战)30分钟

1、 协同过滤

2、 显式与隐式反馈

3、 正则化参数的尺度

4、 欧几里德距离(Euclidean Distance

5、 皮尔逊相关系数(Pearson Correlation Coefficient

6、 Cosine 相似度(Cosine Similarity

7、 Tanimoto 系数(Tanimoto Coefficient

 

第12个主题: 协同过滤应用实战(深入剖析通过协同过滤算法实现个性化精准推荐,精准挖掘客户需求)60分钟

1、 个性化推荐的理论依据

2、 个性化推荐的价值

3、 个性化推荐能达到的目的

4、 个性化推荐的原则

5、 个性化推荐技术发展史

6、 个性化推荐的相关技术

7、 基于用户的常用推荐算法

8、 基于用户的协同过滤推荐

9、 案例剖析:挖掘客户需求大数据推荐案例

10、 推荐引擎

11、 协同过滤的错误用法案例剖析