专题课程
【课程目标】
对数据挖掘方法论以及项目实施流程有了解,学会用SPSS Modeler进行建模。
本课程介绍了商务智能(数据仓库、SPSS、数据挖掘)基本理论和实际应用技术。着重介绍了数据仓库技术、多维数据模型技术、以及数据挖掘常用算法,课程以通信领域为例,介绍了数据挖掘在行业中的应用状况、案例与主流工具。
【培训对象】
企业的各类管理人员,包括财务总监、财务经理、会计经理、财务主管、预算主管、财务人员、会计人员;销售总监、销售经理、销售主管、销售人员;生产经理、生产管理人员;人力资源经理、人力资源主管;审计经理、审计主管;及其他相关管理人员等。
【培训时长】
4天(24小时)
【课程大纲】
课程编号: |
20140124077 |
授课课时: |
4天 |
授课条件: |
学员必须具有基本的计算机操作知识 |
内容摘要: |
第一天 数据挖掘简介 1- 数据挖掘系统的分类 ² 示例:数据挖掘在各行业中的应用 2- 数据预处理 ² 描述性数据汇总 ² 数据清理 ² 数据集成和变换 ² 数据归约 3- 统计学中的几个基本概念 4- 数据挖掘工具 SPSS Clementine工具简介 ² 工具安装 ² 读取数据文件 ² 建模及模型评价过程 5- Clementine中的数据挖掘各种算法介绍 ² 实验:使用Clementine统计软件进行挖掘前的数据浏览与预处理
第二天 数据挖掘过程CRISP-DM简介 1- 数据挖掘算法概述 ² 关联和相关 ² 购物篮分析 ² 频繁模式挖掘 2- Apriori算法介绍 3- 挖掘各种类型的关联规则 ² 由关联挖掘到相关分析 ² 关联分析算法的使用场景 4- Clementine关联分析技术 ² GRI/Carma/Apriori算法 ² 实例1:使用关联分析进行业务挖掘 ² 实例2:使用关联分析套餐捆绑挖掘
第三天 分类 1- 用决策树归纳分类 2- 神经网络 3- 贝叶斯分类 4- 基于规则的分类 5- 分类算法的使用场景 实例:使用分类方法进行客户流失分析 6- 回归分析与预测 7- 时间序列 8- Clementine分类技术 ² 决策树技术 ² Logistics回归 ² 神经网络 示例:使用回归(时间序列)分析进行网络流量预测
第四天 聚类分析 1- 聚类分析中的数据类型 ² 划分方法 ² 层次方法 ² 基于密度的方法 ² 基于网格的方法 ² 聚类算法的使用场景 2- Clementine聚类技术 ² Kohonen网络 ² 两步聚类 ² K-means ² 实例:聚类分析实例,客户聚类 3- 数据挖掘模型评价 ² Clementine中的模型评估技术 ² 评估图、分析节点
|
授课语言: |
中文 |
- 上一篇:数据仓库与数据挖掘
- 下一篇:数据挖掘和信息提炼Excel