上海艾纵企业管理咨询有限公司 - 课程体系 - 专题课程 - 大数据 云计算专题


您好!欢迎来到上海艾纵企业管理咨询有限公司!

加入收藏

登录注册

400-676-1955

专题课程

大数据应用

我要报名

编辑日期 2018-06-14  阅读次数:703 次



【目标收益】

随着我国智能电网的发展,电力系统发、输、变、配、用电各个环节的信息化进程不断推进。在用电侧,利用电力大数据分析可以了解产业结构、经济走势、房屋空置率、区域消费能力等情况,从而可以更好地为经济服务。

伴随着智能电网的全面建设,以物联网和云计算为代表的信息通信技术在电力行业中的广泛应用,电力数据资源开始急剧增长并形成了一定的规模。电力与社会经济的发展密切相关,电力需求变化是经济运行的晴雨表风向标,能够真实、客观地反映国民经济的发展状况与态势。因此,发展电力大数据是电力行业革新的必然过程。国家电网公司正在制定以云计算和大数据为技术支撑的信息系统方案,以提高国网公司信息系统的安全性、稳定性、可用性,为公司决策、生产、运营、管理提供更好的支撑平台,助力公司发展方式的转变。

 

【培训对象】

公司专兼职信息通信运维及管理人员。

 

【培训时长】

培训共五天,具体时间为:2015831-94


【课程大纲】

1.大数据(Hadoop)介绍,分布式文件系统应用

2.MapReduce应用及调优

3.hadoop集群及管理

4.hadoop子项zookeeperhbasepighivesqooprdbms应用

5.大数据实战

课程安排

日程

授课主题

课程安排

~

Hadoop入门,了解什么是hadoop

Hadoop产生背景

Hadoop在大数据、云计算中的位置和关系

国内外Hadoop应用案例介绍

国内Hadoop的就业情况分析及课程大纲介绍

分布式系统概述

Hadoop生态圈以及各组成部分的简介

Hadoop核心MapReduce例子说明

分布式文件系统HDFS,是数据库管理员的基础课程

分布式文件系统DFS简介

HDFS的系统组成介绍

HDFS的组成部分详解

副本存放策略及路由规则

NameNode Federation

命令行接口

Java接口

客户端与HDFS的数据流讲解

HDFS的可用性(HA

初级MapReduce,成为Hadoop开发人员的基础课程

如何理解mapreduce计算模型

剖析伪分布式下MapReduce作业的执行过程

Yarn模型

序列化

MapReduce的类型与格式

MapReduce开发环境搭建

MapReduce应用开发

更多示例讲解,熟悉MapReduce算法原理

 

 

 

 

 

~

高级MapReduce,高级Hadoop开发人员的关键课程

使用压缩分隔减少输入规模

利用Combiner减少中间数据

编写Partitioner优化负载均衡

如何自定义排序规则

如何自定义分组规则

MapReduce优化

编程实战

Hadoop集群与管理,是数据库管理员的高级课程

Hadoop集群的搭建

Hadoop集群的监控

Hadoop集群的管理

集群下运行MapReduce程序

ZooKeeper基础知识,构建分布式系统的基础框架

ZooKeeper体现结构

ZooKeeper集群的安装

操作ZooKeeper

HBase基础知识,面向列的实时分布式数据库

HBase定义、HBaseRDBMS的对比

数据模型、系统架构

HBase上的MapReduce、表的设计

HBase集群及其管理

HBase客户端

集群的搭建过程讲解

集群的监控

集群的管理

HBase Shell以及演示

Java客户端以及代码演示

Pig基础知识,进行hadoop计算的另一种框架

Pig概述

安装Pig

使用Pig完成手机流量统计业务

Hive,使用sql进行计算的hadoop框架

数据仓库基础知识

Hive定义、Hive体系结构简介、Hive集群

客户端简介

HiveQL定义、HiveQLSQL的比较

数据类型

表与表分区概念、表的操作与CLI客户端演示

数据导入与CLI客户端演示、查询数据与CLI客户端演示

数据的连接与CLI客户端演示、用户自定义函数(UDF)的开发与演示

Sqoophadooprdbms进行数据转换的框架

配置Sqoop

使用Sqoop把数据从mysql导入到HDFS

使用Sqoop把数据从HDFS导出到mysql

结训考试

结训考试