偶遇大数据学习路线,赶上一次科技革命不容易,追求下,要有所作为!
一、Hadoop入门,了解什么是Hadoop
1、Hadoop产生背景
2、Hadoop在大数据、云计算中的位置和关系3、国内外Hadoop应用案例介绍4、国内Hadoop的就业情况分析及课程大纲介绍5、分布式系统概述6、Hadoop生态圈以及各组成部分的简介7、Hadoop核心MapReduce例子说明二、分布式文件系统HDFS,是数据库管理员的基础课程
1、分布式文件系统HDFS简介
2、HDFS的系统组成介绍3、HDFS的组成部分详解4、副本存放策略及路由规则5、NameNode Federation6、命令行接口7、Java接口8、客户端与HDFS的数据流讲解9、HDFS的可用性(HA)三、初级MapReduce,成为Hadoop开发人员的基础课程
1、如何理解map、reduce计算模型
2、剖析伪分布式下MapReduce作业的执行过程3、Yarn模型4、序列化5、MapReduce的类型与格式6、MapReduce开发环境搭建7、MapReduce应用开发8、更多示例讲解,熟悉MapReduce算法原理四、高级MapReduce,高级Hadoop开发人员的关键课程
1、使用压缩分隔减少输入规模
2、利用Combiner减少中间数据3、编写Partitioner优化负载均衡4、如何自定义排序规则5、如何自定义分组规则6、MapReduce优化7、编程实战五、Hadoop集群与管理,是数据库管理员的高级课程
1、Hadoop集群的搭建
2、Hadoop集群的监控3、Hadoop集群的管理4、集群下运行MapReduce程序六、ZooKeeper基础知识,构建分布式系统的基础框架
1、ZooKeeper体现结构
2、ZooKeeper集群的安装3、操作ZooKeeper七、HBase基础知识,面向列的实时分布式数据库
1、HBase定义
2、HBase与RDBMS的对比3、数据模型4、系统架构5、HBase上的MapReduce6、表的设计八、HBase集群及其管理
1、集群的搭建过程讲解
2、集群的监控3、集群的管理九、HBase客户端
1、HBase Shell以及演示
2、Java客户端以及代码演示十、Pig基础知识,进行Hadoop计算的另一种框架
1、Pig概述
2、安装Pig3、使用Pig完成手机流量统计业务十一、Hive,使用SQL进行计算的Hadoop框架
1、数据仓库基础知识
2、Hive定义3、Hive体系结构简介4、Hive集群5、客户端简介6、HiveQL定义7、HiveQL与SQL的比较8、数据类型9、表与表分区概念10、表的操作与CLI客户端演示11、数据导入与CLI客户端演示12、查询数据与CLI客户端演示13、数据的连接与CLI客户端演示14、用户自定义函数(UDF)的开发与演示十二、Sqoop,Hadoop与rdbms进行数据转换的框架
1、配置Sqoop
2、使用Sqoop把数据从MySQL导入到HDFS中3、使用Sqoop把数据从HDFS导出到MySQL中十三、Storm
1、Storm基础知识:包括Storm的基本概念和Storm应用场景,体系结构与基本原理,Storm和Hadoop的对比
2、Storm集群搭建:详细讲述Storm集群的安装和安装时常见问题3、Storm组件介绍: spout、bolt、stream groupings等4、Storm消息可靠性:消息失败的重发5、Hadoop 2.0和Storm的整合:Storm on YARN6、Storm编程实战