理解并掌握Spark 整体架构设计与编程模型
能够编写并部署Spark程序与测试代码
掌握能够将kafka结合Spark streaming使用的方法
掌握Spark与HDFS、HBase的结合使用方法
理解Spark与Zookeeper结合高可用性部署方案
能够对Spark进行优化(内存、并发等)
了解在以往经验中容易出现错误的地方以及相应的解决方案
了解Spark MLlib的使用
了解Hadoop MapReduce与Spark的关系与差异
Spark概述
大数据起源
离线分析、在线分析与流计算
开源大数据包Spark概述
Spark的扩展包SQL、MLLib和GraphX
开源社区的组织结构与开源条款
案例解析:一个跨国IT企业的开源包使用法务流程与风险规避
Scala编程原理
Scala:函数式编程
安装Scala集成开发环境
使用Scala分析北京汽车摇号结果
将MapReduce程序迁移到Spark上
实战练习:在本机上使用scala进行简单的spark编程
Spark Streaming流计算
Spark Streaming概述
Kafka概述
基于Kafka数据源的Spark Stream练习
在本机上使用scala进行简单地Spark Streaming编程,数据源使用Kafka
Spark的分布式存储
Standalone Spark集群配置
HDFS集群配置
编写Scala程序访问HDFS
实战练习:在本机上使用scala进行简单的HDFS数据访问
Spark与NOSQL
NOSQL存储特征与数据格式
使用Scala进行HBase数据分析示例
实战练习:在本机上使用scala进行HBase数据访问
Spark与Yarn
Spark on Yarn集群配置
Spark on Yarn与standalone相比的优势
案例分析:某巨型互联网公司基于Spark on Yarn的超大规模集群部署案例分析
Spark与MapReduce
Spark计算模型和MapReduce的对比
Spark与MapReduce的相同点
Spark与MapReduce的差异
Spark性能
Spark资源调度方法
CPU、内存、网络与存储配置对性能的影响及常用调优参数
案例解析:一个跨国IT企业的spark集群构建方法与参数选择
Spark与MLlib
机器学习的常用算法
使用Spark MLlib实现机器学习算法
Spark与ZooKeeper
通过ZooKeeper实现Spark高可用架构
Spark的案例
一个基于Spark与Hadoop的实时分析系统架构设计与实现—某银行的大数据体系介绍以及spark在其中扮演的角色
方案设计
分析算法确定
分析算法与数据流设计
技术实现演示
等....课程
中科信软高级技术服务机构(已成立13年)→13年期间,为各大企业提供:各种软件培训、定制培训、技术咨询、技术支持
时间灵活 地点灵活(北上广深、成都、武汉都有上课点),人数灵活,师资丰富、可按您的需求给您定制课程,匹配教师。
小班授课,公开课,上门内训
特殊技术订制培训或咨询
技术培训,技术咨询,项目承接,专家外包
咨询电话:四零零七九九一九一六 (课程安排和价格详情请电话联系我们!)
邮箱: soft@info-soft.cn
网址:www.zksoft.org/www.info-soft.cn
联系我时,请说是在北京便民网看到的,谢谢!