课程架构:
阶段学习+阶段实战+项目实战+两个选修方向+面试指导
课程内容:
30%原理精讲+60%项目实战+10%解决方案+24小时实时答疑

立即报名
了解详情>>
了解详情>>

需要的基础一:SQL & Java

课程一:Oracle数据库以及SQL
课程二:Java8编程入门
课程三:Java8面向对象
课程四:Java8高级编程
课程五:深入Java虚拟机
课程六:Java业务分析设计实例

需要的基础二:Linux基础

课程一:CentOS 7虚拟机知识以及安装
课程二:Linux基础命令
课程三:Linux权限相关
课程四:bash shell基本编程
课程五:大数据集群需要的基本环境

第一阶段:大数据技术入门Hadoop

课程一:HDFS
课程二:Zookeeper
课程三:MapReduce & Yarn
课程四:avro & parquet & sequenceFile
阶段实战一:HDFS文件的恢复、备份
阶段实战二:Zookeeper实现配置管理
阶段实战三:Zookeeper实现分布式锁
阶段实战四:Hadoop的HA配置
阶段实战五:HDFS小文件的合并
阶段实战六:企业级Yarn资源的分配
阶段实战七:NCDC气象数据分析

第二阶段:Scala语言的学习

课程一:认识Scala
课程二:十二步体验Scala
课程三:面向对象编程基础
课程四:函数式编程基础
课程五:模式匹配
课程六:隐式系统
课程七:类型系统
课程八:集合框架
阶段实战一:编写更函数式程序

第三阶段:Spark核心技术

课程一:Spark环境(开发和集群)的搭建
课程二:正确理解Spark
课程三:Spark核心编程模型之RDD
课程四:正确提交Spark应用(实操课程)
课程五:Schedulers On Driver(原理加实操课程)
课程六:Spark SQL的前生今世以及未来
课程七:有SQL基础就可以玩转Spark SQL
阶段实战一:Spark topN问题
阶段实战二:网站流量分析之session切分
阶段实战三:地图切片
阶段实战四:Spark SQL中schema的合并
阶段实战五:Spark SQL各种数据源的读写
阶段实战六:数据挖掘之关联规则挖掘
阶段实战七:Spark怎么处理Json格式
阶段实战八:物联网设备信息ETL
阶段实战九:Spark SQL分析出租车数据
阶段实战十:Spark航班延迟预测

第四阶段:大数据实时流技术

课程一:Spark Streaming编程模型
课程二:Spark Streaming性能与稳定
课程三:Spark Streaming容错与语义
课程四:Flume
课程五:Kafka
阶段实战一:Spark Streaming集成Flume
阶段实战二:Spark Streaming集成Kafka
阶段实战三:Flume与Kafka集成
阶段实战四:实时计算网站访问指标
阶段实战五:网站用户行为实时分析

第五阶段:NoSQL数据库-HBase

课程一:核心原理之架构原理
课程二:核心原理之缓存机制
课程三:核心原理之Region切分机制
课程四:Java客户端操作HBase
课程五:Solr
阶段实战一:RegionServer内存规划
阶段实战二:Compaction以提高性能
阶段实战三:处理Region太多的场景
阶段实战四:Spark RDD读写HBase
阶段实战五:Spark Streaming读写HBase
阶段实战六:Bulk Load
阶段实战七:HBase + Solr分析产品质量数据
阶段实战八:构建一个Java Web网站

第六阶段:SQL On Hadoop

课程一:Hive
课程二:Spark SQL兼容Hive
课程三:Impala + kudu
课程四:sqoop
课程五:Oozie
课程六:Hue
课程七:Zeppelin
阶段实战一:Spark SQL与Hive的优秀实践
阶段实战二:配置Hive跑在Spark上
阶段实战三:基于Hive的ETL实例
阶段实战四:爬取豆瓣电影数据进行数据分析
阶段实战五:NBA出色球员分析实战

选修一:大数据+AI方向

课程一:微积分基础
课程二:线性代数基础
课程三:概率统计基础
课程四:线性回归及其实战
课程五:模型性能调试
课程六:逻辑回归(分类)及其实战
课程七:支持向量机(SVM)及其实战
课程八:决策树算法及其实战
课程九:K-Means聚类算法及其实战
课程十:PCA降维算法及其使用
课程十一:神经网络及其实战

选修二:大数据进阶方向

课程一:Java设计模式讲解
课程二:JVM虚拟机高级特性
课程一:Spark内核原理(源码分析)
课程二:Kafka内核原理(源码分析)
课程三:ElasticSearch优秀实践
课程四:分布式实时计算之Storm
课程五:Flink

面试指导

1、一对一面试指导
2、往届毕业学员面试经验
3、全面系统的面试题
6
大实战
项目六:
用户画像系统
说明:帮您掌握用户的每一个细节,实现数据驱动利润
项目一:
手把手教你搭建大数据集群
说明:本地搭建大数据小集群,集群虽小,五脏俱全,学习之本,应用之源
项目五:
互联网多媒体智能推荐系统(大数据 + AI项目)
说明:在每一个对外提供服务的互联网企业,推荐系统都是其核心所在。掌握推荐系统就是掌握公司的核心技术。
项目二:
构建企业级大数据数据仓库(大数据平台)
说明:每一个大数据企业的心脏,离它越近,薪水越高
项目四:
亿级用户访问日志实时分析系统
说明:在大数据的项目另一个非常重要的方向就是实时分析项目,实时把握用户的行为
项目三:
奥运会CNTV网站流量分析(PB级别数据量)
说明:基于数据仓库之上的洞察网站用户访问行为的系统,互联网公司的决策之源实时分析
1/随到随学

学员报名之后立马就可以开始学习,无需再等人数够了再开班,每个学员都可以根据自己的时间安排制定自己的学习计划,不会再因为时间不统一落下课。 点击查看详情>>

2/4对1辅导

授课老师、助教老师、班主任、就业指导老师4对1的服务模式,学员可以在线与授课老师和助教老师1对1沟通问题,班主任会通过学习平台可视化数据督促学员学习,就业指导老师会在就业前对学员进行1对1就业指导。 点击查看详情>>

3/闯关式学习

我们的课程是闯关式教学,学员需要完成每一关的作业测试及与助教的视频考核,合格之后才能进去到下一个阶段的学习,保证学员是真正学会了,弥补了学员无法参加面授,没人监督而无法保证自制力和持久力,通过作业测试视频考核也可以检验学员的学习效果,让学员知道自己的学习的程度和效果。 点击查看详情>>

金融领域
应用案例:投资理财
功能描述:通过对个人的信用评估,风险承担能力评估,结合众多理财产品,推荐相应的投资理财产品
岗位需求:数据分析师、数据挖掘工程师、数据分析专家、数据仓库工程师
交通领域
应用案例:智能交通
功能描述:通过对车流量等海量数据的收集,估算,预测该路段一定时间内的车流量情况,给用户提供便利。
岗位需求:Hadoop开发工程师、数据质量稽查工程师、数据可视化工程师、数据分析师
电信领域
应用案例:智慧营业厅
功能描述:通过对用户当前的行为习惯,偏好,节假日的相应数据变化,调整自身业务结构,做到按需分配。
岗位需求:Flink开发工程师、爬虫开发工程师、数据模型开发工程师
安防领域
应用案例:人脸识别
功能描述:通过人脸识别,一一匹配,存储用户数据,结合人工智能,分析及甄别用户行为,预防犯罪等行为发生。
岗位需求:算法工程师、数据质量稽查工程师、数据可视化工程师、数据分析师
传媒领域
应用案例:猜你喜欢
功能描述:通过受众人群的大数据分析,结合对应的算法,将受众喜欢的进行交互推荐,使猜你喜欢变为你会喜欢。
岗位需求:Spark开发工程师、数据挖掘工程师、数据可视化工程师、数据分析师
电商领域
应用案例:精准广告位
功能描述:通过用户的浏览行为,点击行为等大数据采集,分析,挖掘用户的二层三层喜欢,扩大产出。
岗位需求:广告系统开发工程师、爬虫开发工程师、Hive工程师、数据挖掘工程师
政府领域
应用案例:便民服务
功能描述:通过对用户使用习惯,使用频率等大数据采集分析,结合人脸识别,人工智能算法,实现便民服务。
岗位需求:Hadoop开发工程师、机器学习开发工程师、数据可视化工程师、数据分析架构
医疗领域
应用案例:智慧医疗
功能描述:通过对海量病例大数据的存储,匹配,检索,结合用户的饮食,行为等习惯,搭建智慧医疗体系。
岗位需求:爬虫开发工程师、数据质量稽查工程师、大数据平台运维工程师、数据分析师

大数据工程师学习之路
你我一起全力以赴!

点击了解详情