首页 找课程 找学校 教育新闻 培训问答 课程大全

北京优就业培训中心

15830143330 预约试听 在线客服

您的位置: 首页 > 北京培训 > 北京优就业培训中心 > 数据库工程师培训 > 北京入门学习大数据开发需要多少钱

北京入门学习大数据开发需要多少钱

班制:

其它

[ 开班提醒 ]
上课地址:

北京优就业培训教育中心

活动倒计时
11: 59: 59
马上抢

课程介绍

大数据培训学什么呢?千锋互联大数据培训敢负责任的说,行业真正大数据培训,82%主讲都是hadoop生态体系、spark生态体系、storm实时开发。市面所谓“大数据”培训机构85%基本讲的都是JAVA/PHP数据或数据库学习,而真正的大数据课程含量居然不超过15%!

害怕了吧?颤抖了吧?想去学习大数据一定要看准了靠谱的大数据培训机构,还要看大数据培训机构的课程!千锋互联大数据培训机构是国内首家上市的知名大数据培训机构,大数据培训课程分阶段进行教学逐步深入。课程一阶段:Java核心开发;课程二阶段:JavaEE课程大纲;课程三阶段:Linux精讲;课程四阶段:Hadoop生态体系;课程五阶段:Storm实时开发;课程六阶段:Spark生态体系;课程七阶段:大数据项目实战。

2018年,大数据产业业态和资源要素加速汇聚,大数据核心区引领发展雏形彰显,大数据创新能力开始显现,大数据引领创新发展的体制机制进一步健全和理顺。大数据的技术体系逐步完善,大数据技术的开源模式有效降低了产业技术的壁垒,基础技术在大数据创新中的作用依然存在,但其重要性将逐步降低,大数据创新将更多地依赖于数据驱动和应用驱动。数据驱动创新源于大数据的基础技术体系。

大数据产业已进入发展的“快车道”,急需大量优秀的大数据人才作为后盾。能够在大数据行业崛起的初期进入到这个行业当中来,才有机会成为时代的弄潮儿。千锋大数据开发新进企业级服务器实战教学,20周带你一站式搞定匪夷所思的大数据开发技术。


课程介绍

Spark生态体系
01Spark简介
- 什么是Spark
- Spark大数据处理框架
- Spark的特点与应用场景
- Spark SQL原理和实践
- Spark Streaming原理和实践
- GraphX SparkR入门
- Spark的监控和调优
02Spark部署和运行
- 部署准备与下*
- Spark生态和安装部署
- Local YARN模式部署
- Local模式运行
- Spark Standalone HA安装
- YARN模式运行Spark
- Spark应用程序部署工具spark-submit
03Spark程序开发
- 启动Spark Shell
- 加载text文件
- RDD操作及其应用
- RDD缓存
- 构建Eclipse开发环境
- 构建IntelliJ IDEA开发环境
- 创建SparkContext对象
- 编写编译并提交应用程序
04Spark编程模型
- RDD特征与依赖
- 集合(数组)创建RDD
- 存储创建RDD
- RDD转换 执行 控制操作
- 广播变量
- 累加器
05作业执行解析
- Spark组件
- RDD视图与DAG图
- 基于Standalone模式的Spark架构
- 基于YARN模式的Spark架构
- 作业事件流和调度分析
- 构建应用程序运行时环境
- 应用程序转换成DAG
06Spark SQL与DataFrame
- Spark SQL架构特性
- DataFrame和RDD的区别
- 创建操作DataFrame
- RDD转化为DataFrame
- 加载保存操作与Hive表
- Parquet文件JSON数据集
- 分布式的SQL Engine
- 性能调优 数据类型
07深入Spark Streaming
- Spark Streaming工作原理
- DStream编程模型
- Input DStream
- DStream转换 状态 输出
- 优化运行时间及内存使用
- 文件输入源
- 基于Receiver的输入源
- 输出操作
08Spark MLlib与机器学习
- 机器学习分类级算法
- Spark MLlib库
- MLlib数据类型
- MLlib的算法库与实例
- ML库主要概念
- 算法库与实例
09GraphX与SparkR
- Spark GraphX架构
- GraphX编程与常用图算法
- GraphX应用场景
- SparkR的工作原理
- R语言与其他语言的通信
- SparkR的运行与应用
- R的DataFrame操作方法
- SparkR的DataFrame
10spark项目实战
- 大数据分析系统
- 系统资源分析平台
- 在Spark上训练LR模型
- 获取二级邻居关系图
11scala编程
- scala编程介绍
- Scala基本语法
- Scala开发环境搭建
- Scala开发Spark应用程序
12Python编程
- Python编程介绍
- Python的基本语法
- Python开发环境搭建
- Pyhton开发Spark应用程序
Hadoop生态体系
01Hadoop起源与安装
- 大数据概论
- Google与Hadoop模块
- Hadoop生态系统
- Hadoop常用项目介绍
- Hadoop环境安装配置
- Hadoop安装模式
- Hadoop配置文件
02MapReduce**入门
- WordCount准备开发环境
- MapReduce编程接口体系结构
- MapReduce通信**
- 导入Hadoop的JAR文件
- MapReduce代码的实现
- 打包、部署和运行
- 打包成JAR文件
03Hadoop分布式文件系统
- 认识HDFS及其HDFS架构
- Hadoop的RPC机制
- HDFS的HA机制
- HDFS的Federation机制
- Hadoop文件系统的访问
- JavaAPI接口与维护HDFS
- HDFS权限管理
04Hadoop文件I/O详解
- Hadoop文件的数据结构
- HDFS数据完整性
- 文件序列化
- Hadoop的Writable类型
- Hadoop支持的压缩格式
- Hadoop中编码器和解码器
- gzip、LZO和Snappy比较
05MapReduce工作原理
- MapReduce函数式编程概念
- MapReduce框架结构
- MapReduce运行原理
- Shuffle阶段和Sort阶段
- 任务的执行与作业调度器
- 自定义Hadoop调度器
- YARN架构及其工作流程
06MapReduce编程开发
- WordCount案例分析
- 输入格式与输出格式
- 压缩格式与MapReduce优化
- 辅助类与Streaming接口
- MapReduce二次排序
- MapReduce中的Join算法
- 从MySQL读写数据
- Hadoop系统调优
07Hive数据仓库工具
- Hive工作原理、类型及特点
- Hive操作及Hive复合类型
- Hive的JOIN详解
- Hive优化策略
- Hive内置操作符与函数
- Hive用户自定义函数接口
- Hive的权限控制
08开源数据库HBase
- HBase的特点
- HBase访问接口
- HBase存储结构与格式
- HBase设计
- 关键算法和流程
- HBase的Shell操作
- HBase客户端
09Sqoop与Oozie
- 安装部署Sqoop
- Sqoop数据迁移
- Sqoop使用案例
- Oozie简介
- Oozie与Hive
- Azkaban工作流



机器学习&&深度学习
课程名称 重点内容 目标
一、R语言&&机器学习
1) R语言介绍,基本函数,数据类型
2) 线性回归
3) 朴素贝叶斯聚类
4) 决策树分类
5) k均值聚类

a) 离群点检测

6) 关联规则探索
7) 神经网络
R本身是一款十分优秀的数据分析和数据可视化软件,同时作为第1代机器学习的工具,其中包括大量用于机器学习的添加包。此部分带领大家学习R语言更是带领大家进入机器学习的领域,机器学习算法为主线的同时,经过案例学习将会让大家对内容脉络掌握的更加清晰。
二、Mahout机器学习
1) 介绍为什么使用它,它的前景

a) 简单介绍Mahout

b) 简单介绍机器学习

c) 实例演示Mahout单机推荐程序

2) 配置安装(hadoop2.x版本的)编译安装步骤说明

a) 命令行中测试运行协同过滤概念

3) 推荐

a) 讲解基于用户的协同过滤

b) 讲解基于物品的协同过滤

4) 分类

a) 分类概念

b) 分类的应用及Mahout分类优势

c) 分类和聚类、推荐的区别

d) 分类工作原理

e) 分类中概念术语

f) 分类项目工作流

g) 如何定义预测变量

h) 线性分类器的介绍,及贝叶斯分类器

i) 决策树分类器的介绍,及随机森林分类器

j) 如何使用贝叶斯分类器和随机森林分类器的代码展示

5) 聚类

a) 聚类概念

b) 聚类步骤流程

c) 聚类中的距离测度

d) 讲解K-means聚类

e) K-means聚类算法展示

f) 聚类其他算法

g) 介绍TF-IDF

h) 归一化

i) 微博聚类案例

Mahout提供一些可扩展的机器学习领域经典算法的实现,很多公司会使用Mahout方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。Mahout经过使用 Apache Hadoop,可以有效地扩展到云中。被业界奉为第二代机器学习工具。此部分过后大家不仅会学习到mahout的组件而且会有项目让大家真正把它应用到工作中。
三、项目实战
项目技术架构体系:

a) 分布式平台 Hadoop,MapReduce

b) 数据采集 Flume

c) 数据清洗 ETL

d) 数据库 Hbase,Redis

e) 机器学习 Mahout

微博营销数据挖掘项目使用数据来自微博平台,项目目标经过机器学习所学知识挖掘目标客户群体,找到代言人进行微博营销广告投放。


大数据12_wx.jpg

师资介绍


  • 李老师

    主讲课程:大数据

    简介: 原新浪&&微博的架构师,拥有5年的大数据 研发经验,独自架构并且研发基于Spark的个...详情>>

    预约老师
  • 李老师

    主讲课程:大数据

    简介: 北航大数据技术及应用专业在职研究生在读。 从事企业软件研发工作5年,从事大数据讲师2年,有丰富的 ...详情>>

    预约老师
  • 陈老师

    主讲课程:大数据

    简介: 10余年的软件行业从业经验,有着丰富的 软件设计、管理和开发经验。曾参与研发过餐饮连锁 管...详情>>

    预约老师
  • 邢老师

    主讲课程:java

    简介: 千锋JAVA讲师,多年开发经验,曾参与大型旅游 网站、全国ETC联网等项目。擅长JAVA、Androi...详情>>



我们这里汇集了北京众多的优秀课程和各个方面的培训学校,为各位提供全面的咨询报名服务,欢迎点击访问:北京大数据开发课程汇总

课程定制与咨询:010-64707530 QQ:264567689  金老师

倒计时
11: 59: 19
课程热线:15830143330 | 客服时间:9:00-22:00(其他时间请在线预约报名或留言)
机构介绍
优就业是中公教育IT培训品牌,致力于培养面向互联网领域的高端人才,以学员就业为目的,优质就业为宗旨,是一家集互联网营销师、UI交互设计师、Web前端工程师、Java工程师、PHP工程师、SEO优化师、SEM竞价师、社会化媒体运营师、电商运营师、互联网产品经理、Android工程师、iOS工程师、C/C++工程师、软件测试工程师、Linux云计算工程师、Python工程师、大数据工程师、U...【详情】
相关课程
其他城市
相关机构

申请试听名额

已有10254人申请免费试听

01电话咨询 | 15830143330

QQ:2872347183
加盟合作:0755-83654572