首页 找课程 找学校 教育新闻 培训问答 课程大全

北京千锋教育IT培训

010-64707530 免费试听 在线客服

您的位置: 首页 > 北京培训 > 北京千锋教育IT培训 > 数据库工程师培训 > 北京好的大数据开发培训学校在哪

北京好的大数据开发培训学校在哪

班制:

其它

[ 开班提醒 ]
上课地址:

千锋教育

活动倒计时
11: 59: 59
马上抢

课程介绍

为什么你要学习大数据

大数据作为中国官方重点扶持的战略性新兴产业,已逐步从概念走向落地“大数据”和“虚拟化”两大热门领域,得到了广泛关注和重视。90%企业都在使用大数据,大数据开发人员的薪资待遇也水涨船高。统计数据显示,大数据开发工程师的就业薪资在5000-27000之间,有工作经验者更高。你选择了大数据就意味着高薪和广阔的未来。

千锋大数据开发靠什么引领群雄?

很多人想要站在大数据时代的风口却无从下手,千锋作为中国IT职业教育的领 先品牌顺势而为重磅推出大数据课程,采用“技术+管理”集合的方式,让你快速掌握大数据生态体系的各个模块的功能和开发技术,成为当下企业紧缺的“复合型”研发人才。

大数据相关技术方向

1. Hadoop大数据开发方向;

2. 大数据运维& 云计算方向;

3. 数据挖掘、数据分析&机器学**方向。

三个方向中,大数据开发是基础。以Hadoop开发工程师为例,Hadoop入门薪资已经达到了 8K 以上,工作1年可达到 1.2W 以上,具有2-3年工作经验的hadoop人才年薪可以达到 30万—50万,一般需要大数据处理的公司基本上都是大公司,所以学**大数据专业也是进大公司的捷径!

精通任何方向之一者,均会“ 前(钱)”途无量。

大数据相关的技术有:Hadoop、Linux、Oracle、 Jquery、 Spark、 Storm、Servlet、Python、Nginx、Memcached、Matlab、Scala、Maven等。

课程介绍

Storm实时开发
01storm简介与基本知识
- storm的诞生诞生与成长
- storm的优势与应用
- storm基本知识概念和配置
- 序列化与容错机制
- 可靠性机制—**消息处理
- storm开发环境与生产环境
- storm拓扑的并行度
- storm命令行客户端
02拓扑详解与组件详解
- 流分组和拓扑运行
- 拓扑的常见模式
- 本地模式与stormsub的对比
- 使用非jvm语言操作storm
- hook 组件基本接口
- 基本抽象类
- 事务接口
- 组件之间的相互关系
03Hadoop分布式系统
- 认识HDFS及其HDFS架构
- Hadoop的RPC机制
- HDFS的HA机制
- HDFS的Federation机制
- Hadoop文件系统的访问
- JavaAPI接口与维护HDFS
- HDFS权限管理
04spout详解与bolt详解
- spout获取数据的方式
- 常用的spout
- 学习编写spout类
- bolt概述
- 可靠的与不可靠的bolt
- 复合流与复合anchoring
- 使用其他语言定义bolt
- 学习编写bolt类
05zookeeper详解
- zookeeper简介
- zookeeper的下*和部署
- zookeeper的配置与运行
- zookeeper的本地模式实例
- zookeeper的数据模型
- zookeeper命令行操作范例
- storm在zookeeper中的目录结构
06storm安装与集群搭建
- storm集群安装步骤与准备
- 本地模式storm配置命令
- 配置hosts文件 安装jdk
- zookeeper集群的搭建
- 部署节点
- storm集群的搭建
07storm-starter详解
- storm-starter项目概述
- 使用maven进行管理
- 在eclipse中运行
- 使用daemontools监控storm进程
- 使用monit监控storm
- 常用的集群操作命令
- drpctopologybuilder
- Hive的权限控制
08开源数据库HBase
- HBase的特点
- HBase访问接口
- HBase存储结构与格式
- HBase设计
- 关键算法和流程
- HBase安装
- HBase的Shell操作
- HBase客户端
09trident详解
- trident概述
- Trident API 实践
- Trident操作详解
- trident spout
- 文件系统分析
- acking框架的实现
- metric
02前端工程化与模块化应用
- 项目截图:
- 项目说明:
SinaSpider主要爬取新浪微博的个人信息、微博数据、关注和粉丝。环境、架构:
- 开发语言:
Python2.7
- 开发环境:
64位Windows7系统,4G内存,i7-3612QM处理器。
- 数据库:
MongoDB 3.2.0 (Python编辑器:Pycharm 5.0.4;MongoDB管理工具:MongoBooster 1.1.1)
- 主要使用 scrapy 爬虫框架。
- 下*中间件会从Cookie池和User-Agent池中随机抽取一个加入到spider中。
- start_requests 中根据用户ID启动四个Request,同时对个人信息、微博、关注和粉丝进行爬取。
- 将新爬下来的关注和粉丝ID加入到待爬队列(先去重)。

机器学习&&深度学习
课程名称 重点内容 目标
一、R语言&&机器学习
1) R语言介绍,基本函数,数据类型
2) 线性回归
3) 朴素贝叶斯聚类
4) 决策树分类
5) k均值聚类

a) 离群点检测

6) 关联规则探索
7) 神经网络
R本身是一款十分优秀的数据分析和数据可视化软件,同时作为第1代机器学习的工具,其中包括大量用于机器学习的添加包。此部分带领大家学习R语言更是带领大家进入机器学习的领域,机器学习算法为主线的同时,经过案例学习将会让大家对内容脉络掌握的更加清晰。
二、Mahout机器学习
1) 介绍为什么使用它,它的前景

a) 简单介绍Mahout

b) 简单介绍机器学习

c) 实例演示Mahout单机推荐程序

2) 配置安装(hadoop2.x版本的)编译安装步骤说明

a) 命令行中测试运行协同过滤概念

3) 推荐

a) 讲解基于用户的协同过滤

b) 讲解基于物品的协同过滤

4) 分类

a) 分类概念

b) 分类的应用及Mahout分类优势

c) 分类和聚类、推荐的区别

d) 分类工作原理

e) 分类中概念术语

f) 分类项目工作流

g) 如何定义预测变量

h) 线性分类器的介绍,及贝叶斯分类器

i) 决策树分类器的介绍,及随机森林分类器

j) 如何使用贝叶斯分类器和随机森林分类器的代码展示

5) 聚类

a) 聚类概念

b) 聚类步骤流程

c) 聚类中的距离测度

d) 讲解K-means聚类

e) K-means聚类算法展示

f) 聚类其他算法

g) 介绍TF-IDF

h) 归一化

i) 微博聚类案例

Mahout提供一些可扩展的机器学习领域经典算法的实现,很多公司会使用Mahout方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。Mahout经过使用 Apache Hadoop,可以有效地扩展到云中。被业界奉为第二代机器学习工具。此部分过后大家不仅会学习到mahout的组件而且会有项目让大家真正把它应用到工作中。
三、项目实战
项目技术架构体系:

a) 分布式平台 Hadoop,MapReduce

b) 数据采集 Flume

c) 数据清洗 ETL

d) 数据库 Hbase,Redis

e) 机器学习 Mahout

微博营销数据挖掘项目使用数据来自微博平台,项目目标经过机器学习所学知识挖掘目标客户群体,找到代言人进行微博营销广告投放。


大数据12_wx.jpg

千锋教育


欢迎点击访问:北京大数据开发课程汇总

欢迎您访问到我们网站如果想了解更多北京软件系统类别课程请访问:北京软件系统课程汇总

课程定制与咨询:010-64707530 QQ:264567689  金老师

倒计时
11: 59: 19
课程热线:010-64707530 | 客服时间:9:00-22:00(其他时间请在线预约报名或留言)
机构介绍
千锋教育隶属于北京千锋互联科技有限公司,一直秉承“用良心做教育”的理念,致力于打造IT教育全产业链人才服务平台,公司总部位于北京,目前已在深圳、上海、郑州、广州、大连、武汉、成都、西安、杭州、青岛、重庆、长沙、哈尔滨成立了分公司,全国14个城市年培养优质人才20000余人,同期在校学员5000余人,合作院校超500所,合作企业超10000家,每年有数十万名学员受益于千锋教育组织的技术研讨会、技术培训课...【详情】
相关课程
其他城市
相关机构

申请试听名额

已有10254人申请免费试听

01电话咨询 | 010-64707530

QQ:2645567689
加盟合作:0755-83654572