数据挖掘技术培训
数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着信息技术的高速发展,人们积累的数据量急剧增长,动辄以TB计,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为顺应这种需要应运而生发展起来的数据处理技术。
-
数据挖掘技术培训
点击咨询
我们身处一个数据大爆炸的时代,来自移动互联网的数据和未来更多的来自产业互联网的数据正在数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着信息技术的高速发展,人们积累的数据量急剧增长,动辄以TB计,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为顺应这种需要应运而生发展起来的数据处理技术。
数据挖掘技术培训课程介绍
数据挖掘技术培训课程内容
第一部分:SAS基础
1、SAS简介和构成
2、SAS的主要模块和功能
3、SAS的四种运行模式
●窗口环境模式
●非交互模式
●交互式运行模式
●批处理模式
4、掌握SAS的基本数据结构和数据对象
●逻辑库、逻辑引擎、数据集、数据文件、视图
5、SAS基本程序结构
●数据步(DATA STEP)
●过程步(PROC STEP)
6、SAS基本语言介绍
7、数据集的操作
●从文本文件获取
●从外部数据库获取
●数据集导出到外部文件
●读取、浏览、编辑数据集
●创建、编辑、修改、删除
8、对多个数据集的操作
●横向合并
●纵向串接
9、SAS SQL语言
10、 SAS宏语言
案例:演练SAS编程语句
第二部分:数据可视化处理
1、数据报表输出
●基本报表
●高级报表
2、统计图形
●GCHART过程
●GPLOT过程
●CAPABILITY过程
3、各种图形的画法
●柱状图/条形图
●饼图
●折线图
●散点图/气泡图
4、绘图的美化技巧
案例:用SAS作图来实现产品销量分析
第三部分:数据统计分析
1、描述性统计分析
●集中程序
●离散程序
●分布形态
2、参数估计与假设检验
●单样本均值T检验
●独立两样本均值T检验
●配对两样本均值T检验
3、非参数检验文件操作处理
●单样本
●独立两样本
●配对两样本
4、影响因素分析
●相关分析:原理、公式、应用
●方差分析:原理、公式、应用
●卡方分析:原理、公式、应用
●主成分分析/因子分析:降维
案例:掌握常用的过程对数据进行分析
第四部分:数据挖掘基础
1、数据挖掘概述
2、数据挖掘的标准流程(CRISP-DM)
●商业理解
●数据准备
●数据理解
●模型建立
●模型评估
●模型应用
3、数据挖掘常用任务与算法
第五部分:聚类分析(客户细分)实战
1、客户细分常用方法
2、聚类分析(Clustering)
●聚类方法原理介绍及适用场景
●常用聚类分析算法
●聚类算法的评价
案例:使用FASTCLUS实现K均值聚类
案例:使用CLUSTER实现层次聚类法
3、判别分析
●判别分析法原理
●判别分析常见方法:距离判别、Bayes判别、Fisher判别
案例:使用*RIM、CAN*、STEP*实现判别分析
4、RFM模型分析
●RFM模型,更深入了解你的客户价值
●RFM模型与市场策略
案例:航空公司客户价值分析
第六部分:数值预测模型实战
1、常用数值预测的模型
●通用预测模型:回归模型
●季节性预测模型:相加、相乘模型
●新产品预测模型:珀尔曲线与龚铂兹曲线
2、回归分析概念
3、常见回归分析类别
4、回归分析检验
●模型的显著性检验
●回归系数的显著性检验
●残差检验
●拟合程度
●共线性诊断
案例:回归分析
第七部分:分类预测模型实战
1、常见分类预测的模型与算法
2、如何评估分类预测模型的质量
●查准率
●查全率
●ROC曲线
3、逻辑回归分析模型
●逻辑回归的原理
●逻辑回归建模的步骤
●逻辑回归结果解读
4、时间序列分析
案例:用LOGISTIC过程实现银行贷款违约预测
第八部分:SAS优化建模
1、优化模型的基本概念
2、优化建模的步骤
3、线性规划问题
案例:使用OPTMODEL建立线性规划模型
第九部分:SAS智能平台构建及行业解决方案
1、构建SAS解决方案平台
2、平台的体系架构设计
3、实现SAS应用服务器集群
4、平台的安全管理
第十部分:辅导