要资料 文章 文库 Lib 视频 Code iProcess 课程 认证 服务 工具 火云堂 讲座吧   成长之路  
会员   
 
 
 
 
全部课程 | 技术学院 | 管理学院 | 嵌入式学院 | 在线学院  
成功案例   品质保证  电话 English
追随技术信仰

随时听讲座
每天看新闻
 
   
成功案例
财政部唯 大数据分析专题-R
神龙汽车 大数据技术平台-H
中国电信 大数据时代与现代企
某知名银 大数据分析专题-R
IGT 数据分析与挖掘
某风电企 R语言数据分析
某车联网 数据分析与挖掘

相关课程  
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
 

大数据分析专题-R语言培训
James
某世界知名企业首席大数据架构师。
报名课程   1713 次浏览    215 次 
地点时间:北京、上海、深圳根据报名开班   
课程费用:5000元/人
企业内训:可以根据企业需求,定制内训,详见 内训学习手册

在互联网思维、互联网经济、移动互联、电子商务等新兴产业纷纷走上历史舞台的大背景下,越来越多的数据使得数据分析技术成为关键的商业竞争技术之一,大数据时代来临了,大数据分析行业也应运而生。从所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。那么越来越多的应用涉及到大数据,而这些大数据的属性,包括数量,速度,多样性等等都是呈现了大数据不断增长的复杂性,所以大数据的分析方法在大数据领域就显得尤为重要,可以说是决定最终信息是否有价值的决定性因素。基于如此的认识,大数据分析普遍存在的方法理论有哪些呢?

大数据分析的五个基本方面包括:可视化分析,数据挖掘算法,数据平台工具,语义引擎,数据质量和数据管理,

而大数据分析又是重中之重,R语言作为大数据分析利器,正在逐渐被大家所接受与使用。本次培训通过两天的培训帮助大家掌握R语言基本理论

培训目标:
  • 掌握数据挖掘与数据分析原理
  • 了解常见的挖掘算法分类,聚类等
  • R语言基础深入掌握
  • R 语言环境下的聚类分析,决策树与随机森林,逻辑回归,聚类。
培训对象:希望掌握R语言算法的工程师
学员基础:具有大数据分析经验的分析师等
授课方式: 定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练

培训内容:2天

统计学基本原理
  • 何谓研究
  • 常见的研究名词:概念性架构、模型、操作型定义、变量、命题与假设
  • 问卷设计原则与操作
  • 研究中常见的变量:自变量、依变量、中介变量、干扰变量及控制变量
  • 统计分析常用的名词:平均数、众数、方差、协方差、标准偏差、标准误
  • 测量尺度的应用:名目尺度、顺序尺度、区间尺度及比例尺度
  • 估计(Confidence Interval, CI)与检定(P-value)
  • 自由度 9. 统计的假设:常态、同质、独立 10. 信度
  • 效度:表面效度、内容效度、效标效度、建构效度(收敛效度及区别效度
R语言基础
  • R简介、数据类型介绍、R的数据可视化、常用R包介绍。R集成开发环境
  • 数据整理:数据的读入输出、控制流、各种图表,常用统计量计算
  • 数据展现1:基本制图函数综述、理解关键制图参数
R语言数据可视化
  • 数据展现2:散点图、线图与时间序列谱图,案例:股价走势可视化展现
  • 数据展现3:柱形图,点图,饼图,直方图,案例:销售数据可视化展现
  • 数据展现4:箱线图,热力图,等高线,地图,案例:Facebook好友联系图
Logistic回归与商业大数据建模
  • Logistic回归是商业建模的常用重要数据挖掘方法,本讲要讲清楚Logistic回归的建模原理、与多元线性模型的区别、R语言实现过程及回归诊断注意事项、预测方法和结果解释,让学员彻底地掌握Logistic回归解决问题的R语言方法。
  • 主要案例:
  • 案例2:利用Logistic回归分析网页点击流量
  • 案例3:利用Logistic回归分析婚外情
关联规则和R语言实现
  • 关联规则(著名的“啤酒和尿布”)是数据挖掘的基础和核心技术之一,本讲将着重围绕经典的Apriori算法和eclat算法,阐明关联规则的支持、置信和提升程度与控制,使用R语言快速完成关联规则分析。
  • 主要案例:
  • 案例1:使用R语言关联规则方法帮助各个超市实现商品的最佳捆绑销售方案(即“购物篮”分析);
决策树(回归树)分析和随机森林R语言实现
  • 决策树是数据挖掘的经典方法,其原理容易被理解。本讲主要讲授两种最为普遍的决策树算法:CART和C4.5算法,使用rpart和J48函数进行R语言分析。
  • 主要案例:
  • 案例1:对汽车销量走势预测
R语言聚类算法
  • 在机器学习中,聚类算法包括,层次聚类法,谱系图,k平均值法,k中心法
  • 是非常重要的算法模块
  • 主要案例:
  • 案例1:推荐系统
1713 次浏览   215 次
其他人还看了课程
数据统计分析方法与工具、实践  561 次浏览
大数据分析-SparkR  803 次浏览
大数据落地技术系列课程  1013 次浏览
大数据分析专题-R语言培训  1714 次浏览
CDH Cloudera Manager管理实战与案例解析  1162 次浏览
大数据(Hadoop、Spark、NoSQL等)的技术与实践  997 次浏览
定制内训


咨询服务:大数据技术平台构建与应用
咨询目标 帮助客户设计、规划大数据架构
帮助客户建立大数据技术平台,
帮助客户建立大数据分析模型
咨询范围 大数据架构:数据结构模型,存储空间,数据分析模型
大数据技术平台:分布式存储与计算平台,采集工具,分析工具
大数据分析应用案例:分析模型,结果报告
咨询方式 调查分析客户当前的数据资源和使用情况。
为客户设计大数据架构
搭建大数据技术平台
建立大数据分析应用示例。
详情咨询:010-62670969, zhgx@uml.net.cn

最新活动计划
[北京]敏捷开发过程及最佳实践 12-5
[北京]嵌入式软件测试 11-16
[北京]人工智能机器和深度学习11-20
[北京]Git版本控制与配置管理 11-21
[北京]UML和EA进行系统分析设计 11-23
[北京]DevOps体系实践、工具与平台11-27
[上海]软件架构设计方法案例实践 11-16
[上海]嵌入式C高质量编程 11-21
[上海]嵌入式架构设计高级实践11-23
[深圳]需求分析与管理 11-23
 
 
 

 
每天2个文档/视频
扫描微信二维码订阅
订阅技术月刊
获得每月300个技术资源
 
希望我们的资料可以帮助你学习,也欢迎投稿&提建议给我
频道编辑:sky
邮       件:sky@uml.net.cn

关于我们 | 联系我们 | 京ICP备10020922号 京公海网安备110108001071号