|  
             | 
 
 | 
   
  | 
          
            
              
   
 
 全部课程 >大数据   |  
 |  
                 
                  
                        
                           
                            大数据分析专题-R语言培训 
                                | 
                           
  
                                    
8360 次浏览   62 次 
 | 
                                   
                           |  
                          
                            | 
 | 
                           
                           
                            | 地点时间:北京、深圳、上海根据报名开班    | 
                           
                           
                            | 课程费用:5000元/人 
                             | 
                           
 |  
                       
                              | 
 | 
                         
   
                              | 
                        
 |  
                           
                            | 企业内训:可以根据企业需求,定制内训,详见 
                              内训学习手册 | 
                           
                          
                            
  | 
                           
                                 
                                    | 
								  
								  
                                   认证方式: 
                                    培训前了解能力模型。 
                                      培训后进行能力评测: 
                                     在线考试
                                      能力分析,给出学习建议
                                      合格者颁发证书,作为职业技能资格证明 
                                       
                                     | 
									    | 
                                 
                                |  
							   
                            
  | 
                           
                           
                            |   在互联网思维、互联网经济、移动互联、电子商务等新兴产业纷纷走上历史舞台的大背景下,越来越多的数据使得数据分析技术成为关键的商业竞争技术之一,大数据时代来临了,大数据分析行业也应运而生。从所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。那么越来越多的应用涉及到大数据,而这些大数据的属性,包括数量,速度,多样性等等都是呈现了大数据不断增长的复杂性,所以大数据的分析方法在大数据领域就显得尤为重要,可以说是决定最终信息是否有价值的决定性因素。基于如此的认识,大数据分析普遍存在的方法理论有哪些呢? 
                               大数据分析的五个基本方面包括:可视化分析,数据挖掘算法,数据平台工具,语义引擎,数据质量和数据管理, 
                              而大数据分析又是重中之重,R语言作为大数据分析利器,正在逐渐被大家所接受与使用。本次培训通过两天的培训帮助大家掌握R语言基本理论   
                             | 
                           
                           
                            | 培训目标:    | 
                           
                           
                            
                                - 掌握数据挖掘与数据分析原理
 
                                - 了解常见的挖掘算法分类,聚类等
 
                                -  R语言基础深入掌握
 
                                - R 语言环境下的聚类分析,决策树与随机森林,逻辑回归,聚类。
 
                               
                             
                               | 
                           
                           
                            | 培训对象:希望掌握R语言算法的工程师 | 
                           
                           
                            | 学员基础:具有大数据分析经验的分析师等 | 
                           
                           
                            | 授课方式: 定制课程 + 案例讲解 
                              + 小组讨论,60%案例讲解,40%实践演练 | 
                           
                           
                            | 培训内容:2天 
                                | 
                           
                           
                            
                                 
                                  | 统计学基本原理 
                                    
                                     | 
                                  
                                      - 何谓研究
 
                                      - 常见的研究名词:概念性架构、模型、操作型定义、变量、命题与假设 
 
                                      - 问卷设计原则与操作 
 
                                      - 研究中常见的变量:自变量、依变量、中介变量、干扰变量及控制变量 
 
                                      - 统计分析常用的名词:平均数、众数、方差、协方差、标准偏差、标准误 
 
                                      - 测量尺度的应用:名目尺度、顺序尺度、区间尺度及比例尺度 
 
                                      - 估计(Confidence Interval, CI)与检定(P-value)
 
                                      - 自由度 9. 统计的假设:常态、同质、独立 10. 信度 
 
                                      - 效度:表面效度、内容效度、效标效度、建构效度(收敛效度及区别效度
 
                                     
                                   | 
                                 
                                 
                                  | R语言基础 
                                     | 
                                  
                                      - R简介、数据类型介绍、R的数据可视化、常用R包介绍。R集成开发环境 
 
                                      - 数据整理:数据的读入输出、控制流、各种图表,常用统计量计算 
 
                                      - 数据展现1:基本制图函数综述、理解关键制图参数 
 
                                      | 
                                 
                                 
                                  | R语言数据可视化 
                                     | 
                                  
                                      - 数据展现2:散点图、线图与时间序列谱图,案例:股价走势可视化展现 
 
                                      - 数据展现3:柱形图,点图,饼图,直方图,案例:销售数据可视化展现 
 
                                      - 数据展现4:箱线图,热力图,等高线,地图,案例:Facebook好友联系图 
                                      
 
                                      | 
                                 
                                 
                                  | Logistic回归与商业大数据建模 | 
                                  
                                      - Logistic回归是商业建模的常用重要数据挖掘方法,本讲要讲清楚Logistic回归的建模原理、与多元线性模型的区别、R语言实现过程及回归诊断注意事项、预测方法和结果解释,让学员彻底地掌握Logistic回归解决问题的R语言方法。 
                                      
 
                                      - 主要案例: 
 
                                      - 案例2:利用Logistic回归分析网页点击流量 
 
                                      - 案例3:利用Logistic回归分析婚外情
 
                                     
                                   | 
                                 
                                 
                                  | 关联规则和R语言实现 
                                     | 
                                  
                                      - 关联规则(著名的“啤酒和尿布”)是数据挖掘的基础和核心技术之一,本讲将着重围绕经典的Apriori算法和eclat算法,阐明关联规则的支持、置信和提升程度与控制,使用R语言快速完成关联规则分析。 
                                      
 
                                      - 主要案例: 
 
                                      - 案例1:使用R语言关联规则方法帮助各个超市实现商品的最佳捆绑销售方案(即“购物篮”分析); 
                                      
 
                                      | 
                                 
                                 
                                  | 决策树(回归树)分析和随机森林R语言实现 
                                     | 
                                  
                                      - 决策树是数据挖掘的经典方法,其原理容易被理解。本讲主要讲授两种最为普遍的决策树算法:CART和C4.5算法,使用rpart和J48函数进行R语言分析。 
                                      
 
                                      - 主要案例: 
 
                                      - 案例1:对汽车销量走势预测 
 
                                      | 
                                 
                                 
                                  R语言聚类算法 
                                     
                                     | 
                                   
                                     
                                      - 在机器学习中,聚类算法包括,层次聚类法,谱系图,k平均值法,k中心法 
 
                                      - 是非常重要的算法模块 
 
                                      - 主要案例: 
 
                                      - 案例1:推荐系统 
 
                                      | 
                                 
                                | 
                           
                           
                            |   | 
                           
                        
                       
                     | 
                 
                
                 
                  
                    
 
   
    |   | 
      | 
 | 
      | 
     | 
  | 
   
   
     
      8360 次浏览   62 次
       | 
   
   
    | 其他人还看了课程 | 
   
   
     | 
   
 
 
                   | 
                 
              
              |