求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Model Center   Code  
会员   
 
 
 
开班计划 | 技术学院 | 管理学院 | 嵌入式学院 | 机械 | 军工学院 | 定向培养 | 专家指导  
 电话 English
成功案例   品质保证
 
   
成功案例
某科技公 研发经理的领导力与
平安 从技术到管理
某企业 基于IPD的嵌入式
某企业 自我认知、情绪管理
某企业 思维导图方法与实践
中盛益华 卓越管理者必须具备
世纪高通 创新创造突破性产品

相关课程  
新产品研发管理
产品经理与产品管理
产品规划方法与技能
产品发布、推广与应用支持
面向产品的需求分析与管理
技术资源规划与调配方法
 

全部课程 >办公  
对比Excel,轻松学习Python数据分析
1823 次浏览  51 次
时间地点:北京上海,深圳,根据报名开班
课程费用:4000元/人

企业内训:可以根据企业需求,定制内训,详见 内训学习手册



认证方式:
培训前了解能力模型。
培训后进行能力评测:
  • 在线考试
  • 能力分析,给出学习建议
  • 合格者颁发证书,作为职业技能资格证明


         Python虽然是一门编程语言,但是在数据分析领域实现的功能和Excel的基本功能一样,而Excel又是大家比较熟悉、容易上手的软件,可以通过Excel数据分析去对比学习Python数据分析。本课程将对数据分析过程中涉及的操作进行讲解,让你从熟悉的Excel操作中去学习对应的Python实现,而不是直接学习Python代码,大大降低了学习门槛,消除了大家对代码的恐惧心理。

    培训对象:

    • Excel已经用的熟练,想学习python来丰富自己的技能数的数据分析师
    • 刚入行,对Excel和python都不精通的数据分析师
    • 其他常用Excel却想通过学习python提高工作效率的人。
    学员基础:有一定Excel基础的人员
    授课方式: 定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练
    培训内容:3天
    数据分析基础 1.1 数据分析是什么
    1.2 为什么要做数据分析
      1.2.1 现状分析
      1.2.2 原因分析
      1.2.3 预测分析
    1.3 数据分析究竟在分析什么
      1.3.1 总体概览指标
      1.3.2 对比性指标
      1.3.3 集中趋势指标
      1.3.4 离散程度指标
      1.3.5 相关性指标
      1.3.6 相关关系与因果关系
    1.4 数据分析的常规流程
      1.4.1 熟悉工具
      1.4.2 明确目的
      1.4.3 获取数据
      1.4.4 熟悉数据
      1.4.5 处理数据
      1.4.6 分析数据
      1.4.7 得出结论
      1.4.8 验证结论
      1.4.9 展示结论
    1.5 数据分析工具:Excel 与Python

    Python 基础知识
    2.1 Python 是什么
    2.2 Python 的下载与安装
      2.2.1 安装教程
      2.2.2 IDE 与IDLE
    2.3 介绍Jupyter Notebook
      2.3.1 新建Jupyter Notebook 文件
      2.3.2 运行你的第一段代码
      2.3.3 重命名Jupyter Notebook 文件
      2.3.4 保存Jupyter Notebook 文件
      2.3.5 导入本地Jupyter Notebook 文件
      2.3.6 Jupyter Notebook 与Markdown ...
      2.3.7 为Jupyter Notebook 添加目录
    2.4 基本概念
      2.4.1 数
      2.4.2 变量
      2.4.3 标识符
      2.4.4 数据类型
      2.4.5 输出与输出格式设置
      2.4.6 缩进与注释
    2.5 字符串
      2.5.1 字符串的概念
      2.5.2 字符串的连接
      2.5.3 字符串的复制
      2.5.4 获取字符串的长度
      2.5.5 字符串查找
      2.5.6 字符串索引
      2.5.7 字符串分隔
      2.5.8 移除字符
    2.6 数据结构――列表
      2.6.1 列表的概念
      2.6.2 新建一个列表
      2.6.3 列表的复制
      2.6.4 列表的合并
      2.6.5 向列表中插入新元素
      2.6.6 获取列表中值出现的次数
      2. 6.7 获取列表中值出现的位置
      2.6.8 获取列表中指定位置的值
      2.6.9 删除列表中的值
      2.6.10 对列表中的值进行排序
    2.7 数据结构――字典
      2.7.1 字典的概念
      2.7.3 字典的keys()、values()和items()方法
    2.8 数据结构――元组
      2.8.1 元组的概念
      2.8.2 新建一个元组
      2.8.3 获取元组的长度
      2.8.4 获取元组内的元素
      2.8.5 元组与列表相互转换
      2.8.6 zip()函数
    2.9 运算符
      2.9.1 算术运算符
      2.9.2 比较运算符
      2 .9.3 逻辑运算符
    2.10 循环语句
      2.10.1 for 循环
      2.10.2 while 循环
    2.11 条件语句
      2.11.1 if 语句
      2.11.2 else 语句
      2.11.3 elif 语句
    2.12 函数
      2.12.1 普通函数
      2.12.2 匿名函数
    2.13 高级特性
      2.13.1 列表生成式
      2.13.2 map 函数
      2.14 模块
    Pandas 数据结构 3.1 Series 数据结构
      3.1.1 Series 是什么
      3.1.2 创建一个Series
      3.1.3 利用index 方法获取Series 的索引
      3.1.4 利用values 方法获取Series 的值
    3.2 DataFrame 表格型数据结构
      3.2.1 DataFrame 是什么
      3.2.2 创建一个DataFrame
      3.2.3 获取DataFrame 的行、列索引
      3.2.4 获取DataFrame 的值
    获取数据源 4.1 导入外部数据
      4.1.1 导入.xlsx 文件
      4.1.2 导入.csv 文件
      4.1.3 导入.txt 文件
      4.1.4 导入sql 文件
    4.2 新建数据
    4.3 熟悉数据
      4.3.1 利用head 预览前几行
      4.3.2 利用shape 获取数据表的大小
      4.3.3 利用info 获取数据类型
      4.3.4 利用describe 获取数值分布情况
    数据预处理 5.1 缺失值处理
      5.1.1 缺失值查看
      5.1.2 缺失值删除
      5.1.3 缺失值填充
    5.2 重复值处理
    5.3 异常值的检测与处理
      5.3.1 异常值检测
      5.3.2 异常值处理
    5.4 数据类型转换
      5.4.1 数据类型
      5.4.2 类型转换
    5.5 索引设置
      5.5.1 为无索引表添加索引
      5.5.2 重新设置索引
      5.5.3 重命名索引
      5.5.4 重置索引
    数据选择 6.1 列选择
      6.1.1 选择某一列/某几列
      6.1.2 选择连续的某几列
    6.2 行选择
      6.2.1 选择某一行/某几行
      6.2.2 选择连续的某几行
      6.2.3 选择满足条件的行
    6.3 行列同时选择
      6.3.1 普通索引+普通索引选择指定的行和列
      6.3.2 位置索引+位置索引选择指定的行和列
      6.3.3 布尔索引+普通索引选择指定的行和列
      6.3.4 切片索引+切片索引选择指定的行和列
      6.3.5 切片索引+普通索引选择指定的行和列
    数值操作 7.1 数值替换
      7.1.1 一对一替换
      7.1.2 多对一替换
      7.1.3 多对多替换
    7.2 数值排序
      7.2.1 按照一列数值进行排序
      7.2.2 按照有缺失值的列进行排序
      7.2.3 按照多列数值进行排序
    7.3 数值排名
    7.4 数值删除
      7.4.1 删除列
      7.4.2 删除行
      7.4.3 删除特定行
    7.5 数值计数
    7.6 唯一值获取
    7.7 数值查找
    7.8 区间切分
    7.9 插入新的行或列
    7.10 行列互换
    7.11 索引重塑
    7.12 长宽表转换
      7.12.1 宽表转换为长表
      7.12.2 长表转换为宽表
    7.13 apply()与applymap()函数
    数据运算 8.1 算术运算
    8.2 比较运算
    8.3 汇总运算
      8.3.1 count 非空值计数
      8.3.2 sum 求和
      8.3.3 mean 求均值
      8.3.4 max 求最大值
      8.3.5 min 求最小值
      8.3.6 median 求中位数
      8.3.7 mode 求众数
      8.3.8 var 求方差
      8.3.9 std 求标准差
      8.3.10 quantile 求分位数
    8.4 相关性运算
    时间序列 9.1 获取当前时刻的时间
      9.1.1 返回当前时刻的日期和时间
      9.1.2 分别返回当前时刻的年、月、日
      9.1.3 返回当前时刻的周数
    9.2 指定日期和时间的格式
    9.3 字符串和时间格式相互转换
      9.3.1 将时间格式转换为字符串格式
      9.3.2 将字符串格式转换为时间格式
    9.4 时间索引
    9.5 时间运算
      9.5.1 两个时间之差
      9.5.2 时间偏移
    数据分组/数据透视表 10.1 数据分组
      10.1.1 分组键是列名
      10.1.2 分组键是Series
      10.1.3 神奇的aggregate 方法
      10.1.4 对分组后的结果重置索引
    10.2 数据透视表
    多表拼接 11.1 表的横向拼接
      11.1.1 连接表的类型
      11.1.2 连接键的类型
      11.1.3 连接方式
      11.1.4 重复列名处理
    11.2 表的纵向拼接
      11.2.1 普通合并
      11.2.2 索引设置
      11.2.3 重叠数据合并
    结果导出 12.1 导出为.xlsx 文件
      12.1.1 设置文件导出路径
      12.1.2 设置Sheet 名称
      12.1.3 设置索引
      12.1.4 设置要导出的列
      12.1.5 设置编码格式
      1 2.1.6 缺失值处理
      12.1.7 无穷值处理
    12.2 导出为.csv 文件
      12.2.1 设置文件导出路径
      12.2.2 设置索引
      12.2.3 设置要导出的列
      12.2.4 设置分隔符号
      12.2.5 缺失值处理
      12.2.6 设置编码格式
    12.3 将文件导出到多个Sheet

    数据可视化 13.1数据可视化是什么
    13.2 数据可视化的基本流程
      13.2.1 整理数据
      13.2.2 明确目的
      13.2.3 寻找合适的表现形式
    13.3 图表的基本组成元素
    13.4 Excel 与Python 可视化
    13.5 建立画布和坐标系
      13.5.1 建立画布 13.5.2 用add_subplot 函数建立坐标系
      13.5.3 用plt.subplot2grid 函数建立坐标系
      13.5.4 用plt.subplot 函数建立坐标系
      13.5.5 用plt.subplots 函数建立坐标系
      13.5.6 几种创建坐标系方法的区别
    13.6 设置坐标轴
      13.6.1 设置坐标轴的标题
      13.6.2 设置坐标轴的刻度
      13.6.3 设置坐标轴的范围
      13.6.4 坐标轴的轴显示设置
    13.7 其他图表格式的设置
      13.7.1 网格线设置
      13.7.2 设置图例
      13.7.3 图表标题设置
      13.7.4 设置数据标签
      13.7.5 图表注释
      13.7.6 数据表
    13.8 绘制常用图表
      13.8.1 绘制折线图
      13.8.2 绘制柱形图
      13.8.3 绘制条形图
      13.8.4 绘制散点图
      13.8.5 绘制气泡图
      13.8.6 绘制面积图
      13.8.7 绘制树地图
      13.8.8 绘制雷达图
      13.8.9 绘制箱形图
      1 3.8.10 绘制饼图
      13.8.11 绘制圆环图
      13.8.12 绘制热力图
      13.8.13 绘制水平线和垂直线
    13.9 绘制组合图表
      13.9.1 折线图+折线图
      13.9.2 折线图+柱形图
    13.10 绘制双坐标轴图表
      13.10.1 绘制双y 轴图表
      13.10.2 绘制双x 轴图表
      13.11 绘图样式设置
    典型数据分析案例 14.1 利用Python 实现报表自动化
      14.1.1 为什么要进行报表自动化
      14.1.2 什么样的报表适合自动化
      14.1.3 如何实现报表自动化
    14.2 自动发送电子邮件
    14.3 假如你是某连锁超市的数据分析师
      14.3.1 哪些类别的商品比较畅销
      14.3.2 哪些商品比较畅销 .
      14.3.3 不同门店的销售额占比
      14.3.4 哪些时间段是超市的客流高峰期
    14.4 假如你是某银行的数据分析师
      14.4.1 是不是收入越高的人坏账率越低
      14.4.2 年龄和坏账率有什么关系
      14.4.3 家庭人口数量和坏账率有什么关系
    NumPy 数组 15.1 NumPy 简介
    15.2 NumPy 数组的生成
      15.2.1 生成一般数组
      15.2.2 生成特殊类型数组
      15.2.3 生成随机数组
    15.3 NumPy 数组的基本属性
    15.4 NumPy 数组的数据选取
      15.4.1 一维数据选取
      15.4.2 多维数据选取
    15.5 NumPy 数组的数据预处理
      15.5.1 NumPy 数组的类型转换
      15.5.2 NumPy 数组的缺失值处理
      15.5.3 NumPy 数组的重复值处理
    15.6 NumPy 数组重塑
      15.6.1 一维数组重塑
      15.6.2 多维数组重塑
      15.6.3 数组转置
    15.7 NumPy 数组合并
      15.7.1 横向合并
      15.7.2 纵向合并
    15.8 常用数据分析函数
      15.8.1 元素级函数
      15.8.2 描述统计函数
      15.8.3 条件函数
      15.8.4 集合关系
     
    1823 次浏览  51 次
    其他人还看了课程
    公文总动员--常用公文的写作技巧   1269 次浏览
    Excel 基础、中级、高级培训   1686 次浏览
    Office在企业效能提升上的应用  1409 次浏览
    Excel数据分析进阶  2935 次浏览
    极致演示之道:PPT从技术到艺术  1586 次浏览
    对比Excel,轻松学习Python数据分析  1823 次浏览
    定制内训


    课程计划
    QT应用开发 11-21[线上]
    C++高级编程 11-27[北京]
    LLM大模型应用与项目构建 12-26[特惠]
    UML和EA进行系统分析设计 12-20[线上]
    数据建模方法与工具 12-3[北京]
    SysML建模专家 1-16[北京]