Python数据分析概览
|
1.1 为什么使用 Python
1.2 重要的 Python 库
- NumPy
- Pandas
- SciPy
- Matplotlib
1.3 IPython和Jupyter Notebook
1.4 Python IDE 的安装和使用
|
2. Python 语言快速入门 |
2.1 Python 解释器
2.2 语言设计特点
2.3 对象的调用和属性
2.4 import 引入
2.5 数据类型
2.6 控制流
2.7 数据结构和序列
2.8 函数
2.9 文件和操作系统 2.10 面向对象
2.11 异常
2.12 案例与演示
|
3. NumPy |
3.1 ndarray 多维数组对象处理与运算
3.2 元素级数组函数
3.3 利用数组进行数据处理
3.4 利用数组进行输入和输出
3.5 线性代数
3.6 随机数生成
3.7 【案例与演示】 |
4. Pandas |
4.1 Pandas 数据结构介绍
4.2 基本功能
4.3 汇总和计算描述统计
4.4 处理缺失数据
4.5 【案例与演示】 |
5 Pandas 数据加载和存储 |
5.1 读写结构化数据
5.2 读写非结构化数据
5.3 使用 HTML 和 Web API
5.4 使用数据库
5.5 【案例与演示】 |
6. Pandas 数据预处理
|
6.1 合并数据集(以 merge 和 append
为主)
6.2 重塑和轴向旋转
6.3 数据清洗
6.4 字符串操作
6.5 【案例与演示】 |
7. Pandas 数据聚合与分组运算 |
7.1 GroupBy 技术
7.2 数据聚合
7.3 分组运算和转换
7.4 透视表和交叉表
7.5 【案例与演示】 |
8. 绘图与可视化 |
8.1 Matplotlib 基本操作
8.2 Pandas 中的绘图函数
8.3 【案例与演示】 |
9. 时间序列 |
9.1 日期和时间数据类型及工具
9.2 时间数据处理
9.3 时期及其算术运算
9.4 时间序列绘图
9.5 【案例与演示】
|