求知
文章
文库
Lib
视频
iPerson
课程
认证
咨询
工具
讲座
Model Center
Code
会员
找课
开班计划
|
技术学院
|
管理学院
|
嵌入式学院
|
机械
|
军工学院
|
定向培养
|
专家指导
|
角色培养
电话
English
成功案例
品质保证
成功案例
中航信 数据湖架构原理与应
某医疗磁 数据采集与处理
某科技公 大数据(Hadoo
诺基亚 Python基础
天津电子 Elasticse
中国电信 数据仓库与数据挖掘
某航天科 MySQL性能优化
更多...
相关课程
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
更多...
全部课程
>
人工智能
使用GPU和CUDA 提升 Python程序的性能
1529 次浏览
53 次
马老师
NVIDIA技术专家
时间地点:
北京、 深圳、上海根据报名开班
课程费用:
2600元/人
报公开课
要内训
企业内训:
可以根据企业需求,定制内训,详见
内训学习手册
认证方式:
培训前了解能力模型。
培训后进行能力评测:
在线考试
能力分析,给出学习建议
合格者颁发证书,作为职业技能资格证明
本课程教授如何使用基本的工具和技术,通过在 GPU 上的 CUDA® 和 NUMBA 编译器,来加速 Python 应用程序的运行。在 GPU 支持的实时云端开发环境上, 您将完成十几个动手编码练习,并 在培训结束时实践一个新的工作流程,来加速全功能但仅支持 CPU 的线性代数程序,从而获得显 著的性能提升。 课程结束后,您将拥有更多资源来自行创建新的 GPU 加速应用程序。 练习方式:每位学员使用云端完全配置的 GPU 加速工作站实验练习。
培训目标:
课程结束后,您将了解使用 CUDA 和 Numba 实现 GPU 加速 Python 应用程序的基本工具和技能。
• 只需使用几行代码即可实现 GPU 加速的 NumPy ufuncs 。
• 利用 CUDA 线程层次结构配置代码并行化。
• 编写自定义 CUDA 核函数实现最大性能和灵活性
• 使用内存合并和设备上共享内存来增加 CUDA 核函数的带宽
培训对象:
Python开发工程师
学员基础:
基本的 Python 编程能力,包括熟悉变量类型、循环、条件语句、函数和数组 操作。使用 NumPy 的能力,包括使用 ndarrays 和 ufuncs。无需具备前期 CUDA 编程知识。
授课方式:
定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练
培训
内容:1天
主题
课程安排
使用GPU和CUDA 提升 Python程序的性能
Python 的复杂计算应用程序的性能问题
GPU 计算架构原理
CUBA 计算模型原理
Numba 和 NumPy 简介
使用 Numba 的 CUDA Python
在 Python 中用 Numba 编译器和 CUDA 编程
使用 Numba 装饰器加速数值 Python 函数
优化主机到设备、设备到主机的内存传输
在支持 Numba 的 Python 中自定义 CUDA 核函数
学习 CUDA 的并行线程层次结构,以及如何扩展并行程序
在 GPU 上启动大规模并行自定义 CUDA 核函数
利用 CUDA 原子操作避免并行执行期间的竞争状况
有效使用内存子系统
学习创建多维网格以及如何在 2D 矩阵上并行工作
在重塑 2D 矩阵时,利用 GPU 设备上的共享内存来促进内存合并
课程总结
使用 CUDA 的并行计算模型
Python 的 CUDA 编程
性能提升的策略和方法
报公开课
要内训
1529 次浏览
53 次
其他人还看了课程
强化学习及案例实践
3001 次浏览
大模型微调原理与实操
1697 次浏览
自然语言处理(NLP)
4138 次浏览
机器学习及其matlab实现-从基础到实践
2128 次浏览
Python、数据分析与机器学习
2807 次浏览
人工智能
最新活动计划
数据建模方法与工具 12-3[北京]
基于模型系统仿真与验证 12-14
[讲座]
白盒测试技术与工具实践 12-24[线上]
LLM大模型应用与项目构建 12-26
[特惠]
UML和EA进行系统分析设计 12-20[线上]
SysML建模专家 1-16[北京]