求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Model Center 汽车系统工程   模型库  
会员   
 
 
 
  开班计划 | 认证培训 | 技术学院 | 管理学院 | 嵌入式学院 | 机械 | 军工学院 | 定向培养 | 专家指导 | 角色培养  
 电话 English
成功案例   品质保证
 
成功案例
某地铁控 大数据技术与实践
中航信 数据湖架构原理与应
某医疗磁 数据采集与处理
某科技公 大数据(Hadoo
诺基亚 Python基础
天津电子 Elasticse
中国电信 数据仓库与数据挖掘

相关课程  
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
 
全部课程 >人工智能  
使用GPU和CUDA 提升 Python程序的性能
3693 次浏览  62 次
马老师
NVIDIA技术专家
 
时间地点:北京、 深圳、上海根据报名开班
课程费用:2600元/人
报公开课  
企业内训:可以根据企业需求,定制内训,详见 内训学习手册


认证方式:
培训前了解能力模型。
培训后进行能力评测:
  • 在线考试
  • 能力分析,给出学习建议
  • 合格者颁发证书,作为职业技能资格证明


            本课程教授如何使用基本的工具和技术,通过在 GPU 上的 CUDA® 和 NUMBA 编译器,来加速 Python 应用程序的运行。在 GPU 支持的实时云端开发环境上, 您将完成十几个动手编码练习,并 在培训结束时实践一个新的工作流程,来加速全功能但仅支持 CPU 的线性代数程序,从而获得显 著的性能提升。 课程结束后,您将拥有更多资源来自行创建新的 GPU 加速应用程序。 练习方式:每位学员使用云端完全配置的 GPU 加速工作站实验练习。
    培训目标:
    课程结束后,您将了解使用 CUDA 和 Numba 实现 GPU 加速 Python 应用程序的基本工具和技能。
    • 只需使用几行代码即可实现 GPU 加速的 NumPy ufuncs 。
    • 利用 CUDA 线程层次结构配置代码并行化。
    • 编写自定义 CUDA 核函数实现最大性能和灵活性
    • 使用内存合并和设备上共享内存来增加 CUDA 核函数的带宽
    培训对象:Python开发工程师
    学员基础:基本的 Python 编程能力,包括熟悉变量类型、循环、条件语句、函数和数组 操作。使用 NumPy 的能力,包括使用 ndarrays 和 ufuncs。无需具备前期 CUDA 编程知识。
    授课方式:定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练
    培训内容:1天
    主题
    课程安排
    使用GPU和CUDA 提升 Python程序的性能 Python 的复杂计算应用程序的性能问题
    GPU 计算架构原理
    CUBA 计算模型原理
    Numba 和 NumPy 简介
    使用 Numba 的 CUDA Python 在 Python 中用 Numba 编译器和 CUDA 编程
    使用 Numba 装饰器加速数值 Python 函数
    优化主机到设备、设备到主机的内存传输
    在支持 Numba 的 Python 中自定义 CUDA 核函数 学习 CUDA 的并行线程层次结构,以及如何扩展并行程序
    在 GPU 上启动大规模并行自定义 CUDA 核函数
    利用 CUDA 原子操作避免并行执行期间的竞争状况
    有效使用内存子系统 学习创建多维网格以及如何在 2D 矩阵上并行工作
    在重塑 2D 矩阵时,利用 GPU 设备上的共享内存来促进内存合并
    课程总结 使用 CUDA 的并行计算模型
    Python 的 CUDA 编程
    性能提升的策略和方法
       
    3693 次浏览  62 次
    其他人还看了课程
    机器学习和数据挖掘课程  4347 次浏览
    使用github Copilot进行高效软件开发  488 次浏览
    Open Claw和Agent Skill原理和实战  1635 次浏览
    AI 助力职场办公效率提升  1515 次浏览
    金融行业人工智能与数据挖掘实战  4575 次浏览
    使用GPU和CUDA 提升 Python程序的性能   3693 次浏览
    GPU图像处理核心技术实战  1730 次浏览
    定制内训
    最新活动计划
    OCSMP 认证培训 5-27[在线]
    企业网络安全防护体系 5-20[北京]
    基于模型的数据治理 5-19[北京]
    具身智能技能与实践 6-11[厦门]
    AI Spec Coding工程化实践 6-13[北京]
    Open Claw和Agent Skill实战 6-25[北京]