求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Model Center   Code  
会员   
 
 
 
开班计划 | 技术学院 | 管理学院 | 嵌入式学院 | 机械 | 军工学院 | 定向培养 | 专家指导  
 电话 English
成功案例   品质保证
 
成功案例
中航信 数据湖架构原理与应
某医疗磁 数据采集与处理
某科技公 大数据(Hadoo
诺基亚 Python基础
天津电子 Elasticse
中国电信 数据仓库与数据挖掘
某航天科 MySQL性能优化

相关课程  
并发、大容量、高性能数据库
高级数据库架构设计师
Hadoop原理与实践
HBase原理与高级应用
Oracle 数据仓库
数据仓库和数据挖掘
Oracle数据库开发与管理
 
全部课程 >人工智能  
使用GPU和CUDA 提升 Python程序的性能
991 次浏览  34 次
马老师
NVIDIA技术专家
 
时间地点:北京、 深圳、上海根据报名开班
课程费用:2600元/人
报公开课  
企业内训:可以根据企业需求,定制内训,详见 内训学习手册


认证方式:
培训前了解能力模型。
培训后进行能力评测:
  • 在线考试
  • 能力分析,给出学习建议
  • 合格者颁发证书,作为职业技能资格证明


            本课程教授如何使用基本的工具和技术,通过在 GPU 上的 CUDA® 和 NUMBA 编译器,来加速 Python 应用程序的运行。在 GPU 支持的实时云端开发环境上, 您将完成十几个动手编码练习,并 在培训结束时实践一个新的工作流程,来加速全功能但仅支持 CPU 的线性代数程序,从而获得显 著的性能提升。 课程结束后,您将拥有更多资源来自行创建新的 GPU 加速应用程序。 练习方式:每位学员使用云端完全配置的 GPU 加速工作站实验练习。
    培训目标:
    课程结束后,您将了解使用 CUDA 和 Numba 实现 GPU 加速 Python 应用程序的基本工具和技能。
    • 只需使用几行代码即可实现 GPU 加速的 NumPy ufuncs 。
    • 利用 CUDA 线程层次结构配置代码并行化。
    • 编写自定义 CUDA 核函数实现最大性能和灵活性
    • 使用内存合并和设备上共享内存来增加 CUDA 核函数的带宽
    培训对象:Python开发工程师
    学员基础:基本的 Python 编程能力,包括熟悉变量类型、循环、条件语句、函数和数组 操作。使用 NumPy 的能力,包括使用 ndarrays 和 ufuncs。无需具备前期 CUDA 编程知识。
    授课方式:定制课程 + 案例讲解 + 小组讨论,60%案例讲解,40%实践演练
    培训内容:1天
    主题
    课程安排
    使用GPU和CUDA 提升 Python程序的性能 Python 的复杂计算应用程序的性能问题
    GPU 计算架构原理
    CUBA 计算模型原理
    Numba 和 NumPy 简介
    使用 Numba 的 CUDA Python 在 Python 中用 Numba 编译器和 CUDA 编程
    使用 Numba 装饰器加速数值 Python 函数
    优化主机到设备、设备到主机的内存传输
    在支持 Numba 的 Python 中自定义 CUDA 核函数 学习 CUDA 的并行线程层次结构,以及如何扩展并行程序
    在 GPU 上启动大规模并行自定义 CUDA 核函数
    利用 CUDA 原子操作避免并行执行期间的竞争状况
    有效使用内存子系统 学习创建多维网格以及如何在 2D 矩阵上并行工作
    在重塑 2D 矩阵时,利用 GPU 设备上的共享内存来促进内存合并
    课程总结 使用 CUDA 的并行计算模型
    Python 的 CUDA 编程
    性能提升的策略和方法
       
    991 次浏览  34 次
    其他人还看了课程
    机器学习理论与实战  2968 次浏览
    GPU和CUDA并行计算应用程序开发  38 次浏览
    机器学习(深度学习)算法和应用   2601 次浏览
    图数据库与知识图谱应用实践  118 次浏览
    人工智能,机器学习和深度学习  27361 次浏览
    大模型原理与实战  242 次浏览
    定制内训
    最新活动计划
    MBSE(基于模型的系统工程)4-18[北京]
    自然语言处理(NLP) 4-25[北京]
    基于 UML 和EA进行分析设计 4-29[北京]
    以用户为中心的软件界面设计 5-16[北京]
    DoDAF规范、模型与实例 5-23[北京]
    信息架构建模(基于UML+EA)5-29[北京]