主题 |
内容 |
概述 |
大模型与性能工程的关系
大模型是否改变了性能分析逻辑?
RAG、agent、fine-tuning 该如何选择?
|
AI 大模型应用的常见技术架构 |
- 软件部分
- 硬件部分
- 大模型应用的分类
- 常见 AI 大模型技术架构
- RAG 技术架构
- Agent 技术架构
- 微调大模型技术架构
- MCP 协 议
- AI 大模型应用架构选型
|
AI 大模型软硬件选型 |
AI
芯片选型
显卡选型
|
大模型训练成本计算公式 |
计算资源计算公式
显存资源计算公式
存储资源计算公式
综合成本计算公式
|
大模型内部逻辑分析 |
模型权重文件参数分析
神经网络可视化
模型权重文件结构分析
模型权重神经元激活分析
|
性能容量的分析逻辑 |
压力场景分析
系统架构分析
响应时间拆分
全局监控分析
全局监控分析
判断性能瓶颈
提出解决方案 |
容量峰值评估 |
- 关键名词解析
- 在线用户和 TPS 之间的关系
- 并发用户和 TPS 之间的关系
- 公式总结
|
性能分析决策树的创建方法 |
|
测试 AI 大模型应用的性能 |
-
AI
大模型应用性能需求分析
- AI 大模型应用性能场景设计
- AI 大模型应用性能监控设计(细化性能指标)
- AI 大模型应用性能场景执行
- AI 大模型应用性能瓶颈分析
- AI 大模型应用性能测试报告
|
微调性能分析 AI 大模型 |
明确训练目标
基础大模型选型
配置参数
准备数据集
开始训练
训练过程记录
验证训练结果 |
总结 |
AI 大模型在性能工程领域的展望 |