|
|
| |
| |
大模型推理优化 点击:20次
工作编号:1944177
|
18000-30000/月 |
|
深圳天顿数据科技有限公司 查看企业资料及职位
|
2026-3-20 |
| 深圳市-福田区 无经验 | 大学本科 | 招2人 | 全职 |
| 提供工作餐,员工体检,有偿假期,节日福利,生日福利 |
| |
职位描述 用小程序查看更多 |
|
岗位职责: 1. 参与大模型推理加速技术的研究与实践,如算子融合、量化技术、并行计算等,以提升模型推理效率,降低推理延迟; 2. 协助优化推理框架(如 vLLM,SGLang),根据实际业务场景对框架进行定制化开发与性能调优,确保大模型在不同硬件环境下高效运行; 3. 负责模型推理性能的评估与分析,使用 Nsight 等工具定位性能瓶颈,并提出有效的优化方案; 4. 跟踪学术界和工业界最新的大模型推理优化技术,定期整理并汇报相关技术进展,为团队技术方向提供参考; 专业技能: 1. 人工智能专业,本科及以上学历;,精通 Python 编程语言,具备扎实的编程基础和良好的代码风格; 2. 熟悉深度学习基本原理,深入理解 Transformer 架构及其在大模型中的应用,对大模型(如 BERT、GPT 系列等)有一定的了解; 3. 掌握至少一种深度学习框架,如 PyTorch,能够进行模型的搭建、训练与推理; 4. 了解GPU编程基础,有CUDA 等高性能计算框架使用经验者优先; 5. 希望你有较高的代码质量和较好的文档协作习惯,较强的自主学习和团队协作能力; 以下要求,至少满足一项: 1. |
|
| |
|
|
| |
|