|
|
| |
| |
职位描述 用小程序查看更多 |
|
| 硕士及以上学历,计算机科学、人工智能、软件工程、数学、统计学、电子工程等相关专业 1.参与大规模语言模型(LLM)在训练、微调、推理优化、模型架构探索、长上下文处理、多模态融合等一个或多个关键方向的研究与工程实践;2.负责将前沿算法、论文思路转化为可运行的代码,并进行性能调优(如分布式训练优化、计算效率提升、显存优化);3、参与大规模、高质量训练数据的收集、清洗、预处理及评估数据集的构建工作,理解数据对模型性能的关键影响;4、设计并执行模型训练和评估实验,分析实验结果,撰写技术报告,为模型改进提供数据支持;5、持续跟踪国内外大模型领域的最新研究进展(论文、开源项目、技术博客),并能进行深入理解和分析;6、熟悉并运用主流深度学习框架、分布式训练框架、大模型开发工具链等;7、参与将大模型技术应用于实际业务场景的研发工作,如智能对话、内容生成、代码辅助、知识问答等; |
|
| |
|
|
| |
|