工多多-星外工多多-强化学习算法工程师-岗位职责 1.设计并优化大模型与强化学习

　星外工多多 [切换] 客服微信

　登陆/注册

所有操作

≡

　　　星外工多多：　交流群

　企业信息页　　　　　>

　查找人才　　　　　　>

　关注的人才　　　　　>

　企业认证　　　　　　>

　充值财务　　　　　　>

　切换角色　　　　　　>

	职位描述　用小程序查看更多
	岗位职责 1.设计并优化大模型与强化学习融合算法架构，提升模型性能，增强AIagent决策执行能力。 2.深度融合强化学习与大模型训练，精心设计奖励机制，促使AIagent自主学习并执行最优策略。 3.主导模型训练工作，充分运用分布式计算资源和高效训练策略，精准调优参数，保障模型在agent应用中的稳定性。 4.积极探索多模态融合创新应用，拓展模型能力边界，满足AIagent复杂交互需求。 5.及时诊断并解决模型训练和应用过程中出现的问题，确保AIagent稳定运行；参与需求讨论，提供建设性技术建议。任职要求 1.计算机科学、数学等相关专业，博士学历优先；在顶级学术会议发表论文者优先考虑。 2.精通深度学习框架，深入研究大模型和强化学习算法。 3.拥有1-3年大模型或强化学习工作经验，主导过AIagent开发及大模型融合项目。 4.数学基础深厚，熟练掌握线性代数、概率论、数理统计等知识，能够优化复杂算法。 5.创新和学习能力超强，能够推动技术实现跨越式发展。 6.沟通协作能力卓越，能够与不同团队紧密合作，引领项目技术方向。

职位照片

尚未上传照片。

马上投简历　　收藏　　复制网址

谁看过此职位

只显示非匿名用户

欢迎您的到来！星外工多多,让天下没有难找的工作！


微信交流群	[星外工多多] 全功能服务号	[星外工多多] 客服

《用户服务协议》和《隐私政策》　投诉与举报　电话：189-2884-4824 (9:00-17:30)　地址：广州市天河区体育东路140-148号地下一层213号铺

广州市星外信息科技有限公司　保留所有权利　注册商标　人力资源许可证　增值电信经营许可证:粤B2-20251456　粤ICP备05000912号-2