星外工多多 [切换] 客服微信    找工作 | 企业招人   登陆/注册  
 
   
 请输入关键词:
 
所有操作  
   星外工多多:  交流群  
   我的工多多(企业招人) >
   企业信息页     >
   发布正规职位    >
   查找人才      >
   关注的人才     >
   企业认证      >
   充值财务      >
   切换角色      >
 
   
  强化学习算法工程师  点击:3次 20000-35000/月
深圳市新旦智能科技有限责任公司 查看企业资料及职位 2025-5-20 
深圳市-南山区  1-3年经验 | | 招1人 | 全职
  工作地址
(西丽街道) 用小程序查   用百度查

  职位描述  用小程序查看更多
岗位职责
1.设计并优化大模型与强化学习融合算法架构,提升模型性能,增强AIagent决策执行能力。
2.深度融合强化学习与大模型训练,精心设计奖励机制,促使AIagent自主学习并执行最优策略。
3.主导模型训练工作,充分运用分布式计算资源和高效训练策略,精准调优参数,保障模型在agent应用中的稳定性。
4.积极探索多模态融合创新应用,拓展模型能力边界,满足AIagent复杂交互需求。
5.及时诊断并解决模型训练和应用过程中出现的问题,确保AIagent稳定运行;参与需求讨论,提供建设性技术建议。

任职要求
1.计算机科学、数学等相关专业,博士学历优先;在顶级学术会议发表论文者优先考虑。
2.精通深度学习框架,深入研究大模型和强化学习算法。
3.拥有1-3年大模型或强化学习工作经验,主导过AIagent开发及大模型融合项目。
4.数学基础深厚,熟练掌握线性代数、概率论、数理统计等知识,能够优化复杂算法。
5.创新和学习能力超强,能够推动技术实现跨越式发展。
6.沟通协作能力卓越,能够与不同团队紧密合作,引领项目技术方向。
 
 

  职位照片
尚未上传照片。

  联系办法
   联系人:成小姐   联系电话: [请登陆后查看]  用小程序打开  
 

  马上投简历  收藏   复制网址

  深圳市新旦智能科技有限责任公司 查看企业资料及职位**(已实名) 查看个人雇主资料及职位

  谁看过此职位
  只显示非匿名用户
 
 
欢迎您的到来!星外工多多,让天下没有难找的工作!
微信交流群 [星外工多多] 全功能服务号 [星外工多多] 客服
《用户服务协议》和《隐私政策》  投诉与举报  电话:189-2884-4824 (9:00-17:30) 地址:广州市天河区体育东路140-148号地下一层213号铺

广州市星外信息科技有限公司 保留所有权利 注册商标 人力资源许可证 增值电信经营许可证:粤B2-20251456 粤ICP备05000912号-2