工多多-星外工多多-多模态理解算法工程师-职位描述 1、负责训练图像/视频与文本融

　星外工多多 [切换] 客服微信

　登陆/注册

所有操作

≡

　　　星外工多多：　交流群

　企业信息页　　　　　>

　查找人才　　　　　　>

　关注的人才　　　　　>

　企业认证　　　　　　>

　充值财务　　　　　　>

　切换角色　　　　　　>

	工作地址

	(深圳市南山区西丽街道西丽社区留仙大道7013航天创新大厦31层 ) 用小程序查　用百度查

	职位描述　用小程序查看更多
	职位描述 1、负责训练图像/视频与文本融合的多模态理解大模型，提升模型的跨模态理解能力； 2、研究和实现3D场景重建与理解； 3、提升多模态大模型的推理能力，包括逻辑推理、常识推理和因果推理等能力； 4、研发多模态强化学习算法，提升模型在复杂环境中的决策能力； 5、跟踪多模态理解领域的最新研究进展，推动技术创新。职位要求 1、具有计算机视觉、自然语言处理、人工智能等相关专业背景或相关行业工作经验； 2、熟练掌握主流深度学习框架，如PyTorch、TensorFlow，并具备优秀的编程能力； 3、对主流多模态模型（如CLIP、LLaVA、Flamingo等）有深入理解，有实际训练和优化经验，熟悉相关任务和评测方法； 4、熟悉思维链(Chain-of-Thought)、逻辑推理、常识推理等技术，能够提升模型的推理能力； 5、具备多模态强化学习经验，熟悉主流强化学习算法及其在多模态场景中的应用； 6、熟悉3D场景理解相关技术； 7、具备分布式训练经验，能够高效处理大规模多模态数据和模型； 8、AC M等程序设计比赛、自然语言处理/多模态相关顶级会议论文或比赛获奖经历者

职位照片

尚未上传照片。

马上投简历　　收藏　　复制网址　　投诉下架

谁看过此职位

66560,张**,2026-3-19 17:28:57
66560,张**,2026-3-18 9:30:10

欢迎您的到来！星外工多多,让天下没有难找的工作！


微信交流群	[星外工多多] 全功能服务号	[星外工多多] 客服