|
|
| |
| |
工作地址 |
|
|
|
|
(深圳市南山区西丽街道西丽社区留仙大道7013航天创新大厦31层
)
用小程序查
用百度查
|
| |
职位描述 用小程序查看更多 |
|
职位描述 1、负责训练图像/视频与文本融合的多模态理解大模型,提升模型的跨模态理解能力; 2、研究和实现3D场景重建与理解; 3、提升多模态大模型的推理能力,包括逻辑推理、常识推理和因果推理等能力; 4、研发多模态强化学习算法,提升模型在复杂环境中的决策能力; 5、跟踪多模态理解领域的最新研究进展,推动技术创新。 职位要求 1、具有计算机视觉、自然语言处理、人工智能等相关专业背景或相关行业工作经验; 2、熟练掌握主流深度学习框架,如PyTorch、TensorFlow,并具备优秀的编程能力; 3、对主流多模态模型(如CLIP、LLaVA、Flamingo等)有深入理解,有实际训练和优化经验,熟悉相关任务和评测方法; 4、熟悉思维链(Chain-of-Thought)、逻辑推理、常识推理等技术,能够提升模型的推理能力; 5、具备多模态强化学习经验,熟悉主流强化学习算法及其在多模态场景中的应用; 6、熟悉3D场景理解相关技术; 7、具备分布式训练经验,能够高效处理大规模多模态数据和模型; 8、AC M等程序设计比赛、自然语言处理/多模态相关顶级会议论文或比赛获奖经历者 |
|
| |
|
|
| |
|