|
|
| |
| |
职位描述 用小程序查看更多 |
|
岗位职责 1. 参世界模型微调与创新开发,重点优化动态场景生成的时序连贯性、几何一致性,探索自回归扩散模型在未来帧预测中的应用。 2. 整合文本、图像、动作轨迹等多模态数据,构建适配世界建模的训练数据集,实现文本指令对动态场景生成的精准控制,提升模型对复杂场景的理解与生成能力。 3. 参与开发模型部署、调优的自动化工具,优化模型推理效率,适配分布式训练框架提升研发效率。 4. 负责模型效果的量化评估与可视化验证,针对动态场景生成中的物理规则一致性、长时序列稳定性等问题开展迭代实验,记录实验数据并输出分析报告,支撑核心算法的迭代优化。 5. 技术调研与沉淀:跟踪世界模型、扩散模型领域的前沿进展,调研行业主流方案与开源工具。
任职要求 1. 在读硕士及以上学历,实习时长不少于4个月。 2. 精通Python编程语言,熟练掌握PyTorch深度学习框架,具备扎实的神经网络与扩散模型基础,深入理解Stable Diffusion核心原理及生态工具。 3. 熟悉至少一种分布式训练框架(FSDP/DeepSpeed/Megatron)或模型推理优化技术(xformers、bitsandbytes |
|
| |
|
|
| |
|