|
|
| |
| |
工作地址 |
|
|
|
|
(深圳市南山区粤海街道高新区社区高新南十道16号金地威新中心A座19楼)
用小程序查
用百度查
|
| |
职位描述 用小程序查看更多 |
|
"岗位职责: 1. 负责运动健康垂域的多模态数据的收集、清洗、标注、增强、生成及版本管理,保障数据的质量与多样性。 2. 设计覆盖多任务、多难度的垂域评测数据集,定期更新评测数据,支持模型性能评估与迭代。 3. 整合结构化/非结构化知识,构建专业的运动健康知识库,维护知识的时效性和准确性,支撑模型知识推理能力。 4. 建立数据质量评估标准,识别并处理数据中的噪声、偏见,确保数据符合训练、评测等业务要求。 5. 开发自动化数据 pipeline,提升数据处理效率,支持大规模数据处理需求。 6. 与算法、产品、应用团队合作,理解需求,调整数据策略,保障数据支撑业务与模型迭代。 7. 负责数据安全与合规管理,遵守隐私法规,处理敏感数据,确保数据收集、存储、使用的安全性与合规性。
任职要求: 1. 有大模型数据开发相关工作经验,有落地经验者优先; 2. 具备良好的编程能力,熟练掌握python编程及pytorch框架; 3. 具备优秀的数据洞察能力、逻辑思维和沟通表达能力,自我驱动、目标导向; 4. 计算机科学、机器学习、数据科学、应用数学等领域硕士及以上学历;" |
|
| |
|
|
| |
|