|
|
|
|
职位描述 用小程序查看更多 |
|
职责描述
1.负责AI平台的设计、开发与优化,确保平台的高性能、高可用性和可扩展性;
2.参与AI算法的实现与集成,推动算法工程化和产品化;
3.深入研究AI技术发展趋势,探索新技术在平台中的应用;
4.协同产品、算法团队完成需求分析和技术方案设计;
5.编写高质量的技术文档,确保技术知识的有效传递;
6.解决系统运行中的技术问题,保障平台稳定运行;
7.优化平台架构,提升系统的性能和安全性;
8.关注行业动态,为平台发展提供前瞻性建议。
任职要求
1. 本科及以上学历,计算机、软件工程、人工智能等相关专业毕业,5年以上工作经验。
2. 熟悉Java, Python, Go等至少一种语言,对数据结构、算法、网络有良好的掌握,具备良好的代码编写能力。
3. 熟悉TensorFlow, PyTorch,DeepSpeed,Megatron-LM等至少一种AI框架。
4. 熟悉AI领域常见的分布式训练技术,包括但不限于TP/PP/DP。
5. 有分布式系统开发经验,了解微服务架构和相关技术,如 Docker、Kubernetes 等者优先。
6. 熟悉mysql、redis、消息队列、ES等中间件。
7. 具备良好的团队合作精神,能够和跨部门的团队紧密合作,共同推进项目的成功。
8. 热爱技术,善于学习新知识,有进取心。
加分项:
1. 有大模型研发和分布式训练经验。
2. 有AI平台、机器学习平台研发经验。
3. 在AI或者HPC领域发表过高水平论文。
|
|
|
|
|
|
|