|
|
| |
| |
工作地址 |
|
|
|
|
(深圳市南山区西丽街道西丽社区留仙大道7013航天创新大厦31层
)
用小程序查
用百度查
|
| |
职位描述 用小程序查看更多 |
|
职位描述 1、负责语音多模态系统的研发,包括语音识别(ASR)、语音合成(TTS)、语音对话等关键技术; 2、开发和优化全双工语音对话系统,解决实际场景中的回音消除、声源定位等挑战; 3、研究和实现端到端语音大模型,提升语音理解和生成能力; 4、负责语音技术在端侧的高效部署和优化; 5、研发语音拟人化处理技术,使合成语音更加自然、情感丰富并具备个性化特征; 6、与其他模态团队协作,实现语音与其他模态的有效融合; 7、跟踪语音技术最新进展,推动技术创新和应用落地。
任职要求: 具有计算机科学、人工智能、语音信号处理等相关专业背景或相关行业工作经验; 熟练掌握主流深度学习框架,如PyTorch、TensorFlow,并具备优秀的编程能力; 对主流语音模型和技术有深入理解,熟悉ASR、TTS或端到端语音大模型的训练和优化方法; 有语音对话系统落地经验,解决过回音消除、声源定位、声纹识别等实际问题; 熟悉语音拟人化技术,包括情感语音合成、声音转换、个性化语音模型等; 1、熟悉语音技术在端侧设备上的部署和优化方法; 2、具备分布式训练经验,能够处理大规模语音数据和模型;
|
|
| |
|
|
| |
|