职位关键词
在校/应届
投递时间:2026年05月16日-2026年08月14日
职位描述:
岗位职责:
1、核心语音引擎研发: 负责公司 AI 核心能力中台的语音技术模块研发,主导语音识别(ASR)、语音合成(TTS)、声纹识别(VPR)及语音信号处理等核心算法的研发、迭代与性能优化; 2、金融场景深度优化: 针对银行网点、远程银行、线上客服等金融特有场景(如强噪声、多口音、高回声环境),设计并实现鲁棒性更强的语音识别与增强模型,确保障碍沟通场景下的高可用性; 3、赋能数智人与智能交互: 为公司的核心产品 “3D 数智人” 提供语音交互的全栈技术支持,包括高表现力、情感化的语音合成(TTS),以及高精度的远场语音识别与声源定位,打造流畅、自然的金融服务对话体验。
岗位要求:
1、 博士研究生学历,计算机科学、信号处理、声学、人工智能、电子信息工程等相关专业; 2、实习语音识别(ASR)、语音合成(TTS)、声纹识别(VPR)、语音唤醒(KWS)、语音增强(降噪/回声消除/去混响)等领域的核心算法原理。