【崗位職責(zé)】
1.推動 ASR/TTS等語音算法在實(shí)際業(yè)務(wù)中的落地與性能優(yōu)化;
2.負(fù)責(zé)語音信號前處理相關(guān)算法的研發(fā)與優(yōu)化(包括噪聲抑制、回聲消除、語音增強(qiáng)、聲源分離等),提升ASR前端語音質(zhì)量與魯棒性;
3.設(shè)計低延遲、高性能的流式語音處理方案,支持端側(cè)/云端混合部署,優(yōu)化系統(tǒng)資源占用;
4.開發(fā)并維護(hù)音頻處理工具鏈(編解碼、格式轉(zhuǎn)換、流媒體處理等)與SDK,支持跨平臺調(diào)用和部署;
5.跟蹤語音信號處理/語音合成/識別/多模態(tài)等領(lǐng)域的前沿研究,結(jié)合實(shí)際場景探索創(chuàng)新解決方案。
【任職要求】
1.計算機(jī)、電子工程、信號處理、人工智能等相關(guān)專業(yè)本科及以上學(xué)歷;
2.熟悉語音前處理技術(shù),如回聲消除、降噪、語音增強(qiáng)、VAD 等;
3.熟悉傳統(tǒng)與深度學(xué)習(xí)語音算法(CTC、Transformer、Whisper等),具備ASR開發(fā)經(jīng)驗(yàn);
4.熟悉Kaldi等傳統(tǒng)語音工具包;
5.熟練掌握Python/C++,熟悉PyTorch 或 TensorFlow,具備流式語音處理和端側(cè)部署經(jīng)驗(yàn);
6.熟悉常見音頻編解碼格式(AAC/Opus/MP3)、流媒體傳輸協(xié)議,有實(shí)際音頻處理/封裝開發(fā)經(jīng)驗(yàn);
7.具備良好的團(tuán)隊(duì)協(xié)作、溝通能力,能獨(dú)立分析并解決復(fù)雜工程問題。
【加分項(xiàng)】
●扎實(shí)的數(shù)字信號處理基礎(chǔ),熟悉FFT、濾波器設(shè)計、聲學(xué)建模等;
●有嵌入式音頻開發(fā)經(jīng)驗(yàn),了解ARM/DSP等硬件平臺;
●熟悉實(shí)時音頻處理框架(如 WebRTC、JACK);
●熟悉小語種ASR/TTS模型優(yōu)化,有多語種部署經(jīng)驗(yàn);
●具備音頻硬件接口調(diào)試、聲學(xué)測試經(jīng)驗(yàn);