職缺描述
針對智慧音場、空間音訊、人聲處理之核心技術進行模型設計,並研究演算法設計整合與優化,完成應用程式開發。主要工作內容包含: 語音資料集蒐集與處理:收集、標註和處理大量語音數據,用於模型訓練和測試。 演算法開發:開發和優化語音識別(ASR)、語音合成(TTS)和語音識別技術,針對專案需求優化與修改模型架構與演算法設計。 模型訓練:使用機器學習和深度學習技術訓練語音模型,提高識別和合成的準確性和效率。 性能優化:針對不同應用場景,優化演算法的性能和資源佔用。 技術研究:跟蹤最新的 AI 和語音技術發展與會議期刊論文,並將其應用到專案中。
收合內容