Vocofy 與 Amazon Polly 的分別

Amazon Polly 是將文字轉換為接近真實語音的雲端服務,使用 Amazon Polly 開發各種可提高參與度和可用性的應用程式。

它支援多種語言且包含各種逼真的語音,因此用家可以建立各種具備語音功能的應用程式,這些應用程式可在多個位置運作,並針對用家的客户使用適當的語音。使用 Amazon Polly 時,用家按合成的文字付費。快取及重播 Amazon Polly 產生的語音,則無須支付額外費用。

此外,Amazon Polly 包含大量神經文字轉換語音 (NTTS) 音頻,通過新的機器學習方法提供突破性的語音品質改善,從而為客户提供最自然且最逼真的文字轉換語音音。神經 TTS 技術也支援針對新聞旁白使用案例量身打造新聞播報員說話風格。 Amazon Polly 的常見使用案例包括 (但不限於) 行動應用程式,例如新聞讀程式、遊戲、電子學習平台、視障人士適用的協助工具應用程式以及迅速成長的物聯網 (IoT) 區塊。

Amazon Polly 已通過認證,可用於 1996 年 Health 保險流通與責任法案 (HIPAA) 和支付卡產業資料安全標準 (PCI DSS) 的受管制工作負載。 使用它的優點包括: 高品質— Amazon Polly 提供新的神經 TTS 和同級最佳的標準 TTS 技術,可合成優異的自然語音與高讀音準確性 (包括縮寫、首字母縮略詞擴展、日期/時間解譯和同形異義詞歧義消歧)。 低延遲— Amazon Polly 確保快速的回應時間,使其成為低延遲使用案例 (例如對話系統) 切實可行的選項。 Support 大量的語言和語音組合— Amazon Polly 支援數十種語音語言 (包括廣東話),提供男性及女性大多數語言的語音選項。神經 TTS 目前支援三種英式英文語音和八種美式英文語音。

我們建構的 Vocofy,與 Amazon 的大型人工智能模式不能相提並論,Vocofy 專注在廣東話單一語言,尤其在語氣、發音、同音異字、同字異音等方面做到最精細。例如,Vocofy 能分辨「步行」、「行路」、「銀行」,而發聲時候的停頓和節奏,都已十分「穩陣」。Vocofy 團隊和中大團隊每天處理大量數據和訓練人工智能模型,並着力與香港的出版社合作,發展廣東話有聲書。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

返回頂端