谷歌Duplex能替聽力受損用戶打電話完成預約

(綜合報導)藉助語言理解、互動、時間控制、語音生成方面的最近技術發展,Google Duplex 的對話聽起來相當真實自然。
為了處理上面提到的挑戰,Duplex 的核心是一個 RNN 網路,它是由 TensorFlow Extended(RFX)構建的。為了達到高精準度,Google 用匿名的電話對話數據訓練了 Duplex 的 RNN 網路。這個網路會使用 Google 自動語音辨識(ASR)的辨識結果文本,同時也會使用音頻中的特徵、對話歷史、對話參數(比如要預訂的服務,當前時間)等。Google 為每一種不同的任務分別訓練了不同的理解模型,不過不同任務間也有一些訓練語料是共享的。最後,Google 還利用 TFX 的超參數最佳化進一步改進了模型。

輸入語音先經過自動語音辨識系統(ASR)處理,生成的文本會與上下文數據以及其他輸入一起輸入 RNN 網路,生成的應答文本再透過文本轉語音(TTS)系統讀出來。
生成自然的語音
Google 聯合使用了一個級聯 TTS 引擎和一個生成式 TTS 引擎(其中使用了 Tacotron 和 WaveNet),根據不同的情境控制語音的語調。
這個系統還可以生成一些語氣詞(比如「hmmm」、「uh」),這也讓語音變得更自然。當級聯 TTS 需要組合變化很大的語音單元,或者需要增加生成的停頓時,語氣詞就會被添加到生成的語音中,這就讓這個系統可以以一種自然的方式向對方示意「是的我在聽」或者「我還在考慮」(人類說話的時候就經常在思考的同時發出一些語氣詞)。Google 的用戶調查也確認了人類覺得帶有語氣詞的對話更熟悉、更自然。
另一方面,系統的延遲也要能夠符合人類的期待。比如,當一個人在電話裡講了「你好」這樣的簡單句子之後,他們會希望很快聽到一個簡短的回覆,這種時候會對延遲更加敏感一些。當 AI 系統檢測到需要短延遲的情境時,就會使用更快但精準度也更低的模型來處理。在某些極端情況下,系統甚至都不會等待 RNN 執行,而是直接使用快速逼近模型(通常也會和更慢的正式回應搭配起來使用,就像人類不完全理解另一方的時候會猶豫一樣)。這樣的做法就可以讓系統達到 100ms 之內的極短延遲。有趣的是,Google 發現在某些情況下要增加一些延遲來讓對話聽起來更自然,比如回覆一個很複雜的句子的時候。
系統執行
Google Duplex 系統可以進行複雜的對話,它可以完全自動地完成大多數任務,不需要任何人類參與。系統也有一個自動監控機制,不僅成功完成一個任務後可以彈出提醒給用戶,也可以辨識出沒能成功完成的任務(比如處理某個異常複雜的預訂)。在這種情況下,它會發出指令給一個人類操作員,轉交給人類完成任務。
為了在訓練系統處理新的情境,Google 也使用了即時監督訓練。這種訓練方式和許多事情的教學方法類似,都有一個教學者指導一個學生,邊做邊提供必要的指導,確保任務的執行效果達到了教學者的品質要求水平。在 Duplex 系統中,有經驗的人類操作員就可以做為這樣的教學者,當系統打電話處理新的、不熟悉的情境時,人類操作員就可以即時影響系統的行為。這樣邊做邊學的過程,可以一直持續到系統達到理想的表現為止,然後系統就可以全自動地打電話了。
有益於用戶,也有益於商家
許多商戶並沒有自己的線上預定系統,仍然使用的是線上預定。Duplex 就可以幫助他們,無需改變每日的行為慣例或者培訓員工,就可以讓用戶透過 Google Assistant 輕鬆完成預定。Duplex 也可以減少用戶放鴿子的情況,可以在手機上自動提醒用戶預訂事項,以及幫助用戶輕鬆地取消或重新安排時間。
也有一些情況下,用戶會打電話向商家詢問營業時間,比如節慶假日期間的營業時間,一般在店舖的線上頁面是看不到的。Duplex 打電話詢問之後,可以透過 Google 服務把這個資訊公開出去,省去了其他用戶打同一個電話、問同樣的問題的精力,也幫商家節省了人力。同時,商家就像往常一樣正常營業就行,這項新技術並不需要他們學習任何技能或做任何改變就可以享受到便利。
對用戶來說,Google Duplex 當然可以幫助用戶輕鬆地完成它支援的各種任務。用戶只需要和 Google Assistant 做簡單的互動,Duplex 就會自動在後台打電話,並且自動補全所需的用戶資訊。

用戶讓 Google Assistant 做個預約,Google Assistant 接下來就會透過 Duplex 打電話與商家完成預約。
Duplex 還能為用戶帶來一項便利,就是可以非同步地做為服務提供商的代理,比如在非營業時間打電話給商家,或者手機訊號不好的時候,Duplex 在這種情況下就成為了一條額外的資訊獲取途徑。它也可以幫助殘障人士或語言不通的用戶,替聽力受損的用戶打電話完成預約,或替用戶用另一種語言完成任務。
今年夏天,Google 就會開始利用 Google Assistant 測試 Duplex,就從預訂餐廳、髮廊、詢問節慶假日的營業時間這樣的事項開始。
一直以來,讓人們可以「像人與人互動一樣自然地與科技互動」都是 Google 的目標。Google Duplex 就是邁向這個方向的一步,在特定場景下以自然的對話讓人和科技互動。Google 希望這些具體技術的發展也可以為人類和電腦的日常互動帶來更有意義的改進。
劉靜

電話本

發佈時間:2018-05-16
易搜網汽車買賣

老東方傢俱

版權所有 華人今日網