我們已經看到了很多驚人的進展。在一瞬間數以千億計的計算能力幫助下,最新的人工智能技術能夠以人類水平的準確性理解某些類型的文本。然而,當目標文本屬于一長段對話時,系統面臨的挑戰就變得更加艱巨,因為它需要考慮對話上下文來解釋用戶的意思并決定該如何回應。不過,像臉書的BlenderBot 2.0這樣的聊天機器人似乎預示著人類與人工智能的互動會流暢自然許多。
但問題在于:我們給這些對話式人工智能機器人增加的復雜性越多,就越難滿足我們對實時響應能力的期望。BlenderBot 2.0就是一個完美的例子。因為它突破了BlenderBot 1.0的許多關鍵局限(包括缺乏長期記憶),所以2.0版本比它的前輩要復雜得多。因此,要讓幕后起作用的機器學習響應速度更快就更難了。
對話式人工智能和聊天機器人的速度限制要實現自然流暢的對話是沒有什么秘密可言的。它需要一個讓人頭疼的龐大機器學習模型網絡,為了確定下一步應該回答什么內容,網絡中每一個模型都要解決一小塊難題。一個模型可能會考慮用戶的位置,另一個模型會考慮到互動的歷史,還有一個模型需要考慮到過去類似回應引起的反饋——每個模型都會給系統增加以毫秒計的寶貴延遲。
換句話說,對話式人工智能的真正限制是我們的耐心。
“依賴地獄”的深度我們對人工智能的期望在學術背景下完全是另一碼事。在學術背景下,我們為了結果可以等待幾個小時甚至幾天;而在現實環境中,我們要求系統立即做出反應。特別是對于對話式人工智能機器人來說,每一項潛在的改進都必須考慮到降低延遲的目標來進行權衡。
這種延遲是所謂的“關鍵路徑“的產物,關鍵路徑是指:從輸入(用戶的信息)到輸出(機器人的反應)所需的最短機器學習模型鏈條序列。這是一個來自項目管理的古老概念,但在試圖避免不必要的步驟這方面,它對今天的機器學習網絡來說是非常重要的。
那么,你該如何找到關鍵路徑呢?這一切都歸結為依賴關系,長期以來,這一直是常規軟件開發領域的一個決定性問題。對于任何一種由很多部分相互連接而成的軟件架構來說,改進其中某一個應用程序都可能迫使工程師更新整個系統。但有時,對應用A來說至關重要的更新卻與應用B、C和D不兼容。
這就是所謂的“依賴地獄“。如果不去特別關注細節的話,機器學習的依賴關系會讓我們面對的地獄更加深邃黑暗。
正常的軟件依賴項是基于API的,它傳達了一個特定應用程序的簡單、離散的狀態,例如電子表格中的一個單元格從紅色變為綠色。API允許工程師在某種程度上獨立開發每個應用程序,同時讓它們保持在同一頁面上。但對于機器學習的依賴項來說,工程師則要處理抽象的概率分布才行,這意味著我們很難搞清楚一個模型的變化應該如何影響更大范圍的機器學習網絡。只有掌握了這些模型之間的細微關系,我們才能讓對話式人工智能成為現實——更不用說實時體驗了。
通過跳過步驟來節省時間為了充分了解對話式人工智能的依賴關系,你需要將機器學習與人類的直覺相結合在一起。
舉個例子,我們的一個對話式人工智能機器人旨在回應員工的各種請求,比如說他們想要一個PowerPoint許可證,或是對PTO政策有疑問。事實證明,即使是看起來很簡單的問題也會把你帶入依賴地獄的深處。PTO問題的答案可能深藏在員工手冊的第53頁,而且對于加拿大的銷售人員和西班牙的工程師來說可能還是不一樣的。此外你還要忽略很多不相關的細節(比如員工的夏威夷度假計劃),所以你有幾十個專門的機器學習模型,它們還必須作為一個整體來運作。
訣竅在于確定哪些模型——也就是關鍵路徑中的哪些步驟——是解決每個問題所必需的。第一步是自然語言理解,或NLU,其目標是將非結構化文本轉化為機器可操作的信息。我們的NLU是一個由許多機器學習模型組成的管道,可以糾正錯別字、識別關鍵實體、從噪音中分離出信號、弄清用戶的意圖,等等。有了這些信息,我們就可以開始在下游篩選出不必要的模型。
這意味著在分析公司現有的實際解決方案之前,預測出目標問題有哪些有益解決方案。一名要求使用PowerPoint的員工可能會用到軟件許可或申請表格,但他們幾乎肯定不想要新辦公室的地圖。只要能充分利用來自NLU流程的信息,我們就可以通過所謂的“預觸發“系統,預測哪些模型需要激活,哪些模型需要繞過。
鑒于這一過程中所涉及的概率分布的抽象性質,我們的預觸發系統既依賴于機器學習的輸入,也依賴于人類專家基于直覺制定的規則。歸根結底,把時間花在有意義的地方既是一門藝術,也是一門科學。
為對話式AI機器人的進步留出空間沒有人知道對話式人工智能在十年后會是什么樣子。然而我們所知道的是,我們現在需要優化我們的聊天機器人,為未來的進步留出空間。如果我們想獲得像人類對話一樣的體驗,我們就必須考慮整個系統的延遲,不能毫不顧忌地增加越來越多的復雜性。
與科幻小說相反,我們在人工智能領域看到的“突破“都是對現有模型和技術的許多小的、漸進式改進累加起來的產物。優化對話式人工智能的工作并不是為了影視作品里那種效果,成果也很難在一夜之間就爆發。但是,正是這些年的不懈努力——而不是幾次天才般的思想火花——讓聊天機器人能夠實時理解我們的意圖并幫助我們。