今天給大家介紹下人工只能發展的幾個關鍵技術。從語音識別到智能家居,從人機大戰到沒人駕駛,人工智能的“演化”給我們社會上的一些生活細節,帶來了一次又一次的驚喜,前景更多智能產品依托的人工智能技術會開展成什么樣呢?讓我們來看看人工智能規范化白皮書里面,對人工智能重要關鍵技術的定義。
人工智能技術關系到人工智能產品是否能夠順利應用到我們的生活場景中。在人工智能領域,它普遍包括了機器進修、知識圖譜、自然語言處理、人機交互、計算機視覺、生物特征識別、AR/VR七個重要關鍵技術。
一、機器進修
機器進修(Machine Learning)是一門波及統計學、系統辨識、逼近理論、神經網絡、優化理論、計算機科學、腦科學等諸多領域的交叉學科,鉆研計算機怎樣模擬或達到人類的進修行為,以獲取新的知識或技能,重新組織已有的知識構造使之不斷改善自身的性能,是人工智能技術的核心。基于數據的機器進修是現代智能技術中的重要方法之一,鉆研從觀測數據(樣本)出發尋找規律,利用這些規律對前景數據或沒法觀測的數據進行預測。依據進修模式、進修方法以及算法的不同,機器進修存在不同的分類方法。
依據進修模式將機器進修分類為監督進修、沒監督進修和強化進修等。
依據進修方法能夠將機器進修分為傳統機器進修和深度進修。
二、知識圖譜
知識圖譜本質上是構造化的語義知識庫,是一種由節點和邊組成的圖數據構造,以符號形式描述物理世界中的概念及其互有關系,其根本組成單位是“實體—關系—實體”三元組,以及實體及其有關“屬性—值”對。不同實體之間通過關系互相聯結,構成網狀的知識構造。在知識圖譜中,每個節點表示現實世界的“實體”,每條邊為實體與實體之間的“關系”。通俗地講,知識圖譜就是把所有不同品種的信息連接在一起而得到的一個關系網絡,提供了從“關系”的角度去分析問題的才能。
知識圖譜可用于反欺詐、不一致性驗證、組團欺詐等公共安全保障領域,須要用到異常分析、靜態分析、動態分析等數據挖掘方法。特別地,知識圖譜在搜索引擎、可視化展現和精準營銷方面有很大的優勢,已成為業界的熱門工具。但是,知識圖譜的開展還有很大的挑戰,如數據的噪聲問題,即數據自身有錯誤或者數據存在冗余。隨著知識圖譜應用的不斷深層,還有一系列重要關鍵技術須要突破。
三、自然語言處理
自然語言處理是計算機科學領域與人工智能領域中的一個重要方向,鉆研能達到人與計算機之間用自然語言進行有效通信的各種理論和方法,波及的領域較多,主要包含機器翻譯、機器瀏覽了解和問答系統等。
機器翻譯
機器翻譯技術是指利用計算機技術達到從一種自然語言到另外一種自然語言的翻譯過程。基于統計的機器翻譯方法突破了之前基于規則和實例翻譯方法的局限性,翻譯性能取得宏大提升。基于深度神經網絡的機器翻譯在日常口語等一些場景的成功應用已經顯現出了宏大的潛力。隨著高低文的語境表征和知識邏輯推理才能的開展,自然語言知識圖譜不斷擴充,機器翻譯將會在多輪對話翻譯及篇章翻譯等領域取得更大進展。
語義了解
語義了解技術是指利用計算機技術達到對文本篇章的了解,并且答復與篇章有關問題的過程。語義了解更注重于對高低文的了解以及對答案精準程度的把控。隨著 MCTest 數據集的發布,語義了解受到更多關注,取得了快捷開展,有關數據集和對應的神經網絡模型層出不窮。語義了解技術將在智能客服、產品自動問答等有關領域發揮重要作用,進一步提高問答與對話系統的精度。
問答系統
問答系統分為開放領域的對話系統和特定領域的問答系統。問答系統技術是指讓計算機像人類一樣用自然語言與人交流的技術。人們能夠向問答系統提交用自然語言表達的問題,系統會返回關聯性較高的答案。只管問答系統目前已經有了不少應用產品出現,但大多是在現實中信息效勞系統和智能手機助手等領域中的應用,在問答系統魯棒性方面依然存在著問題和挑戰。
自然語言處理面臨四大挑戰:
一是在詞法、句法、語義、語用和語音等不同層面存在不確定性;
二是新的詞匯、術語、語義和語法導致未知語言現象的不可預測性;
三是數據資源的不充分使其難以籠罩復雜的語言現象;
四是語義知識的含糊性和撲朔迷離的關聯性難以用簡略的數學模型描述,語義計算須要參數龐大的非線性計算
四、人機交互
人機交互主要研究人和計算機之間的信息交換,主要包括人到計算機和計算機到人的兩部分信息交換,是人工智能領域的重要的外圍技術。人機交互是與認知心理學、人機工程學、多媒體技術、虛擬現實技術等密切相關的綜合學科。傳統的人與計算機之間的信息交換主要依靠交互設備進行,主要包括鍵盤、鼠標、操縱桿、數據服裝、眼動跟蹤器、位置跟蹤器、數據手套、壓力筆等輸入設備,以及打印機、繪圖儀、顯示器、頭盔式顯示器、音箱等輸出設備。人機交互技術除了傳統的基本交互和圖形交互外,還包括語音交互、情感交互、體感交互及腦機交互等技術。
五、計算機視覺
計算機視覺是運用計算機模仿人類視覺系統的科學,讓計算機擁有類似人類提取、處理、了解和分析圖像以及圖像序列的才能。自動駕駛、機器人、智能醫療等領域均須要通過計算機視覺技術從視覺信號中提取并處理信息。近來隨著深度進修的開展,預處理、特征提取與算法處理慢慢融合,構成端到端的人工智能算法技術。依據攻克的問題,計算機視覺可分為計算成像學、圖像了解、三維視覺、動態視覺和視頻編解碼五大類。
目前,計算機視覺技術開展迅速,已具備初步的產業規模。前景計算機視覺技術的開展主要面臨以下挑戰:
一是怎么樣在不同的應用領域和其他技術更好的聯合,計算機視覺在攻克某些問題時能夠廣泛利用大數據,已經漸漸成熟并且能夠超過人類,而在某些問題上卻沒法到達很高的精度;
二是怎么樣降低計算機視覺算法的開發時長和人力老本,目前計算機視覺算法須要大量的數據與人工標注,須要較長的研發周期以到達應用領域所要求的精度與耗時;
三是怎么樣加快新型算法的設計開發,隨著新的成像硬件與人工智能芯片的出現,針對不同芯片與數據采集設備的計算機視覺算法的設計與開發也是挑戰之一。
六、生物特征識別
生物特征識別技術是指通過個體生理特征或行為特征對個體身份進行識別認證的技術。從應用流程看,生物特征識別通常分為注冊和識別兩個階段。注冊階段通過傳感器對人體的生物表征信息進行采集,如利用圖像傳感器對指紋和人臉等光學信息、麥克風對說話聲等聲學信息進行采集,利用數據預處理以及特征提取技術對采集的數據進行處理,得到相應的特征進行存儲。
識別過程采用與注冊過程一致的信息采集方式對待識他人進行信息采集、數據預處理和特征提取,其次將提取的特征與存儲的特征進行比對分析,完成識別。從應用任務看,生物特征識別一般分為辨認與確認兩種任務,辨認是指從存儲庫中確定待識他人身份的過程,是一對多的問題;確認是指將待識他人信息與存儲庫中特定單人信息進行比對,確定身份的過程,是一對一的問題。
生物特征識別技術波及的內容十分廣泛,包含指紋、掌紋、人臉、虹膜、指靜脈、聲紋、步態等多種生物特征,其識別過程波及到圖像處理、計算機視覺、語音識別、機器進修等多項技術。目前生物特征識別作為重要的智能化身份認證技術,在金融、公共安全、教育、交通等領域得到廣泛的應用。
七、VR/AR
虛擬現實(VR)/增強現實(AR)是以計算機為核心的新型視聽技術。聯合有關科學技術,在一定范圍內生成與真實環境在視覺、聽覺、觸感等方面高度近似的數字化環境。用戶借助必要的裝備與數字化環境中的對象進行交互,互相影響,獲得近似真實環境的感受和體驗,通過顯示設備、跟蹤定位設備、觸力覺交互設備、數據獲取設備、專用芯片等達到。
虛擬現實/增強現實從技術特征角度,依照不同處理階段,能夠分為獲取與建模技術、分析與利用技術、替換與分發技術、展現與交互技術以及技術規范與評價體系五個方面。獲取與建模技術鉆研怎么樣把物理世界或者人類的創意進行數字化和模型化,難點是三維物理世界的數字化和模型化技術;分析與利用技術重點鉆研對數字內容進行分析、了解、搜索和知識化方法,其難點是在于內容的語義表示和分析;替換與分發技術主要強調各種網絡環境下大規模的數字化內容流通、轉換、集成和面向不同終端用戶的個性化效勞等,其核心是開放的內容替換和版權管理技術;展現與替換技術重點鉆研合乎人類習慣數字內容的各種顯示技術及交互方法,以期提高人對復雜信息的認知才能,其難點在于建設自然和諧的人機交互環境;規范與評價體系重點鉆研虛擬現實/增強現實根底資源、內容編目、信源編碼等的規范規范以及相應的評估技術。
目前虛擬現實/增強現實面臨的挑戰主要體此時智能獲取、普適設備、自由交互和感知融合四個方面。在硬件平臺與裝置、核心芯片與器件、軟件平臺與工具、有關規范與規范等方面存在一系列科學技術問題。總體來說虛擬現實/增強現實呈現虛擬現實系統智能化、虛實環境對象沒縫融合、自然交互全方位與溫馨化的開展趨勢。