2018年中國人工智能行業(yè)研究報告
核心觀點:
1.廣義人工智能指通過計算機實現(xiàn)人的頭腦思維所產(chǎn)生的效果,是對能夠從環(huán)境中獲取感知并執(zhí)行行動的智能體的描述和構(gòu)建;相對狹義的人工智能包括人工智能產(chǎn)業(yè)(包含技術(shù)、算法、應(yīng)用等多方面的價值體系)、人工智能技術(shù)(包括凡是使用機器幫助、代替甚至部分超越人類實現(xiàn)認知、識別、分析、決策等功能)
2.工業(yè)革命使手工業(yè)自動化,機器學(xué)習(xí)則使機器本身自動化;開源環(huán)境大幅降低人工智能領(lǐng)域的入門技術(shù)門檻;視覺感知逐步實現(xiàn)商用價值,視覺認知仍有待探索
3.國家政策鼎力支持,指出要發(fā)展人工智能達到世界頂級水平,但人工智能道德與威脅問題關(guān)注較少
4.未來,事物的完整行為規(guī)劃或事項決策的發(fā)展空間較大;前沿算法之外,商業(yè)壁壘有賴于產(chǎn)品、服務(wù)、市場等綜合建設(shè)
5.未來不會出現(xiàn)崗位短缺,技術(shù)革命將提高社會整體福利;人工智能的核心價值在于提效降本、延續(xù)人類智慧
一、人工智能行業(yè)概述
通過機器實現(xiàn)人的頭腦思維,使其具備感知、決策與行動力
廣義上的人工智能泛指通過計算機實現(xiàn)人的頭腦思維所產(chǎn)生的效果,通過研究和開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)所構(gòu)建而成的,其構(gòu)建過程中綜合了計算機科學(xué)、數(shù)學(xué)、生理學(xué)、哲學(xué)等內(nèi)容。形象來說,人工智能可理解為由不同音符組成的音樂,而不同音符是由不同的樂器所奏響的,最終實現(xiàn)傳遞演奏者內(nèi)心所想與頭腦所思的效果。本篇報告將從人工智能技術(shù)、應(yīng)用、產(chǎn)業(yè)等維度進行探討,其中,人工智能技術(shù)包括凡是使用機器幫助、代替甚至部分超越人類實現(xiàn)認知、識別、分析、決策等功能,而產(chǎn)業(yè)則指包含技術(shù)、算法、應(yīng)用等多方面的價值體系。
人工智能三起三落,60年登上圍棋之巔
20世紀50年代到70年代初,人們認為如果能賦予機器邏輯推理能力,機器就能具有智能,人工智能研究處于“推理期”。當人們意識到人類之所以能夠判斷、決策,除了推理能力外,還需要知識,人工智能在20世紀70年代進入了“知識期”,大量專家系統(tǒng)在此時誕生。隨著研究向前進展,專家發(fā)現(xiàn)人類知識無窮無盡,且有些知識本身難以總結(jié)后交給計算機,于是一些學(xué)者誕生了將知識學(xué)習(xí)能力賦予計算機本身的想法。發(fā)展到20世紀80年代,機器學(xué)習(xí)真正成為一個獨立的學(xué)科領(lǐng)域、相關(guān)技術(shù)層出不窮,深度學(xué)習(xí)模型以及AlphaGo增強學(xué)習(xí)的雛形-感知器-均在這個階段得以發(fā)明。隨后由于早期的系統(tǒng)效果的不理想,美國、英國相繼縮減經(jīng)費支持,人工智能進入低谷。 80 年代初期,人工智能逐漸成為產(chǎn)業(yè), 但又由于5代計算機的失敗再一次進入低谷。2010年后,相繼在語音識別、計算機視覺領(lǐng)域取得重大進展,圍繞語音、圖像等人工智能技術(shù)的創(chuàng)業(yè)大量涌現(xiàn),從量變實現(xiàn)質(zhì)變。
工業(yè)革命使手工業(yè)自動化,機器學(xué)習(xí)則使機器本身自動化
將樣本數(shù)據(jù)輸入計算機,一般算法會利用數(shù)據(jù)進行計算然后輸出結(jié)果,機器學(xué)習(xí)的算法則大為不同,輸入的是數(shù)據(jù)和想要的結(jié)果,輸出的則為算法模型,即把數(shù)據(jù)轉(zhuǎn)換成結(jié)果的算法模型。通過機器學(xué)習(xí),計算機能夠自己生成模型,進而提供相應(yīng)的判斷,達到某種人工智能的結(jié)果的實現(xiàn)。因此,在數(shù)據(jù)的“初始表示”(如圖像的“像素”)與解決任務(wù)所需的“合適表示”相距甚遠的時候,可嘗試使用深度學(xué)習(xí)的方法。工業(yè)革命使手工業(yè)自動化,而機器學(xué)習(xí)則使機器本身自動化。近幾年掀起人工智能熱潮的深度學(xué)習(xí)屬于機器學(xué)習(xí)的一個子集,在思想和理論上并未顯著超越二十世紀八十年代中后期神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的研究,但得益于海量數(shù)據(jù)的出現(xiàn)、計算能力的提升,原來復(fù)雜度很高的算法得以落地使用,并在邊界清晰的領(lǐng)域獲得比過去更精細的結(jié)果,大大推動了機器學(xué)習(xí)在工業(yè)實踐中的應(yīng)用。2018年2月,《麻省理工科技評論》揭曉2018年“全球十大突破性技術(shù)”榜單,GAN(對抗性神經(jīng)網(wǎng)絡(luò),一種特殊的深度學(xué)習(xí)算法)位列其中。
國家政策鼎力支持,人工智能道德與威脅問題仍需思考
伴隨政策支持的逐步深入,中國政府將有力推動新一代人工智能技術(shù)的產(chǎn)業(yè)化與集成應(yīng)用,促進新一代人工智能產(chǎn)業(yè)發(fā)展,推動制造強國和網(wǎng)絡(luò)強國建設(shè),助力實體經(jīng)濟轉(zhuǎn)型升級,構(gòu)筑我國人工智能發(fā)展的先發(fā)優(yōu)勢。此外,相比美國和英國,中國對人工智能的支持力度雖更大,但較少關(guān)注人工智能的道德倫理問題、是否在開發(fā)對社會切實有益的人工智能以及應(yīng)當最小化技術(shù)進步所帶來的威脅問題。
人工智能產(chǎn)業(yè)圖譜
二、人工智能典型技術(shù)剖析
語音識別、自然語言處理、語音合成等技術(shù)
人類因為具有語言的能力而區(qū)別于其他物種,自然語言處理即研究人與計算機直接以自然語言的方式進行有效溝通的各種理論和方法,涉及機器翻譯、閱讀理解、對話問答等,因為語言在詞法、句法、語義等不同層面的不確定性及數(shù)據(jù)資源的有限性、背景知識的復(fù)雜性等各方面限制,自然語言處理技術(shù)仍有非常大的提升空間,僅在特定領(lǐng)域可取得較好的應(yīng)用,魯棒性存在大量挑戰(zhàn)。在自然語言處理之前,聲紋識別可根據(jù)說話人的聲紋特征識別出說話人,語音識別技術(shù)可賦予機器感知能力(在深度學(xué)習(xí)的驅(qū)動下,目前近場語音識別準確率可達98%,遠場、抗噪、多人等非限定或非配合條件下的識別有待進步),將聲音轉(zhuǎn)為文字供機器處理,在機器生成語言之后,語音合成技術(shù)可將語言轉(zhuǎn)化為聲音,形成完整的自然人機語音交互,這樣的語音交互系統(tǒng)可看作一個虛擬對話機器人,具體技術(shù)流程如下圖所示。
通用知識圖譜與行業(yè)知識圖譜
從覆蓋范圍的角度來說,知識圖譜可分為應(yīng)用相對廣泛的通用知識圖譜和專屬于某個特定領(lǐng)域的行業(yè)知識圖譜。通用知識圖譜注重橫向廣度,強調(diào)融合更多的實體,主要應(yīng)用于智能搜索、智能問答等領(lǐng)域。行業(yè)知識圖譜注重縱向深度,需要考慮到不同的業(yè)務(wù)場景與使用人員,通常需要依靠特定行業(yè)(如金融、公安、醫(yī)療、電商等)的數(shù)據(jù)來構(gòu)建,實體的屬性與數(shù)據(jù)模式往往比較豐富。
視覺感知逐步實現(xiàn)商用價值,視覺認知仍有待探索
視覺使人類得以感知和理解周邊的世界,人的大腦皮層大約有70%的活動在處理視覺相關(guān)信息,計算機視覺即通過電子化的方式來感知和理解影像。得益于深度學(xué)習(xí)算法的成熟應(yīng)用(2012年,采用深度學(xué)習(xí)架構(gòu)的AlexNet模型,以超越第二名10個百分點的成績在ImageNet競賽中奪冠;2017年,ImageNet圖像分類競賽Top 5的錯誤率降至2.25%),側(cè)重于感知智能的圖像分類技術(shù)在工業(yè)界逐步實現(xiàn)商用價值,但與可結(jié)合常識做猜想和推理進而輔助識別的人類智能系統(tǒng)相比,現(xiàn)階段的視覺技術(shù)往往僅能利用影像表層信息,缺乏常識以及對事物功能、因果、動機等深層信息的認知把握。
多學(xué)科融合,幫助人類做出復(fù)雜決策
為了做出最優(yōu)(經(jīng)濟的或其他的)決策,決策相關(guān)理論將概率理論和效用理論結(jié)合起來,為在不確定情況下(在概率描述能適當呈現(xiàn)決策制定者所處環(huán)境的情況下)做出決策提供了一個形式化且完整的框架。因為理性決策的顯著復(fù)雜性,歷史上決策相關(guān)理論一直與人工智能研究沿著完全分離的路線向前發(fā)展,但自20世紀90年代以來,決策逐步深入人工智能系統(tǒng)研究,經(jīng)濟學(xué)、博弈論、運籌學(xué)、人工智能等多領(lǐng)域?qū)W科思想融合,讓計算機智能處理海量數(shù)據(jù),相對實時的解決人類專家也難以及時求解的各類問題。
自動駕駛系統(tǒng)剖析
根據(jù)自動駕駛的擬人化研發(fā)思路,自動駕駛系統(tǒng)原理可理解為感知——認知——決策——控制——執(zhí)行五層,通過傳感器實現(xiàn)感知作用,并根據(jù)所感知信息完成處理與融合,對信息達成一定的認知和理解,在形成全局整體理解后,通過算法得出決策結(jié)果并傳遞給控制系統(tǒng)生成執(zhí)行指令。在整個過程中,汽車能夠通過V2X(Vehicle to Everything)通信實現(xiàn)車與外界(如道路設(shè)施、其他車輛等)的信息交換,幫助車輛實時獲取更大范圍的環(huán)境信息,解決“我在哪兒,周圍有什么,環(huán)境將發(fā)生什么變化以及我該怎么做“等四個問題。
三、人工智能的應(yīng)用場景
金融領(lǐng)域——主要應(yīng)用場景及相關(guān)影像采集設(shè)備
與安防影像分析中人臉的“1:N”識別不同,目前泛金融領(lǐng)域以人臉“1:1”身份認證為主,部分場景涉及“1:N”識別,如銀行網(wǎng)點中對VIP客戶的智能識別。
公共安全領(lǐng)域——生物特征識別與大數(shù)據(jù)研判增加公安預(yù)測和決策能力
計算機視覺、語音識別、機器學(xué)習(xí)等多項智能技術(shù)可對人臉、指紋、虹膜、掌紋、指靜脈、聲紋、步態(tài)等多種生物特征進行身份識別,其中人臉、指紋、虹膜等三大生物特征共占全球生物識別市場份額的80%以上。在公安的實際業(yè)務(wù)場景中,人工智能技術(shù)還可對公安大數(shù)據(jù)進行智能分析,在構(gòu)建“人、事、地、物、組織“的知識網(wǎng)絡(luò)的基礎(chǔ)上,實時監(jiān)測預(yù)警、研判,切實增加公安的認知、預(yù)測和決策能力。伴隨人工智能及大數(shù)據(jù)的技術(shù)進步,高清聯(lián)網(wǎng)攝像頭、各種傳感器的硬件部署應(yīng)用,從平安城市、智慧城市到雪亮工程等公共安全相關(guān)政策、人工智能相關(guān)國家戰(zhàn)略政策的逐步深化,公共安全領(lǐng)域的各種智能應(yīng)用將由重點區(qū)域、有條件的地區(qū)起步,完成從局部到整體的全國性拓展。
教育領(lǐng)域——由表及里,逐步深入學(xué)習(xí)核心環(huán)節(jié)
人工智能已在老師教學(xué)與學(xué)生學(xué)習(xí)、評測的各個環(huán)節(jié)切入教育領(lǐng)域,相關(guān)產(chǎn)品服務(wù)包括拍照搜題、分層排課、口語測評、組卷閱卷、作文批改、作業(yè)布置等功能,涉及了自適應(yīng)、語音識別、計算機視覺、知識圖譜、自然語言處理、機器翻譯、機器學(xué)習(xí)等多項人工智能技術(shù),正在創(chuàng)造著更加個性化、服務(wù)于終身學(xué)習(xí)的智能高效學(xué)習(xí)環(huán)境。
泛信息處理領(lǐng)域——人工智能讓人與信息的連接日益高效便捷
搜索與輸入法作為人工智能在信息處理領(lǐng)域的典型應(yīng)用,已大幅改變國人獲取信息與輸入信息的方式。移動互聯(lián)網(wǎng)時代,信息流推薦相關(guān)產(chǎn)品也成為用戶瀏覽應(yīng)接不暇的信息的一種有效工具。在人機交互方式不斷升級的當下,人與信息接觸的種種環(huán)節(jié)都在發(fā)生著智能化的創(chuàng)新變革。
醫(yī)療健康領(lǐng)域——改善醫(yī)療資源分布不均的問題,助力專家學(xué)者攻克醫(yī)療難關(guān)
相對生命的復(fù)雜性,人類對醫(yī)療健康的理解仍非常粗淺,現(xiàn)階段人工智能技術(shù)也不能有效應(yīng)對各種挑戰(zhàn),但這并不妨礙我們對人工智能技術(shù)寄予厚望,試圖通過前沿技術(shù)改變醫(yī)療資源分布不均的現(xiàn)狀,將醫(yī)生從繁重的工作壓力中解放出來,并幫助他們減少誤診率,提高準確率,甚至探索出新的診療方案或找到新型有效藥物。
零售領(lǐng)域——人工智能賦能零售業(yè),提升效率與收益,優(yōu)化消費者體驗
通過數(shù)據(jù)與商業(yè)邏輯的深度結(jié)合、先進感知技術(shù)的成熟運用,人工智能、運籌優(yōu)化等技術(shù)將切實提升零售全鏈條的資產(chǎn)配置效率,在精細化運營為企業(yè)創(chuàng)造出更多效益的同時,為消費者帶來更為理想的購物體驗。
廣告營銷領(lǐng)域——為廣告效果與營銷策略提供更科學(xué)的依據(jù)和更聰明的支持
相比人工智能在傳統(tǒng)行業(yè)的摸索嘗試,人工智能與廣告營銷的結(jié)合已有成熟落地(得益于數(shù)字營銷領(lǐng)域較好的信息化、網(wǎng)絡(luò)化基礎(chǔ)以及互聯(lián)網(wǎng)公司卓絕的技術(shù)創(chuàng)新力),用戶在搜索引擎、信息流產(chǎn)品、視頻網(wǎng)站、電視中看到的相關(guān)廣告可能都經(jīng)過了人工智能算法對多維度大數(shù)據(jù)的智能分析。人工智能力圖為企業(yè)提供智能創(chuàng)意及營銷策略和效果監(jiān)測,結(jié)合場景、內(nèi)容及渠道向用戶精準推薦,實現(xiàn)滿足用戶真實需求的高價值信息傳遞。
交通出行領(lǐng)域——人工智能有效改善交通問題,智能化交通有望全自動化
人工智能算法對交通出行所產(chǎn)生的信息進行了分析與預(yù)判,人工智能技術(shù)的應(yīng)用衍生出一系列智能設(shè)備,并對現(xiàn)有設(shè)備、應(yīng)用和服務(wù)提供嵌入式的智能處理能力,以協(xié)助交通管理者更好地進行決策,以便車流最有效的方式通行,提高交通流效率,實現(xiàn)交通升級轉(zhuǎn)型——交通智能化;未來,智能化交通解決方法中,人工參與與處理將逐漸削弱,有望達到自動化運作的水平。
交通出行領(lǐng)域——共享出行攤低落地成本,自動駕駛引發(fā)產(chǎn)業(yè)融合
國內(nèi)科技公司紛紛發(fā)聲將在2021年前后實現(xiàn)L4級自動駕駛(以國際汽車工程師協(xié)會制定(SAE)的自動駕駛級別劃分為衡量指標,L4級即系統(tǒng)完成所有操作,人類不一定需要對系統(tǒng)應(yīng)答)乘用車的量產(chǎn),但考慮到現(xiàn)有算法技術(shù)的能力邊界,艾瑞認為,2021年的時間節(jié)點相對樂觀,較難實現(xiàn)通用場景的L4級自動駕駛,小概率的意外缺陷都有可能引發(fā)致命事故。
但是,2021年成為創(chuàng)業(yè)者標桿的時候,它將促進“預(yù)言的自我實現(xiàn)”,技術(shù)的突破性進展及不斷拓寬的行駛場景依然值得期待。
實現(xiàn)自動駕駛需要在汽車中裝配大量的軟硬件設(shè)備,而大量設(shè)備將帶來高額推進成本。為減輕自動駕駛在推進消費市場時的成本等阻礙,可通過出行服務(wù)商進行系統(tǒng)安全性的評測并承擔相關(guān)成本。智能化與共享化是汽車產(chǎn)業(yè)生態(tài)的重要發(fā)展趨勢,車企、科技公司、出行服務(wù)商間的合作結(jié)盟也會愈發(fā)頻繁,智能出行公司隨之誕生。
智能客服領(lǐng)域——傳統(tǒng)客服由人力密集型向人機混合升級,提升咨詢效率
傳統(tǒng)客服業(yè)是典型的人力密集型,被視為是人工智能最有可能全面顛覆和取代的工種。不過,從目前的實踐情況來看,人工智能更多的是起到輔助人類決策和工作的層面,即,通過電話客服、網(wǎng)上客服、App、短信、微信以及智能機器人終端等產(chǎn)品與客戶進行語音或文本的互動交流,理解客戶淺層業(yè)務(wù)需求,回復(fù)客戶提出的業(yè)務(wù)咨詢,并根據(jù)客戶語音導(dǎo)航至指定業(yè)務(wù)模塊,實現(xiàn)優(yōu)化人工客服咨詢效率。智能客服目前的成熟應(yīng)用主要在售后階段,以重復(fù)性問題標準化回答為主,未來智能客服業(yè)的應(yīng)用將繼續(xù)升級,由現(xiàn)在的“以問題為中心”轉(zhuǎn)變?yōu)椤耙杂脩魹橹行摹钡闹悄苷Z音助理,由現(xiàn)在服務(wù)于企業(yè)/商家的機器人轉(zhuǎn)變?yōu)榉?wù)于每一個用戶。
四、人工智能行業(yè)發(fā)展趨勢
對事物的完整行為規(guī)劃或事項決策的發(fā)展空間較大
以深度學(xué)習(xí)為基礎(chǔ)建立的人工智能技術(shù)一般是在用大數(shù)據(jù)解決小問題,而人類智能往往能夠以小數(shù)據(jù)解決大問題。人類可憑借自己的觀察和判斷形成最終的價值決策,機器的語音識別、計算機視覺等AI能力在現(xiàn)階段還很難支撐到對事物的理解、與判斷,距離完整行為規(guī)劃或事項決策仍有較大的發(fā)展空間。
未來不會出現(xiàn)崗位短缺,技術(shù)革命將提高社會整體福利
就失業(yè)問題而言,在向日益自動化的世界過渡時,機器學(xué)習(xí)和人工智能技術(shù)的發(fā)展升級定會逐步影響就業(yè)市場。我們假設(shè)人類的就業(yè)機會將大幅減少,然而,就業(yè)機會減少的同時,不得不承認的是,技術(shù)革命也會不斷促進萬眾創(chuàng)新,人們會從重復(fù)性的勞動中解放出來,將更多時間和精力用于創(chuàng)造性活動。換而言之,人工智能將緩解勞動力危機,使人們自由追求生活及工作新方式,從而提高社會的整體福利。因此,準確地說,在未來不會出現(xiàn)崗位短缺,取而代之的應(yīng)當是匹配職業(yè)的技能的短缺。如同工業(yè)革命、信息革命等,歷史已經(jīng)告訴我們,長久以來,新興科技帶來的問題都將被解決,從而使消費者們能夠享受與之而來的紅利。
人工智能將實現(xiàn)提效降本、延續(xù)人類智慧的核心價值
如同報告開篇所提,人工智能即通過智能實現(xiàn)人類思維的效果,從宏觀層面來看,此效果體現(xiàn)在智能社會與智能經(jīng)濟層面, 即,人工智能將大幅改善依賴勞動力創(chuàng)造的勞動密集型、簡單重復(fù)性的傳統(tǒng)經(jīng)濟運行模式,并依托此經(jīng)濟模式構(gòu)建萬物互聯(lián)、智能協(xié)同的產(chǎn)業(yè)體系,打造國際領(lǐng)先的智能社會。從微觀層面來看,人工智能將替代傳統(tǒng)勞動,帶來新式生產(chǎn)方式,以提升生產(chǎn)效率并降低成本,進而實現(xiàn)企業(yè)效益提升、改善人們工作與生活。而隨著機器變得聰明,我們將最終實現(xiàn)人性化人工智能(Humanistic AI),即通過機器達到擬人的形式并以這類形式延伸人類智慧。