今日篮球推荐预测-cctv5足协杯直播-中国足彩网首页官网-英格兰世界杯冠军|www.wsnxt.com

沈陽鴻宇科技有限公司

【行業資訊】論人工智能歷史、現狀與未來發展戰略

發布時間:2022-02-18 文章來源:鴻宇科技 瀏覽次數:1253

       人工智能問世60多年來,承載著人類對自己的智慧的無限自信。在這樣的自信下,人工智能發展到了今天,人們在追求機器從事盡可能多的智力勞動的路上走得很快,也很遠。今天人工智能的發展,實際上標志著人類第三次認知革命,即它的目標是通過探求人類智能認識自我而形成主觀世界的機制,并把這樣的能力賦予機器以改造客觀世界,以實現人類智能的體外延伸。從這個意義上來說,人工智能的發展將會改變整個人類的文明進程。

       香港浸會大學副校長郭毅可認為人工智能發展到今天所面臨的主要問題是:“缺乏知識”。目前機器還沒有掌握總結知識、積累知識、應用知識、傳承知識和建立組織管理知識體系的能力。今天人工智能面臨的挑戰,也為中國人工智能的發展帶來了難得的戰略機遇。中國人工智能發展戰略的關鍵就是直面挑戰,大力發展人工智能的基礎理論,確立自己的學術自信和話語權,在人工智能賦能上下大功夫,建立自己的人工智能工業體系,實實在在地在有選擇的重點領域中,以人工智能技術作為推動力,實現革命性的產業創新。

重要觀點
       當前我國人工智能技術發展面臨知識匱乏的問題,以佛學的“五明”理論來闡釋,一是缺乏“聲明”,人類智能對自己行為的解釋以及和世界交流的能力依然不足;二是缺乏“因明”,無法揭示和演繹因果關系;三是缺乏“內明”,智能體沒有主觀能動性;四是缺乏“醫方明”,需要形成系統觀;五是缺乏“工巧明”,需加強對智能體行為的研究。

       中國推動人工智能發展首先要明確研究的方向和切合實際的目標。我們在確定人工智能研究的發展道路和長期目標的時候,一定要對人工智能發展有一個正確客觀的科學思考,這樣才能避免許多由于盲目樂觀或技術跟風而造成的時間和資源上的巨大浪費。

       其次要切實重視人工智能基礎理論的研究與創新,培養有創造力的人工智能人才。必須創造一個生態環境,使得科學家能夠沉下心來,進行跨學科的深入的理論研究,并培養出具有扎實的理論素養、寬廣的知識面、豐富的科學想象力創造力的人工智能研究型人才。

       第三要建立人工智能發展的生態環境,需要建立具有中國特色的數據市場和數據經濟體系、算力體系,以及加強對于人機二元社會的新的社會形態、準則、相關法律和道德倫理的研究。

       第四是建立完整的人工智能化產業體系,應利用好我國在數據和算力上的優勢,建設好我國基于大模型的“智能能源”和人工智能產業鏈,從而形成一個完整的人工智能賦能環境。

更多精彩觀點

       人工智能問世60多年來,承載著人類對自己的智慧的無限自信。圖靈思想實驗的哲學基礎,就是認為人的智能是世上所有可能智能的極限,所以只要機器可以讓人無法區分其智能行為與人的差異,那么機器就有了智能。在這樣的自信下,人工智能發展到了今天,人們在追求機器從事盡可能多的智力勞動的路上走得很快,也很遠。例如,讓機器寫新聞、讓機器作音樂、讓機器改照片等。根據世界經濟論壇與諸多機構于2018年共同提出的“人工智能發展時間表”的若干預測:

       2024年,人工智能可自行撰寫Python代碼(根據筆者判斷,其實現在應該已經有這類的研究成果,所以機器在2024年可以自己編寫程序的預估決不夸張,而如果機器能夠寫出好的程序的話,那么機器就能夠自行發展和創造新的機器功能);2028年,人工智能可以創造出影片;2049年,人工智能寫的小說會成為暢銷書籍;2059年,人工智能甚至可以自己進行數學研究。

       這些預測說明了人工智能的發展已經進入了一個新的歷史階段。根據斯坦福大學最近的報告,2020年全球企業對AI領域的投資增至近680億美元,比2019年增長了40%。人工智能的研究也在蓬勃發展:2019年,全球發表了超過12萬篇關于AI的論文。2000年至2019年之間,人工智能的論文占所有同行評審論文的比例從0.8%上升到了3.8%。總之,人工智能的發展可謂方興未艾。今天人工智能的發展,實際上標志著人類第三次認知革命,即它的目標是通過探求人類智能認識自我而形成主觀世界的機制,并把這樣的能力賦予機器以改造客觀世界,以實現人類智能的體外延伸。從這個意義上來說,人工智能的發展將會改變整個人類的文明進程。

01 對人工智能發展的回顧

       對人類智能的理解。作為生物鏈最頂層的人類,需要有更復雜、更強大的思維能力,來合理分配資源、優化自己的生存條件、預見和應對不斷變化的威脅因素,為此人類進化出獨特的能不斷產生和運用智能的腦神經系統,近代神經科學的研究表明:人類大腦中具有的新皮層是學習和記憶功能的載體,從而開啟了專門研究神經的思維機制的學科——認知神經學,它的核心就是研究大腦皮層中神經元的活動以及他們之間飛速傳遞的電脈沖與思維活動之間的關系。

       認知神經學的產生和人工智能的發展同步。在人工智能發展的初期,正是借著對人腦機制的初步認識,開啟了人工智能的第一個高潮。1958年,在標志性的達特茅斯會議之后僅僅2年,美國學者弗蘭克·羅森布拉特就提出了感知器,這是一種參數可變的單層神經網絡模型,是人類第一次把自己所具備的學習功能用算法模型的形式表達出來,第一次賦予了機器可以從數據中學習知識的能力,它是今天神經網絡的雛形,提出了許多今天機器學習的核心概念。美國軍方認為感知器可以識別坦克,從而投資進行研究,但很快人們就認識到了這樣簡單學習模型的局限性,從而結束了人工智能研究的第一次高潮。在以后的研究中,人們對于認知神經科學的研究有了巨大的進展,特別是90年代發展成熟的核磁共振技術,可以通過對人腦神經細胞中血氧的變化,來衡量人腦神經元在思維過程中神經元的活動和神經元之間信號的傳遞,從而使認知神經學的研究真正成了基于腦神經大數據的實驗科學。今天,我們對于產生智能的人腦發展有了較深刻的認識,提出了許多有關思維的機制理論,我們普遍認識到,大腦的皮質層是有自我組織能力的模式識別器,谷歌的首席創新官雷·庫茲韋爾,在他的名著《如何創造思維》一書中,提出了思維模式認知理論,其核心思想在于思維機制的模塊化所組織起來的神經元網絡的信號傳遞,而模塊化的互聯互動形成智能,這個思想和馬克拉姆的樂高式模塊組織形成智能的觀念是一致的。這種模塊化神經元組織機制形成智能的思想,也是近來興起的深度學習的神經學理論基礎。

       對機器智能的發生發展的機制的理解。人工智能發展之初,機器的計算和存儲能力都非常有限,同時,機器也缺乏感知外部世界活動的功能及手段,所以機器智能的范圍只限于對在有限的問題求解空間中的搜索。因此,機器智能的機制,早期被局限于搜索。而邏輯推理是一個典型的應用范例。用邏輯推理對符號進行演繹,以模仿人類的邏輯思維,成為人工智能的一大流派,稱之謂“符號主義”。從早期紐維爾、西蒙、王浩等人在機器定理證明的工作,到1965年羅賓遜發明了歸結算法,即把一階邏輯推理變成一個機械的搜索算法,符號主義的工作使推理成為機器智能的主要機制。這些工作,直接導致了20世紀80年代初的以日本第五代計算機為代表的人工智能研究的第二次高潮。以推理作為機器智能的機制,要求人類把知識以邏輯的形式告訴計算機,然而人們很快就認識到,這樣靠人工獲取知識的手段是機器智能的一大瓶頸,機器的智能,只有在具有自動地從客觀世界中獲取知識的能力之后,才能取得革命性的進步。

       步入21世紀,人類進入了互聯網時代。這時不僅計算機的計算和存儲能力得到了巨大的提升,而且世界的萬物互聯和傳感技術的發展,使人們在量化世界的道路上飛速前進,人類步入了量化萬物的大數據時代,這樣的量化世界所提供的無盡的數據資源以及以云計算技術組織起來的空前的計算能力,終于使得我們有可能使知識的自動獲取成為現實。于是,從大數據中自動獲取知識的機器學習,成為新一代人工智能的主要機制和技術驅動力。1985年辛頓和謝諾夫斯基發表了《玻爾茲曼機的一種學習算法》一文,提出多層神經網絡的學習機制,1986年羅姆哈特和辛頓發表的《通過誤差的傳播學習內在表示》一文,提出了反向傳播算法,從而使神經元網絡具有了可以自動調節神經元連接的權重,進而實現了不斷優化目標函數的學習功能。后來十幾年,計算機科學家們提出了包括像卷積神經網絡等一系列神經元網絡結構,使得神經元網絡可以自動提取對學習有意義的數據特征。這一系列的成果使得今天我們稱之為深度學習的人工智能技術,成為機器智能的主要內在機制。

       人工智能對人類社會發展產生深刻影響。在人工智能的發展歷程中,每一次前進都受到了世界主要經濟體政府的積極推動。這樣的推動都來自它們對人工智能在經濟發展中的領導力的戰略考慮。在我們談論人工智能技術在今天的經濟發展中的重要作用時,不能僅僅著眼于當前的人工智能技術在今天的經濟和社會生活環境下的應用,更重要的是要把人工智能作為一種新的發展中的生產力。這樣的新生產力和以往導致生產力革新的技術,如蒸汽機、電力計算機和互聯網有著本質不同,它是一種可以反作用于人類的生產力,是可以和人類一起共生、共長的生產力,它的發展可以促進人類自身的智能的進步和拓展,而這樣的進步反過來又會增進機器智能的進一步發展。

       所以,我們不能簡單地把人工智能在經濟上的作用,用一個“人工智能+”來總結,人工智能不只是一個賦能技術,其本身在創造嶄新的社會形態和經濟結構,對現在和未來生活的影響無處不在,我們正在進入一個人工智能“Inside”的時代。今天人工智能的產業化,正在走向“智能能源化”的產業模式,即通過設計先進算法,整合多模態大數據,匯聚大量算力,訓練出通用的、可遷移的大模型,來服務于不同的應用領域和解決實際問題。這樣的“大模型”作為對于大數據的歸納和抽象,成為一種“預訓練模型”,作為構造各種人工智能解決方案的基礎。從2018年10月Google發布了3.4億參數的BERT模型,2020年5月Open AI發布了1750億參數的GPT-3模型,到2021年6月北京智源人工智能研究院發布了1.75萬億參數的“悟道2.0”模型,以及2021年6月阿里達摩研究院僅用480片GPU實現了國內第一個商業化的萬億多模態大模型,這樣的大模型把大數據轉化成了一種“智能能源”,在通用的大模型基礎之上,應用方可以使用自己特有的數據對模型進行小計標量的微調遷移,以達到目的。這是一個人工智能很有希望的產業化途徑。

02 人工智能面臨的問題

       人工智能發展到今天,碩果累累。但是,我們必須清晰地認識到,人工智能技術今天依然面臨著許多根本性的問題,一言以蔽之就是:它缺乏知識。現階段,我們的機器并沒有掌握總結知識、積累知識、應用知識、傳承知識和建立組織管理知識體系的能力。人工智能在知識上的缺乏,可以用佛學的“五明”理論來闡釋。佛學把世間的一切學問歸結為五種學問,稱為“五明”:即語文學的“聲明”、工藝學的“工巧明”、醫藥學的“醫方明”、科學的“因明”、哲學的“內明”。“五明”被視為道行者的基本功,是佛教對人間知識的總結,行道要從“五明”入手,來傳播佛法普度眾生。用“五明”來觀察人工智能今天面臨的知識匱乏問題,實際上是很貼切的。我們可以把佛學“五明”的涵義加以擴展:“聲明”指的是人類智能對自己行為的解釋以及和世界交流的能力;“工巧明”指的是人類智能對行為的指導;“醫方明”指的是人類智能的系統觀;“因明”指的是人類智能的因果推理能力;“內明”指的是人類智能的主觀能動性。今天的機器智能,恰恰缺乏的就是這“五明”!

       缺乏“聲明”:今天的機器智能與人交流的根本障礙。機器智能作為一個與人共存的智能體,和人的交流是一項根本的要求,這樣的交流不是指今天的Siri或“度秘”以及智能手機或智能音箱的這種簡單的人機對話,而是在學習層面上,人可以準確地告訴機器學習的目的、學習的環境、學習的要求,而機器也可以與人交流學習的過程、學習的結果和得到結果的緣由。也就是說機器學習目標的正確性、合理性是可以表達的,而學習結果和學習目標的一致性是可以論證的。只有這樣的人工智能才是可信的,才能形成構造于人類共生、共存的智能體的基礎。今天所進行的人工智能的可解釋性、可論證性的研究,正反映了人工智能在今天所面臨的巨大挑戰。目前的深度學習技術,說到底就是對一個由神經元網絡所構成的非線性函數在大數據上做擬合,這種學習行為使得它在應用的普適性上有很大的優勢,滿足了我們對讓機器“做得多”的要求,但是,它的結果的合理性、可靠性無法得以完備的驗證,因為我們無法完全理解機器學習結果生成的邏輯,無法完美解釋學習的認知行為。所以它的穩定性分析和可靠性驗證都是有待解決的難題。我們可以在許多應用中用到深度學習的技術,但我們無法對這樣的智能加以“對或錯”的評價。這個問題在“大模型”中尤為突出。從這個意義上來講,我們離圖靈對智能的期望還很遠,因為當我們向人和機器共處的黑屋提問,并無法區分得到的回答是從人還是機器來的時候,我們可以再加上一句:請告知你是如何得到這個問題的答案?人是能回答這個問題的,而今天的機器對此則往往茫然無措。

       缺乏“因明”:無法揭示和演繹因果關系。人類可以在自然界和社會中發現規律,并抽象出規律之間的邏輯聯系,這樣的歸納和演繹的能力是人類智能的一個重要的特征,也是人類文明發展的一個偉大結晶。作為一個人類社會中與人共存的智能體——人工智能,應當也必須具備這種對因果的發現和演繹能力。而今天在數據驅動的學習系統中,我們還只能發現事物之間的相關關系。這樣的相關性對于組成一個知識體系來理解世界是遠遠不夠的,在大數據發展之初,曾有“因果無用,相關萬能”的說法,現在看來,如果一個智能體僅僅具備了對相關性的理解,那么它對于這個世界的認識將遠遠低于一個一般的兒童,所以,如何讓智能體具有發現因果關系的“因明”,是人工智能今天的又一個大難題。

       事實表明,和所有過去的人工智能系統一樣,今天的深度學習系統,即使有了一些遷移學習、無樣本學習、知識圖譜、圖神經網絡等先進技術,可以在一定程度上實現知識查詢推理等功能,但在面對與訓練數據完全不同的新數據的時候,依然會表現出不可避免的脆弱性,也就是說,由于算法是從訓練數據中挖掘其特征間的統計關聯性,而這些關聯關系并沒有抓住數據背后的因果實質,算法無法得出關于這些數據內在關系的歸納。換句話說,這些算法沒有學習到我們真正需要的概念和概念間的映射關系,而是在走捷徑,僅在訓練集中完成學習任務,而往往無法學習到具有普遍意義的抽象概念,從而無法使它們能夠將所學到的知識應用到新的情況或任務中。這些系統很容易受到“對抗性擾動”的攻擊,即人們對系統的輸入進行特定的選擇,從而導致系統犯錯誤。

       缺乏“內明”:智能體沒有主觀能動性。人是有主觀能動性的,人的思想是人對于客觀世界的主觀認識,而人又是通過這樣的主觀認識來指導自己的行動,從而對客觀世界作出改變。著名認知神經學和理論物理學家弗雷斯頓曾提出過一個機器智能的認知學模型,在這個模型中,人的知識形成一個主觀的世界模型,而這樣的模型和觀察之間的一致性衡量決定了對世界的認識和對世界本身的改變,這個模型具有相當的普遍性。今天基于神經元網絡的機器學習系統中被視為金律的“反向傳播”,正是這種宏觀認知模型中對模型修正的一個簡單的實現方法,而模型和觀察一致性衡量恰恰又是機器學習中常用的“損失函數”提出的基礎,更進一步,今天的強化學習也是在模型和觀察上一致性的推動,在策略模型的驅動下,針對環境觀察作出相應行動,以求達到回報激勵機制下的一種有益的狀態。但從總體而言,今天的智能體依然沒有形成主觀意志的能力。這也是為什么今天人工智能雖然可以完成一些藝術創作,但是,這些創作也僅僅在于對人類已有的作品和形式的模仿、形變和疊加,尚無法在藝術美學和表達意義層面上進行真正的創作。

       人工智能研究中,有一個以機器人學家莫拉韋茨命名的悖論:機器對于那些人做起來非常困難的任務,往往可以駕輕就熟,而對于一些對人來說非常簡單的事情,卻無能為力。莫拉韋茨這樣解釋這一悖論:“人類經歷了上億年的進化,大腦中深深烙印著一些原始的生存技能,其中包含了高度進化的感官和運動機制,這些都是人類關于世界本質以及如何在其中生存的上億年的經驗。我相信,執行這種需要深思熟慮的思考過程是人類最外在的表現,而其背后深層次和有效的推動力,則是源于這種更古老和更強大的感知和運動能力的本能反應。而這種本能反應通常是無意識的。換句話說,因為我們祖先的強大進化,我們每個人都是感性理解、人情世故和運動領域的杰出運動員,我們實在是太優秀了,以至于我們在面對實際上十分困難的任務時還能駕輕就熟。”

       中國人工智能學者李德毅院士指出:新一代人工智能的硬核是交互學習和記憶。記憶的本質不是存儲,而是對知識的不斷凝煉而形成主觀意志(或稱為知識)。在貝葉斯理論框架中,這個主觀意志是認知的先驗,而觀察就是在這個先驗下,產生對認知的可信度的修正(后驗概率),如何在這樣的一個認知體系中,實現對主觀意志的組織、進化和有效作用?在今天的人工智能研究中,這還是一個處女地。

       缺乏“醫方明”:智能體需要系統觀。作為一個社會的原子,每個人生活在系統中,人對于系統的理解是深刻的,究其原因是在今天的社會中人類對于系統的認知和依賴是前所未有的,這樣的系統觀也深深地影響著人工智能的研究。以自動駕駛為例,研究的開始是以視覺的感知出發,把“認路”作為自動駕駛的重點,但隨著研究和發展,人們認識到,自動駕駛的發展瓶頸并不是認路,而是對“路況”以及“路權”這樣的交通系統的概念的理解。如人一樣,一個認路的人不是一個好司機的充分條件,一個好司機的關鍵是可以很好地適應交通系統,可以作出符合系統,而又有利于自己的目標的判斷,李德毅院士對這個方向的研究提出了發展“駕駛腦”的總結,一個駕駛腦的關鍵就是系統觀,前面有車,超不超車,這不僅僅是一個視覺的判斷,還是一個對所處環境下,對自己所處的狀態和未來的目標的一個整體判斷,今天的自動駕駛研究的關鍵就是系統觀下的智能行為的研究,人工智能的系統觀研究是一個大挑戰,也是一個大方向。

       缺乏“工巧明”:智能體行為研究的重要性。在人機二元社會中,智能機器的行為對世界的改變和對社會的影響,使得今天對人工智能倫理研究成為一個重要的課題,這個問題涉及面很廣,人機一起從事社會活動,機器行為必須合乎倫理是個起碼的要求。人們已經普遍認識到,我們對機器“做得多”的要求也許不難實現,但要機器“做得對”,則不那么簡單了。從“對抗攻擊”到“深度作假”,一次又一次地證明,今天的技術不僅不牢靠,而且很容易做壞事。從埃塞俄比亞航空302號班機的墜毀,到自動駕駛車的事故,人們開始認識到機器是有行為的,而機器的行為也不一定是有益的,很可能會帶來危害。于是,人們開始提出了人工智能倫理性、有益性的問題,開始關注機器行為的合理性和正確性,開始認真地詢問一些人工智能的基本問題:

       機器行為的目的是什么:機器是不是能按照人們意圖去改變世界?機器行為的原則是什么:機器如何不違背人類的倫理和規范?機器行為的結果的驗證:如何來衡量結果和目的的一致性?機器行為如何來解釋:如何來理解機器獲得結果的過程?

       這些問題是相互關聯的,構成了機器行為學的基本研究主題。對于機器行為的研究和前面所述的人工智能面臨的挑戰密切相關,譬如,我們如何向機器表達學習的目的,我們如何來驗證機器行為結果的正確性和我們期望的一致性,以及對機器行為過程的可解釋性,這些都是今天機器學習研究中最困難也是最基本的問題。

03 中國人工智能發展戰略

       中國人工智能發展的機遇是巨大的、難得的。改革開放四十多年來,中國科學技術和經濟實力的發展,為我們今天在人工智能這個新技術領域中奠定了前所未有的實力地位,全球化的市場的開放環境,又為我們的研究和全世界的發展努力融合在一起創造了條件。所以我們在人工智能上的研究和世界是同步的。由于國家強大的經濟實力和制度優勢,我們得以有可能集中資源來發展關鍵技術。而且中國發達的互聯網社會,以及作為第一人口大國而特有的天然的大數據,為人工智能的發展創造了獨有的生態環境,這些都是人工智能發展的獨特機遇。中國人民的創造力,促進了我國在人工智能應用領域的特殊優勢,中國在人工智能和互聯網應用的結合,超越了西方,走出了自己的發展道路。一些人工智能獨角獸公司成長起來,例如:由智能推薦技術發展而來的今日頭條,由圖像合成技術發展而來的抖音,由機器翻譯工業化發展而來的科大訊飛,由計算機視覺技術發展而來的商湯、曠視、依圖等。在這次抗疫中,人工智能在防疫體系的建立、在物流和資源優化中發揮了獨特的作用。中國人工智能發展的光明前景是可期的。

       今天人工智能面臨的挑戰,也為中國人工智能的發展帶來了難得的戰略機遇。筆者認為,中國人工智能發展戰略的關鍵就是直面挑戰,即大力發展人工智能的基礎理論,確立自己的學術自信和話語權,在人工智能賦能上下大功夫,實實在在地在有選擇的重點領域中,以人工智能技術作為推動力,實現革命性的產業創新。具體來說可以從以下幾個方面來考慮。

       要明確研究的方向和切合實際的目標。在人工智能的研究中,正確的科學思想決定了有效的研究方向和切合實際的目標。在方向上的錯誤,是過去人工智能屢經挫折的一個重要原因。今天我們在面向解決特定問題任務的“弱人工智能技術研究”中不斷的成功,也往往使得我們有了很多不切合實際的想法,認為弱人工智能技術的積累是走向發展類人的通用人工智能,即“強人工智能”的必由之路,弱人工智能的每一個技術進步都會使人工智能的通用性越來越強。但這樣的觀點并不一定是正確的。有人甚至調侃這樣的思維方式:“這就像是說第一只爬上樹的猴子正在朝著登陸月球前進一樣荒誕不經。”

       我們應該認識到,我們用于弱人工智能發展的研究技術和方法論,可能和探求強人工智能的科學理念、技術方法以及哲學思想是完全不同的。對于弱人工智能而言,為了解決一個具體領域的問題,如醫學影像的處理或股市風險分析,基于統計的數據驅動學習方法是適用的。把求解問題抽象為一個目標函數,把學習的過程組織成對目標函數的優化是一個有效的方法。但是如果我們認為,這樣的以統計學為基礎的數據驅動的學習方法,最終可以達到我們所追求的強人工智能,可能會是一個方向性的錯誤。今天我們對機器表達的行為目的的要求通常很簡單,往往就是一個效用函數,反映的是對機器學習結果的一些簡單的質量要求(如精確度、緊致度和穩定性等)。但是,如果我們要對于機器行為有很多的要求,要向機器描述如何做對的、有意義的工作,那么這樣的效用函數就會非常難定義。如果我們更深究一下這個問題的話,不禁要問:“對學習目的或行為目的的表達,一定是要通過效用函數嗎?”斯圖爾特·拉塞爾曾經很形象地提出了,如果我們用這種效用函數求優的方法,來讓一個有著強智能的智能體來解決問題時,可能會導致很多不可預測的后果:“如果一個超級智能的氣候控制系統想要解決全球變暖,降低二氧化碳,但是它發現其中最行之有效的方法是將二氧化碳的排放量降低到第二次工業革命前的水平。而達到這個目的的簡單路徑就是將人口減少到零,那它會怎樣做呢?”“如果我們把錯誤的目標輸入人工智能機器,而它比我們更聰明,那局面很可能就不可控了。”

       所以,我們在強人工智能的研究中,要充分認識到人類的智能是一個由復雜的、緊密相連的屬性所組成的復雜系統,其中包括情感、欲望、強烈的自我意識和自主意識、價值判斷,以及對世界的常識性理解。在沒有情感、沒有文化基礎,也沒有人類對于世界的常識體系的前提下的“純粹的理性”化的智能,是無法和人類共通共存的。我們在確定人工智能研究的發展道路和長期目標的時候,一定要對人工智能發展有一個正確客觀的科學思考,這樣才能避免許多由于盲目樂觀或技術跟風而造成的時間和資源上的巨大浪費。

       切實重視人工智能基礎理論的研究與創新,培養有創造力的人工智能人才。人工智能發展的根本驅動力在于基礎理論上的不斷創新和突破。今天的人工智能,特別是機器學習,主要是建立在數據驅動的基本思想上的,就是以在統計中的函數擬合的方法為基礎,把學習問題作為一個回歸問題,尋找一個和數據擬合得最好的函數作為模型。這樣的思想得益于我們今天豐富的大數據和強大的算力,可以擬合一個極為復雜的非線性函數,這就是深度學習得以成功的緣由。但正如前面所敘,這樣以復雜函數擬合為基礎的方向,有著根本的缺陷,它不能揭示事物間的因果關系,不能反映人類的以知識為基礎的學習準則、面向知識積累和在與世界的互動中不斷學習的思想。一些非數據驅動的機器學習機制如強化學習理論,已經在人工智能的實踐中體現出杰出的學習能力,所以,建立一個新的融知識、數據為一體并支持機器與環境互動的機器學習理論框架是非常重要的。

       其實這樣的學習框架可以基于認知學中機器學習和人類學習的相似性來闡述,在此我們用基于貝葉斯理論的“認知學”的原理來簡單介紹一下這個學習過程。

       我們可以從兩個層面來看人類學習:第一個層面是大腦,在大腦里面有我們對世界的認識,也就是所謂的認知,若將之應用在機器學習上,就是透過模型或知識來詮釋人類對世界的認識,而根據這些認知,對這個世界作出判斷(或稱之為預測)。第二個層面是人類通過五官來觀察這個世界,讓我們獲取更多的訊息、更多的資料。我們可以對觀察結果及判斷預測之間進行比較。如果兩者是一致的(預測沒有出現誤差),即表明模型(對世界的認知)是合理的,那么人類會給予對自己的認知更高的信任度,不會對它有進一步改變。但有趣的是,當觀察結果與判斷預測不一致的時候(預測出現誤差),有兩種選擇。第一種選擇是認為自己的認知可能是錯的,再根據觀察結果,來修正模型,換言之,這是一個模型構造的進化(學習)過程;還有一種選擇,是認為模型是正確的,觀察結果是錯的,也就是認為這個世界出現問題,那么就會根據自己對世界的認知來改變這個世界,也就產生了“行為”。因此,機器學習和機器行為之間形成了一個緊密的關系:構造一個跟觀察結果一致的認知,讓其盡量接近真實世界,而我們的行動就是改變世界,讓其與主觀產生的模型相趨一致。在這樣對學習的認知學框架中,知識(即認知)、數據(即觀察)以及認知主體(人和機器)和世界的互動(學習和行為)統一在一個知識的驗證和積累的過程中。

       這樣的認知模型強調了認知主體和認知客體交互中的學習過程,但是,對于我們未來的二元社會中人和機器這兩個認知主體的交互卻沒有闡述,人和機器的共通交流是未來人機二元社會的基本形態。而人和機器共通交流的一個重要基礎在于人和機器的相互理解,如前敘,目前,人和機器在學習的目的、方法、結論的解釋上的交流是非常薄弱的。我們對于機器給出的學習結果和由其導致的行為都無法作出清晰解釋,也就無法對其合理性作出判斷,這是機器學習研究中的一大挑戰,也是對機器學習理論的重大要求。

       人工智能理論的另一個重大的研究方向就是人工智能的倫理。我們已經充分認識到讓“機器做得對”,要比讓“機器做得多”要困難得多,這里有一系列很根本的理論問題。一個非常重要的問題就是“機器行為的倫理性是外在的還是內生的”,也就是說,我們是不是應該在機器產生智能的時候,就要求其把倫理作為一個基本的出發點,而不是在機器有了智能行為之后再來規范它。對于這一系列的理論問題的深入研究是我們未來是否能在人工智能發展中取得領先地位和科學話語權的一個關鍵。總而言之,我們對于人工智能基礎理論的研究,應給予高度的重視,我們必須創造一個生態環境,使得科學家能夠沉下心來,進行跨學科的深入的理論研究,并培養出具有扎實的理論素養、寬廣的知識面、豐富的科學想象力創造力的人工智能研究型人才。這樣的工作是艱苦的,也是激動人心的,中國科學家一定能以自己的想象力、文化底蘊和扎實的理論基礎及智慧,在人工智能理論的研究中作出創造性的貢獻。

       建立人工智能發展的生態環境。人工智能的發展需要一個生態環境,它包括:豐富的數據資源以及支持可持續發展的數據經濟體系,數據資源的合理開發、數據隱私的保護和其他理論性與技術性的支持,發展數據產品以及交易的工業經濟體系。有了這樣的數據經濟體系,我們就具備了人工智能產品發展的物質基礎。這樣的數據經濟體系的建立是很不容易的,實際上,早在十年前,我們就開始了建立數據交易市場的試驗,但這樣的試驗還是不成功的。一個很重要的原因就是我們把數據資源變成資產時,沒有解決它在經濟學上的根本問題,其中一種最重要的問題就是數據的消耗使用是沒有排他性的,因為復制數據的代價極低。這樣的非排他使用,使得數據可以被任意共享,因而無法定義其價值/價格,使它無法成為商品。近年來,區塊鏈技術快速發展,它可以溯源數據資源的產生和使用,同時不可對鏈上的資源進行復制,區塊鏈的這一特性為數據的資產化和資本化提供了基礎框架。我們對這一關鍵技術的開發,應該從建立數據經濟的基礎設施這一高度來理解。進而發展出具有中國特色的數據市場和數據經濟體系,這樣的數據經濟體系是基于大模型的人工智能產業體系的基礎。

       生態環境的另一個方向就是算力體系的建立。人工智能對計算能力的要求是很高的,這些年來云計算服務體系的發展,使得我國算力服務基礎設施在世界上占據領先地位,5G通訊技術上的領先,使得我國在邊緣計算上也有著突出的潛在優勢,移動端上的應用的廣泛普及使得我國有了一個先進的算力環境,這為我國人工智能發展奠定了一個很好的算力基礎,這樣的集匯化的大算力對于支持基于大模型的人工智能產業體系也是至關重要的。當然,我們要充分認識到,計算技術的發展是日新月異的,新的計算技術如類腦計算、量子計算正在孕育著新的計算革命。新的計算器件,如億阻器也在成熟,我們應當在這些新的領域中銳意創新,使我們在未來的算力競爭中保持領先地位,支持人工智能的快速發展。

       人工智能的生態環境發展離不開對于人機二元社會的新的社會形態、準則、相關的法律,以及道德倫理的研究和建設。目前,在歐盟,這方面的工作受到了空前的重視。2021年4月,歐盟頒布了其最新的AI監管草案,為人工智能的社會化使用立法,目的在于為實現可信賴的人工智能生態系統提供牢固的法律框架,歐盟競爭事務負責人直言:“通過制定標準,我們可以為符合倫理的人工智能技術鋪平道路,并確保歐盟在此過程中保持競爭力。”目前,由歐洲理事會,經合組織、北約、聯合國教科文組織和七國集團主導的全球人工智能伙伴關系,對于可信賴人工智能的框架方案有著重要的影響。我認為我國對這樣的人機二元社會的倫理體系設立的法律框架是我們人工智能發展的重要的軟實力,我們應當充分依據我國的國情和發展特點,有前瞻性地制定我國自己的可信賴人工智能的法律體系,以建立我們在這個至關重要的問題上的話語權。說到話語權,一個重要的方面就是建立標準,我們在這個方面談得不少,也越來越重視。但是,要在人工智能上真正做出有價值的標準,我們必須有很大的、長時間的戰略投入。譬如,如果我們有一批全世界都使用的、高質量的、較完整的訓練數據集,又可以給出一系列精心設計的測試人工智能功能的方法,并為全世界研究者共享,那么我們就在學習算法上有了定義標準的基本能力。標準需要被廣泛接受,而共享數據往往是獲得制定標準的話語權的有效途徑。

       人工智能賦能應用,建立完整的人工智能化產業體系。人工智能是各行各業所需的賦能技術,它的運用的廣泛性使其成為一個工業的先進性標志,我們常說的“智能化”就是衡量人工智能在這一產業中的應用程度,但是,在智能化各行各業的進程中,我們要把“科學性”和“實效性”放在第一位。以機器人工業發展為例,機器人在制造業、國防、醫療、金融等幾乎所有領域都有著非常廣泛的應用,在機器人的發展中,一條重要的技術路線就是讓機器人做人做不到、做不好的事,譬如,“達芬奇”系列的手術機器人為人類的外科手術的發展作出了革命性的貢獻,我國的大疆發展的“無人駕駛飛行物”也是機器人工業發展的一個成功范例。它們的成功都是把構造智能行為體系來完成一個對人類行為的挑戰作為出發點的,而不是玩一些人形機械的噱頭。在人工智能產業的發展中,我們要深刻認識到人工智能應用的普適性,只要我們面臨著數據驅動和知識驅動的決策行為的需要,人工智能就有其用武之地。在智慧城市、自動駕駛、制藥、金融、設計、醫療等眾多領域,人工智能系統都能成為數據驅動和知識驅動的決策者。從這個意義上來說,應利用好我國在數據和算力上的優勢,建設好我國基于大模型的“智能能源”和人工智能產業鏈,從而形成一個完整的人工智能賦能環境。

04 結語

       人工智能的發展,源于人類對于自身的認知能力、智慧和創造力的崇拜和追求。它對人類文明進步的推動具有根本性的意義。對于人類發展的重要性、科學上的挑戰性、技術上的復雜性,使得人工智能未來的道路一定是艱苦漫長同時又激動人心的。對此我們應當充滿信心,同時又要踏踏實實,堅持科學的精神和態度。我們中國人有智慧、有能力,也有信心,在人工智能的發展中,為人類作出自己的貢獻。

原文來源:《學術前沿》雜志2021年12月上 
作者:香港浸會大學副校長 郭毅可