作者:曾鳴,阿里巴巴集團學術委員會主席、湖畔創(chuàng)業(yè)研學中心教育長。
這張圖可能大家都比較熟悉,這就是人工智能在過去20年的一個大發(fā)展。最早在搜索階段叫大數(shù)據(jù),那時候還沒有AI提法。大家知道,去年底到今年ChatGPT火了后,中國關于大模型的創(chuàng)業(yè)團隊就有100多家,叫“百模大戰(zhàn)”。實際上,第二階段的人臉識別,是深度學習第一次在視覺領域得到大規(guī)模應用,2014年就有上百家的視覺公司在創(chuàng)建。人臉識別,今天大家已經(jīng)覺得無處不在的一個應用,比如,大家刷抖音背后的推薦引擎,也是基于AI技術。實際上,是這一輪AI用深度學習的方法第一次大規(guī)模應用。大語言模型呢?這個叫Large Language Model。為什么說是通用AI的一場革命?它實際上是一個非常簡單的算法,就是去預測一個字后面,最有可能出現(xiàn)的下一個字是什么。
就這么一個簡單的算法,但是它達到了預測的準確度足夠高,足夠有用。在這個意義上,它看起來掌握了語言。大家知道在《人類簡史》這本書上也提到,語言是人類最偉大的發(fā)明。語言讓我們可以溝通,語言的背后天然就蘊含著人類的智慧,而且人類海量的知識,1萬年左右的知識,基本上都被最近二十年的IT通過文字、音頻、視頻給沉淀下來了。所以,你掌握了文字,掌握了語言,基本上就破解了人類到今天為止所有的知識。我們今天還不太理解,大語言模型背后的運行機制到底是什么。它也許不像人一樣在思考,但是在局部領域里,它表現(xiàn)出了像人一樣的邏輯推理能力。這個對于我們未來就會產(chǎn)生非常根本性的影響。
過去三十年的發(fā)展,從互聯(lián)網(wǎng)到無線互聯(lián)網(wǎng),到傳感器,數(shù)字化轉(zhuǎn)型,大數(shù)據(jù)計算等等。這些逐步增強了軟件世界的能力邊界,但是它本質(zhì)上是在做加法,是疊加。但是AGI、通用人工智能把這些串在一起,提高了所有軟件的適配能力和自主能力,開始從量變到質(zhì)變,發(fā)生了一個新的飛躍。比如說AGI能夠自動編程,這樣一下子讓軟件的能力有一個急劇的提升,這是一個質(zhì)的變化。
在這個意義上,大家一般都認為,大語言模型是 AI時代第一個類iphone時刻,也是一個大變革的時代。從另外角度來看,通用智能的時代也可以說成是機器人的時代,因為AI是大腦,它和各種硬件的結合就是各種機器人。比如說自動駕駛,自動駕駛的車,就是一個機器人,特別是未來的Robotax公司,本質(zhì)上就是一個技術外包服務公司。從這個角度來理解,就會對技術,對商業(yè),到底產(chǎn)生什么樣的影響,有個更本質(zhì)的體會。大家一講到機器人,都會想到波士頓Danymics各種各樣很炫的機器人,但是波士頓Dynamiac發(fā)展了30年左右,很可能還不如特斯拉的人形機器人這兩年所取得的速度和進展更快。這也是AI技術帶來的在硬件方面的突破,我們可以看到機器人,在整個環(huán)境下,也會有飛速的發(fā)展。除了大家講的ChatGPT之外,我還想強調(diào)一下,另外兩條AI、AGI的發(fā)展主線也非常重要。一個就是自動駕駛,自動駕駛的要求和ChatGPT不太一樣,它要確保安全性,而且它本質(zhì)上解決的是人和物理世界的互動。
ChatGPT更多的是人大腦的行為。
但是自動駕駛要解決人和物理世界的互動,所以為什么自動駕駛的特斯拉公司,可以在機器人方面有那么多的積累,因為它本質(zhì)上是要去感知外部世界。另外一個非常重要的領域是AI for Sicence(科學智能),而且它更根本,至今為止AGI只能應用人類現(xiàn)有的知識,并不能創(chuàng)造新的知識。但是AI for Sicence(科學智能)把AI用來做科學的發(fā)展。它很有可能創(chuàng)造完全不一樣的格局,因為它可能會發(fā)現(xiàn),甚至是新的化學方程式或者是新的物理定律,整個人工智能又會往前邁一大步。但即使是今天,像Deepmind下面的Alpha-Fold對蛋白質(zhì)的解析,合成生物學,其實過去幾年非常新生的領域,也是AI驅(qū)動的。所以,有很多領域已經(jīng)取得了很大的進展,只是不那么廣為人知,但是這方面的積累,也會帶來下一步的突破。剛才是一些背景知識,大家可能在不同的場合也聽過,接下來的兩頁PPT是今天最重要的兩頁PPT之一。如今,我們從互聯(lián)網(wǎng)時代來到智能時代,互聯(lián)網(wǎng)跟AI到底有什么本質(zhì)區(qū)別?互聯(lián)網(wǎng)本質(zhì)上處理的是海量數(shù)據(jù),它解決的是信息流轉(zhuǎn)和匹配的效率,讓信息盡可能地流通匹配,不要有信息不對稱而帶來各種各樣的摩擦。
核心價值在于:解決信息不對稱的問題。
舉個簡單的例子。在線教育過去所有的努力,都是想利用互聯(lián)網(wǎng)提高老師的教學效率,這是一個非常典型的互聯(lián)網(wǎng)案例,也取得了很大的進展。但是AI時代的在線教育,是通過無限制的高質(zhì)量老師供給,滿足個性化的學習需要。原則上每學生都應該配一個自己的老師,而這只有AI老師才有滿足。同樣的道理,全世界現(xiàn)在最大的問題之一,都是醫(yī)療成本太高,醫(yī)生服務不夠。如果有AI醫(yī)生出現(xiàn),整個人類的健康狀況,會有一個質(zhì)的飛躍。
所以,AI本質(zhì)上是解決供給不足的問題。過去五年,大家做數(shù)字化轉(zhuǎn)型、做產(chǎn)業(yè)互聯(lián)網(wǎng)、做線上化,為什么做的那么辛苦?本質(zhì)原因就是:這些行業(yè)不是信息不對稱的問題,是供給不足的問題。比如說,大家所有做互聯(lián)網(wǎng)醫(yī)療以及醫(yī)療服務轉(zhuǎn)型。你解決所有的問題價值都非常有限,因為你解決不了最核心的問題,看病治療那個瓶頸總是在那的,就那么些好醫(yī)生,你怎么去做信息匹配都沒用。所以這個是AI時代,帶來一個全新的機會,是我們真正去創(chuàng)造新的供給,海量的供給會創(chuàng)造新的需求。但AI時代,AI最本質(zhì)的問題是處理海量知識,不再是數(shù)據(jù),也不僅僅是信息,是通過對數(shù)據(jù)和信息的加工產(chǎn)生的知識,這個知識跟原有知識的結合去解決實際問題,所以他解決的是決策的效率與成本,也就是機器能否取代人。到目前為止所有的決策都是人在做決策,機器如果能取代人做決策就是一個智能飛躍,其核心價值是創(chuàng)造新供給。 所以,AI時代最核心的能力是根據(jù)決策場景建立決策模型的能力,“場景”一詞,非常重要,因為我們所有的決策都是基于一個特定場景的。人很多時候的決策是下意識,甚至是潛意識的,你怎么將它顯性化變成一個機器用它的邏輯去實現(xiàn)的決策,這是一個根本性的挑戰(zhàn)。
所有的難度在這前面,特別對于AI應用企業(yè)來說,對于大模型的一些前沿公司來說,算法是一個很大的瓶頸,但對于AI應用來說最核心的就是建模能力,理解真實場景下的決策,這個難也是因為AGI的決策方法與人的決策方法不一樣,所以你需要一個翻譯。這個模型有意思的地方,只要你建立了這個模型,形成一個閉環(huán),它自己就能夠不斷地迭代、優(yōu)化與生長,所以是一個“活”的AI系統(tǒng)。在這個意義上,過去所有的發(fā)展都可以說是一個機器時代,再復雜的機械系統(tǒng)都是簡單的系統(tǒng),他們只能做確定性的執(zhí)行,但再簡單的認知系統(tǒng)都是復雜系統(tǒng),所以AGI現(xiàn)在的在發(fā)展,處于一種類似生物的可有機生長的一套系統(tǒng),這也會是一個根本性的發(fā)展。我們怎么去擁抱自己帶有某種能力,某種傾向,又有自我學習,自我成長的能力。
這是AGI的本質(zhì),跟互聯(lián)網(wǎng)時代不一樣?;ヂ?lián)網(wǎng)時代還是在解決相對確定性的信息匹配的問題,但是AI時代是打造認知系統(tǒng)的問題。這是今天第一個需要跟大家分享的觀點??偨Y一下,在2017年公開課的基礎上,再做一個提升,時代驅(qū)動力是智能化,我把“智能化”提到更高高度,成為這個時代的主導?;ヂ?lián)網(wǎng)時代其實是在線化,軟件化跟網(wǎng)絡化,在線化跟軟件化的結合過去20年最火的SaaS,網(wǎng)絡化就是從pc互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng)到IOT物聯(lián)網(wǎng)的一系列的發(fā)展。它本質(zhì)是連接,完成網(wǎng)絡協(xié)同的基礎設施。每一個新時代,都建立在上一個時代的基礎之上,所以在互聯(lián)網(wǎng)時代繼續(xù)發(fā)展,基礎設施會變得越來越好的基礎之上,我們可以看到,智能時代新的驅(qū)動力。一方面是智能化。這是我們剛才整個講演都在講智能化的發(fā)展,特別是通用人工智能,會越來越強大。我們不知道它最終會強大到什么樣,我們只知道它會越來越強大。另一方面支撐智能時代的發(fā)展還有兩個平臺性的基礎技術做支柱:一是人機交互能力的不斷的提升,這是我們馬上就要展開講的XR話題。
二就是區(qū)塊鏈和Crypto,帶來我們?nèi)W(wǎng)協(xié)同的能力的提升。
1.XR:人機交互AR、VR到XR,整體就是人機交互的一個發(fā)展過程。從pc時代開始,今天最牛逼的幾家公司之一微軟,蘋果。核心發(fā)明就一個GUI圖形交互,然后產(chǎn)生了今天所有的互聯(lián)網(wǎng)革命。個人電腦到鼠標到鍵盤,本質(zhì)上是鍵盤輸入,到微軟的全套的軟件系統(tǒng)。然后到了移動互聯(lián)網(wǎng)時代,主要是觸摸屏的輸入,也包括部分的語音輸入。第三條路就是過去十年開始發(fā)展的。
① 虛擬現(xiàn)實
2012年Oculus成立,2014年被Meta買了,虛擬眼鏡VR;2014年GoogleGlass也出現(xiàn)了,2015年推出了一批產(chǎn)品;2016年,來到了虛擬現(xiàn)實的元年。那一年,發(fā)布了第一代Oculus Rift。索尼推出了VR眼鏡。微軟發(fā)布了Holowlens。還有一款叫PokemonGo的游戲。當時,第一個基于虛擬現(xiàn)實的火熱游戲,很快就沉寂了。高科技發(fā)展軌跡,中間都有階段性的懸崖。2018年的Magic Leap是當時特別有希望的一家創(chuàng)業(yè)公司,得到了谷歌,阿里巴巴很多公司的支持。2018年我去看Magic Leap,當時快要投產(chǎn)的下一代產(chǎn)品。我看完以后,當時特別的震撼,不是真假的問題,是將來分不清真假的問題。它是完全可以迷惑你的眼睛,因為都是真實的光源,所以眼睛是沒有辦法判斷,我看到的到底是真是假,它看到的就是成形的圖像,然后給大腦輸送信號。第二個是,當時Magic Leap的Founder(創(chuàng)始人),就講我們做的不是眼鏡,我們做的是未來的人機交互。大家想想看,你只要眼睛動一動,看一看電腦就能執(zhí)行你的命令,那不是快多了嗎?也容易多了。
很可惜,最后的技術難關沒有過去。所以Magic Leap后面轉(zhuǎn)型做了ToB的公司,沒有做成消費品的爆炸性的成長。今年有兩個重磅的發(fā)布,一個就是Apple的VisionPro,這是Apple第一次正式在這個領域發(fā)布產(chǎn)品,定義了很多新的標準,也給大家?guī)砗芏嗟钠诖?。第二個就是,上個禮拜Meta發(fā)布的Quest3,正好打的是中低端,蘋果做的是高端,兩家選的技術路線都基本一致,這就說明了行業(yè)標準再開始慢慢的浮現(xiàn),然后又有高端又有低端。附帶說一句,Meta還推出了個AiGlass,也是為了人機交互的發(fā)展,它雖然不是一個虛擬眼鏡的產(chǎn)品,但大家可以看到視覺交互又一次成為行業(yè)的焦點。
② 人機交互
回到講硬件,它的核心目的是什么?硬件的核心目的是完成人機交互的新的機緣,最早的PC計算是通過鍵盤來交互的。移動計算的手機是通過觸摸屏,到了所謂的空間計算的時代,空間計算核心強調(diào)視覺跟感知。每個人的定義不一樣,我們不用去計較細節(jié)。我想總結一下,XR這個領域為什么對在座的每一位都很關鍵,它的技術背后的本質(zhì)是什么?這也是一次人機交互的質(zhì)的飛躍。以前我們跟機器,機器包括后面的AI,我們以前跟機器交互都需要主動的去操作機器,都是要我們?nèi)ポ斎?。但是未來是機器主動的響應人,我們可能什么都不用做,它自然的感受到了,如果我們進化到腦機結合的時候,甚至它潛意識就知道我們想什么,它可能就去執(zhí)行了。
所以未來是機器感知人,它來主動行動的一個交互界面,所以這個是完全不一樣的時代。我們會看到,會有越來越多的各種各樣的機器,將會把人體感官跟數(shù)字世界直接連接。我們現(xiàn)在是AR、VR眼鏡,可以穿戴的設備,包括衣服、類似皮膚。距離是從遠到近,貼近皮膚,再進入皮膚。植入芯片之類的肯定早晚都會發(fā)生。這些是十幾二十年非常大的一個發(fā)展趨勢。這個趨勢的商業(yè)意義是什么?是從XR、VR眼鏡開始,我們開始了人類自身感知和注意力的數(shù)字化,人自身不再獨立于數(shù)字世界之外。
③ 元宇宙為什么說元宇宙,大家曾經(jīng)那么向往,就是因為那是一個純粹的數(shù)字世界,不受物理規(guī)律的限制,而且在元宇宙里頭能夠?qū)崿F(xiàn)極致的個性化,還有你非常豐富的生物特征,還有非常豐富的場景,可以有無窮無盡的服務。所以那時候元宇宙為什么讓大家那么興奮,也是一個讓人很期待的未來。但是XR,類似的設備,除了硬件設備之外,它同樣需要軟件和算力的提升,所以跟這匹配的是邊緣計算,包括算法的微型化。所以,將來每一個邊緣設備,它的感知,計算,思考,決策能力也會有一個質(zhì)的飛躍。所以這個技術和AI技術,也是相輔相成的,它實際上是提供了一個無限廣闊的場景,讓AI可以得到更廣泛的應用。但它反過來又會促進AI技術的進步,因為沒有AI技術的進步,它支撐不了更深一步,更復雜,更實時的技術要求,所以這兩個是完全相輔相成的技術。
2. AIGC:生產(chǎn)力的大突破
① 我們將迎來創(chuàng)作者經(jīng)濟
我認為最有價值的突破,是通過AGI(通用智能)創(chuàng)造海量的新的數(shù)字資產(chǎn)。AGI第一個突破的領域就是AIGC,就是深層次AI,也就是創(chuàng)造海量的內(nèi)容。明年的某個時刻,肯定會有非常好用的文字、語音轉(zhuǎn)視頻的工具出來?;旧蠌奈淖值秸Z音到圖片到視頻,創(chuàng)作的門檻會急劇的下降,創(chuàng)造新的數(shù)字資產(chǎn)的空間會急劇的上升。而且就像我們講虛擬世界一樣的,未來的這些數(shù)字資產(chǎn),它會越來越走向主流,它的重要性會越來越大,這些資產(chǎn)有價值,大家就會重視,大家就會對它的流轉(zhuǎn)交易,非常上心。所以在那個基礎之上,新的數(shù)字資產(chǎn),天然會去用新的價值網(wǎng)絡的技術平臺。同時,我剛才講到以太坊核心是智能合約,但未來機器跟機器之間的合作,它們的互動方式跟人是完全不一樣的。它們需要有更多,更自動,更高效,更智能的合約直接完成。所以在這個領域里,區(qū)塊鏈、Crypto有很大的發(fā)展空間,也是在這個意義上,我也把它當作AGI整個智能時代重要的組成部分。
無論是從剛才講的Crypto的領域,對創(chuàng)造經(jīng)濟的呼吁。還是看AGI帶來的價值,我覺得未來,我們將迎來一個創(chuàng)造者經(jīng)濟的時代。一方面,這個趨勢看得非常清楚,AGI會逐步取代結構化的人類知識,并且變得越來越智能。另一方面,人借助機器智能的力量,有機會變得越來越有創(chuàng)造力。就像工業(yè)革命的早期,大家都非常恐懼,人不再能夠以體力來獲取價值了。但是過去的100年,出現(xiàn)了白領階層,出現(xiàn)了知識工人,出現(xiàn)了軟件工程師,他們靠自己的腦力活動,創(chuàng)造了過去100多年、200年的繁榮。我能看到的相對美好的場景,由于機器或者人工智能把人從繁瑣的、重復性的、無聊的腦力勞動里解放出來,人可以把大部分時間,用在開發(fā)自己的創(chuàng)造力上,去做自己真正有激情的,也能夠做得更好的事情。這個可能是兩個基本的動力。在這個基礎之上,對人跟人、人跟機器、機器跟機器之間的協(xié)同都提出了更高的要求。互聯(lián)網(wǎng)時代,機器跟機器之間協(xié)同是靠API,就是應用之間要有一個約定的規(guī)范來互助,但是由于AGI的發(fā)展,未來所有的服務之間,是用自然語言來交互。也就是說,機器會學得像人一樣,直接來對話,機器跟機器之間就完成了協(xié)作,自然語言反而變成了人跟人、人跟機器、機器跟機器之間的溝通語言,對于智能合約就提出了更高的要求。
如果我們從一個更宏觀的角度來看,剛才講的這些內(nèi)容,德魯克可能是20世紀最偉大的商業(yè)思想家,他把工業(yè)革命劃分成了三個歷史階段:
第一個階段是生產(chǎn)力的革命,本質(zhì)上是工廠取代了手工作坊,因為過去的手工作坊知識,都只能靠師傅帶徒弟,人傳人。但是有了工廠以后,就開始有了科學化管理。
第二個階段,是100年前開始的管理革命,也就是說開始有了企業(yè)的概念。以前只有單個工廠,核心就是生產(chǎn)和銷售,但是我們從管理開始,有了矩陣式管理、職能化管理、人力資源部門、戰(zhàn)略規(guī)劃部等等。一百多年前成立的商學院,目的就是為管理革命輸送批量化的高質(zhì)量的管理人員。所以,MBA出來都是標準化的語言,這是管理革命。
第三個階段,隨著IT的發(fā)展,從六七十年代開始進入了軟件革命,也就是IT革命的時代,軟件工程師創(chuàng)造最大的價值。順著剛才講的AGI對人類結構化知識的替代,人必須走向創(chuàng)造力的發(fā)展。所以,我把未來的第四個發(fā)展階段,新的發(fā)展階段,叫做創(chuàng)造力革命的階段,人未來的價值就體現(xiàn)在創(chuàng)造力上。我們將要迎來的是一個新的經(jīng)濟范式。智能時代的經(jīng)濟核心,我們把它叫做智能經(jīng)濟,從另外一個角度來理解,剛才講的創(chuàng)造者經(jīng)濟。三個核心的支撐,就是我們剛才討論的通用人工智能、Crypto、AR&VR。當然,這三個發(fā)展階段不一樣,目前是AGI發(fā)展勢頭最猛,Crypto處于相對低谷正在醞釀的階段,AR&VR可能還要三五年才會產(chǎn)生大規(guī)模銷售的應用級產(chǎn)品。但是這幾個的趨勢是非常清楚的。
② 人類文明的演進
我們?nèi)绻麖闹悄芙?jīng)濟再跳出來,從一個更廣大的角度來看人類文明的演進。實際上,人類的發(fā)展核心依賴于兩個,一個是人類網(wǎng)絡的發(fā)展,就是我們講到的語言、文字、文化、制度等等,都是所謂的軟的制度性的東西。還有一個是工具網(wǎng)絡,從最早的火,到工具的使用,到農(nóng)業(yè)化到物理的網(wǎng)絡,到今天的物流網(wǎng)、通訊網(wǎng)、計算網(wǎng),這都是物理的工具網(wǎng)絡的發(fā)展,工具的網(wǎng)絡促進了社會進步,促進了人類的發(fā)展,然后人類又發(fā)明出了更多的網(wǎng)絡,發(fā)明了更多的工具,促進新一代的技術發(fā)展。所以,技術進步跟社會進步就通過這兩個網(wǎng)絡,產(chǎn)生了一個質(zhì)的飛躍,一輪一輪的發(fā)展。從生物學的角度來說,人類單個大腦的容量提升很小。所謂,未來的進步就兩個:第一個,對大腦開發(fā),一步步的開展,就我們大腦開發(fā)比例還很低的。所以為什么創(chuàng)造力革命有可能?
我們有可能開發(fā)出很多我們想象不到的能力。第二個,目前看起來更重要的是群體智慧的涌現(xiàn),也就是通過社會協(xié)同創(chuàng)造更大的價值。技術變革推動的工具網(wǎng)絡的進步,是人類文明發(fā)展的主線?;谶@個,我們可以做一個判斷,我們今天討論是處于一個什么樣的狀態(tài),從火的發(fā)現(xiàn)和應用,到工具的使用和發(fā)明,到農(nóng)業(yè)經(jīng)濟才1萬年左右,再到工業(yè)革命。第一次工業(yè)革命是機械動力,第二次工業(yè)革命是電力,雖然有人把信息革命叫做第三次工業(yè)革命跟第四次工業(yè)革命。但是我覺得從概念的角度來說,把信息革命獨立出來可能更清楚。
所以,我們有了第一次信息革命,就是電腦的發(fā)明。然后第二次信息革命,大概從70年代末到80年代初。開始有個人電腦,互聯(lián)網(wǎng)的發(fā)明,到最后通訊網(wǎng)絡跟計算網(wǎng)絡的融合,形成了互聯(lián)網(wǎng)過去20年的大爆炸。我們過去的五年跟未來的五年,就是一個過渡期,從互聯(lián)網(wǎng)時代走向智能時代,我個人傾向于把它叫做互聯(lián)網(wǎng)3.0。從互聯(lián)網(wǎng)1.0的PC到2.0的移動,到3.0的未來。為了在概念上更清晰,我們可以把未來10年,甚至接下去20、30年,定義為智能時代的開端。
智能時代1.0,這就是我們今天所處的時代的機會,也是時代的挑戰(zhàn)。我們今天不論什么位置,所有人只有一個共同的挑戰(zhàn):成為智能時代的原生物種,你才有機會發(fā)展,甚至才有機會生存下去。
編輯:黃飛
-
機器人
+關注
關注
211文章
28337瀏覽量
206858 -
人工智能
+關注
關注
1791文章
47090瀏覽量
238069 -
自動駕駛
+關注
關注
784文章
13760瀏覽量
166325 -
區(qū)塊鏈
+關注
關注
111文章
15562瀏覽量
105905 -
ChatGPT
+關注
關注
29文章
1556瀏覽量
7576
原文標題:曾鳴談:智能時代的三大核心技術
文章出處:【微信號:軟件質(zhì)量報道,微信公眾號:軟件質(zhì)量報道】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論