通用人工智能的時(shí)代已經(jīng)來(lái)臨
來(lái)源:澎湃新聞 編輯:QQ123 2021-04-22 12:59:22 加入收藏 咨詢(xún)

所在單位: | * |
姓名: | * |
手機: | * |
職位: | |
郵箱: | * |
其他聯(lián)系方式: | |
咨詢(xún)內容: | |
驗證碼: |
|
能記憶和推理不同情境信息的個(gè)人AI助手總似“呼之欲出”,但直至鼠年年末,這樣的AI助手竟仍未實(shí)現。同樣,機器學(xué)習盡管進(jìn)展斐然,可一旦離開(kāi)“人工”協(xié)助,自主系統依舊難言“智能”——無(wú)法在不同學(xué)習中貫通數據并整合模型,以實(shí)現經(jīng)驗的跨領(lǐng)域遷移。
若將AI的目標設定為優(yōu)化函數來(lái)解決領(lǐng)域問(wèn)題,那么我們一直在與日俱進(jìn)。很多曾被視作難如登天的特定問(wèn)題,用最優(yōu)化——尤其是深度神經(jīng)元網(wǎng)絡(luò )(DL)的反向傳播來(lái)解決,已被證實(shí)立見(jiàn)成效,且遠超人力之際。計算機視覺(jué)、機器翻譯、語(yǔ)音識別、棋藝博弈、電子競技等諸多領(lǐng)域煥然如新——人工智能正迅速被全面“馴化”。
正所謂“莫為風(fēng)波羨平地,人間處處是危機”,此類(lèi)“馴化”的共同缺陷是:學(xué)習僅發(fā)生在模型部署之前??墒聦?shí)上,實(shí)時(shí)學(xué)習才是動(dòng)物獲得生存優(yōu)勢的智能展現。相較而言,支撐機器學(xué)習的脊檁則是狹隘的學(xué)習理念。更深入地看,所有的離線(xiàn)優(yōu)化(Offline Optimization)問(wèn)題,本質(zhì)上都是基于進(jìn)化而非個(gè)體智慧。例如,假定被植入某種遺傳密碼,轉基因螢火蟲(chóng)就能準確探測特定獵物并成功捕食。這種情況下,螢火蟲(chóng)無(wú)需實(shí)時(shí)學(xué)習便可擁有相應技能。類(lèi)似地,只要預裝導航、定位、目標檢測(Object Detection)等預置功能的模塊或經(jīng)離線(xiàn)優(yōu)化設定參數,自動(dòng)駕駛汽車(chē)就應該能夠即開(kāi)即走。
時(shí)至今日,如何從離線(xiàn)優(yōu)化轉向快速可靠的實(shí)時(shí)學(xué)習,主流人工智能仍未給出令人信服的回答。但這既是對智能本質(zhì)之叩問(wèn),也是人工智能的初心所向。與荒野生存的動(dòng)物一樣,通用人工智能(Artificial general intelligence,AGI)能夠在運行時(shí)應對無(wú)法預見(jiàn)的情況??焖俸涂煽康倪m應力不僅能夠推動(dòng)新一代機器人及個(gè)人助手的實(shí)踐發(fā)展,也理應被視為智能理論的那塊“核心拼圖”。
對“智能”一詞的理解萬(wàn)別千差、百口不一,王培為此專(zhuān)門(mén)撰寫(xiě)《人工智能定義專(zhuān)論》一文,并刊發(fā)于《通用人工智能》(JGAI,2019年第10卷)。這篇文章被認為是解決人工智能領(lǐng)域核心歷史遺留爭議最給力的嘗試之一,受邀的同行評議專(zhuān)家多達110位,且廣泛來(lái)自多所著(zhù)名大學(xué)以及DeepMind、Google Brain等知名業(yè)界公司。文章標靶為智能的“非主流”定義,即“智能是知識和資源不足情況下,主體對環(huán)境的適應能力”。盡管該定義在另一項對567名人工智能專(zhuān)家的調研中高票獲選,但對資源限制和實(shí)時(shí)適應必要性的質(zhì)疑之聲也同樣存在。有些質(zhì)疑源自人工系統與生物系統的差異,認為后者總是在知識和資源不足的條件下通過(guò)演化進(jìn)行適應,但部署后的AI系統則無(wú)需再配備這種能力。
對智能本質(zhì)的不少誤解都為忽視實(shí)時(shí)學(xué)習所致。比如,遺傳算法(GA)有時(shí)被當做強化學(xué)習(RL)的“替身”。誠然,根據前文所述,遺傳算法之于強化學(xué)習,正如進(jìn)化之于智能。但只有當學(xué)習發(fā)生在海量的代際實(shí)例模擬中,上述類(lèi)比方才成立。而這對自主機器人或動(dòng)物毫不適用,因為二者都能在單次生命周期內以最快速度適應未知環(huán)境。很顯然,只要致命事件發(fā)生一次,個(gè)體學(xué)習也就戛然而止。這也正是高度模擬領(lǐng)域取得了巨大成功卻難以“變現”的主要原因。于是,與實(shí)時(shí)的適應性系統相比,離線(xiàn)優(yōu)化這位“同學(xué)”著(zhù)實(shí)有些志大才疏。
機器學(xué)習視角下,存在三項重要挑戰:
一是,智能主體若想適應動(dòng)態(tài)(非穩態(tài))環(huán)境,“好用”的決策理論便不可或缺。對動(dòng)物而言,這是通過(guò)進(jìn)化實(shí)現的。但對機器而言,單獨個(gè)體的一生中卻無(wú)法學(xué)到。因此,盡管離不開(kāi)先天預設,但其行為表現則是先天和后天的相互結合。
強化學(xué)習就是一個(gè)非常成功的決策理論。雖在非穩態(tài)環(huán)境中難堪大用(主體的適應性需求與學(xué)習速率衰減是一對矛盾),不過(guò)至少能夠用于實(shí)時(shí)學(xué)習。強化學(xué)習有一些主要概念的限制,基于行為主義的強化學(xué)習最為常見(jiàn)。通過(guò)對具有最高預期回報的“狀態(tài)—行為”之間的響應映射(策略)進(jìn)行學(xué)習,且無(wú)須對所在情境的其他因果關(guān)系進(jìn)行建模,令此類(lèi)主體具有獎勵中心主義的世界觀(guān)。這意味著(zhù),一旦效用函數發(fā)生變化,主體就必須重新習得一個(gè)新策略,既有知識也無(wú)法借助先天設計而遷移到新任務(wù)中。對于存在單一明確取勝標準的電腦游戲來(lái)說(shuō)(如:賽車(chē)游戲中的圈速、象棋中的將軍等),效用函數的變化不是問(wèn)題。但對于生物系統而言,這卻是日常的現實(shí)考量。
動(dòng)物在餓與渴的時(shí)候行為完全不同,前者會(huì )尋找獵物或美味的枝葉,后者會(huì )尋覓水源。也就是說(shuō),個(gè)體行為不僅取決于外部因素,也取決于內部需求。當出現特定需求時(shí),個(gè)體尋求“因果知識”,這一知識會(huì )自動(dòng)遷移到解決下一次其他需求。如此,便能對不斷變化的需求予以及時(shí)響應。但是,個(gè)體并不總能預先知道該如何滿(mǎn)足特定需求。要解決這一問(wèn)題,可將具體信念與動(dòng)機系統解耦,令主體在不同的環(huán)境中學(xué)習到行為的不同結果,建立不同的因果模型。這是那些抱持AI初衷的AGI研究者所追求之路,但在專(zhuān)用人工智能(Special-purpose AI,SAI)領(lǐng)域中卻常常無(wú)人問(wèn)津。
二是測量。毋庸置疑,不測量便無(wú)從知曉是否有進(jìn)步,但測量的對象也很重要。我們在每個(gè)領(lǐng)域下測試主體表現,如果允許對不同領(lǐng)域設定不同的超參數(譯者注:在機器學(xué)習中,模型“自學(xué)”得到的是參數,無(wú)法“自學(xué)”必須由“上帝”賦予的是超參數。深度學(xué)習“煉丹師”的一項重要操作就是對超參數的調校),得到的將是不同主體的“專(zhuān)項成績(jì)”。雖在應用層面上十分有用,卻對了解個(gè)體的一般性頓口無(wú)言。另一方面,如果因領(lǐng)域各異而設定不同超參數不被允許,那么得到的則是主體“各科考試”的“總成績(jì)”。
目前,最好的通用系統仍無(wú)法與專(zhuān)用系統(其超參數針可對特定目標領(lǐng)域進(jìn)行調整)相媲美,但最好的專(zhuān)用系統其通用性得分卻不會(huì )很高。類(lèi)似情形在自然界比比皆是(如圖1所示),盡管在特定靜態(tài)環(huán)境,特定的專(zhuān)用方案往往是首選,但通用性卻能使適應特殊環(huán)境條件變得更為容易。
從上述討論中可以窺見(jiàn):
衡量AGI成功與否需要改變已有的評估方式。AGI亦非AI超集,特定領(lǐng)域內大發(fā)神威的專(zhuān)用化最優(yōu)方案,很可能在其他領(lǐng)域百無(wú)一用。在通向AGI的道路上,盡管并非總是,但一般情況下確與專(zhuān)用能力交集寥寥。
寫(xiě)作此文正是想向讀者指出通用性AI發(fā)展面臨的許多挑戰和誤解。短期應用成果應與長(cháng)遠藍圖相得益彰。我們需要淵思寂慮,精進(jìn)系統研發(fā),從而理解主體感知,并使之實(shí)時(shí)適應不斷變化的環(huán)境。
三是系統實(shí)現。非知之艱,行之惟艱。打造具有通用能力的系統實(shí)屬不易,我們只是在漫漫前行路上邁出了一小步。王培提出的非公理邏輯推理系統NARS(Non-Axiomatic Reasoning System)便是其中重要一例。NARS項目歷經(jīng)30余年,在實(shí)時(shí)學(xué)習、推理和目標滿(mǎn)足等關(guān)鍵領(lǐng)域成效斐然。系統能通過(guò)自身感知對環(huán)境進(jìn)行建模,適應環(huán)境,通過(guò)推理來(lái)決定下一步行動(dòng),從而實(shí)現自我目標。近期的研究亮點(diǎn)是,將深度神經(jīng)網(wǎng)絡(luò )(YOLOv4)的視覺(jué)感知與NARS實(shí)時(shí)學(xué)習和推理能力(OpenNARS for Applications)進(jìn)行整合,很好地完成機器人瓶子收集的任務(wù)。
機器人尋找瓶子、機器人抓住瓶子?
圖注:此例雖小,但意義重大。首先,再次印證同一個(gè)通用人工智能系統能夠完成不同的專(zhuān)用任務(wù),而無(wú)需再次開(kāi)發(fā)或修改源碼重新編譯;其次,明確說(shuō)明通用人工智能系統的多種感知與運動(dòng)功能能夠在“大腦”的指揮下被妥善協(xié)調,而對算力僅有“微弱”的要求;最后,盡管單項能力非其所長(cháng),但對開(kāi)放世界里又“找”又“避”又“抓”又“舉”的“多強全能”冠軍而言,通用人工智能系統必定是最有力的競爭者,沒(méi)有之一。
在這一任務(wù)中,機器人不僅需要協(xié)調視覺(jué)搜索和機械操作等多種感知運動(dòng)功能,同時(shí)還要學(xué)習探索如何避障。這讓NARS實(shí)時(shí)學(xué)習和實(shí)用推理相得益彰,二者融合一目了然——既能夠充分體現實(shí)時(shí)學(xué)習的能力(常被視為強化學(xué)習的優(yōu)勢),又不失目標規劃及利用背景知識的認知靈活性。而且,通過(guò)集成最新的深度學(xué)習模型來(lái)處理其所擅長(cháng)的目標檢測任務(wù),可將機器學(xué)習的離線(xiàn)優(yōu)化特點(diǎn)與AGI系統的實(shí)時(shí)學(xué)習和推理優(yōu)勢相互結合,此為SAI與AGI系統的共生之道。我們的AGI方案有望實(shí)現智能系統自主性的極大提升,并用于:
救援機器人
探險機器人
基于智能手機或PC的個(gè)人助手
無(wú)論是某種新型自主代理還是其他項目,AGI的應用不拘形跡——“一切皆有可能”。一言以蔽之,實(shí)時(shí)學(xué)習乃AGI關(guān)鍵之法,離線(xiàn)優(yōu)化的人工智能技術(shù)可以成為服務(wù)AGI“大腦”的其他延展“器官”,從而令多模態(tài)學(xué)習及跨域遷移的交結變?yōu)楝F實(shí)。這樣的系統具備真正意義上的智能,能迅速適應多變的現實(shí)環(huán)境。
最后,總結本文要點(diǎn)如下:
AGI與SAI根本目標各異——通用VS專(zhuān)用
AGI與SAI評價(jià)方式完全不同
實(shí)時(shí)適應性是智能系統的必然要求
NARS所依據的通用推理系統是實(shí)現真正智能的一種方法
AGI時(shí)代的大幕正徐徐升起。2021,你好牛年,你好牛·年!
評論comment