對話(huà)復旦大學(xué)副教授鄭驍慶:當前AI仍是“高級別模仿”,離AGI還有一段距離
每經(jīng)記者 宋欣悅????每經(jīng)編輯 高 涵????
近日,“推遲”“質(zhì)疑”“未達預期”這類(lèi)詞語(yǔ)頻繁出現在人工智能(AI)行業(yè)的討論和報道中。被眾人期待“炸場(chǎng)”的OpenAI連續12天的AI發(fā)布會(huì )細細品來(lái)也少了些“革命性”的味道,更像是在已有成果上的修修補補。
此前,OpenAI的聯(lián)合創(chuàng )始人伊爾亞·蘇茨克維就曾在多個(gè)場(chǎng)合提到,AI的進(jìn)步并不是線(xiàn)性的,未來(lái)幾年內,盡管有大量資金和研究投入,技術(shù)突破的速度可能會(huì )有所放緩。
AI發(fā)展速度真的在放緩嗎?AI發(fā)展面臨著(zhù)哪些挑戰?我們距離通用人工智能(AGI)還有多遠?針對這些熱點(diǎn)問(wèn)題,《每日經(jīng)濟新聞》記者(以下簡(jiǎn)稱(chēng)NBD)專(zhuān)訪(fǎng)了復旦大學(xué)計算機學(xué)院副教授、博士生導師鄭驍慶。
鄭驍慶認為,從速度來(lái)講,AI發(fā)展并沒(méi)有放緩,但目前AI發(fā)展面臨著(zhù)三大核心挑戰:AI“幻覺(jué)”現象、數據隱私、算力和能源效率。在他看來(lái),當前的AI技術(shù)依然處于“高級別模仿”的階段,離真正的AGI還有一段距離?!癆GI不僅需要在認知能力、學(xué)習能力等方面超越現有技術(shù),還需在情感理解和自主決策等領(lǐng)域有所突破?!?/p>
AI發(fā)展并未減速,但仍面臨三大挑戰
NBD:在您看來(lái),近期A(yíng)I的發(fā)展速度相比過(guò)去兩年,有怎樣的變化?
鄭驍慶:我認為,人工智能的發(fā)展速度并沒(méi)有放緩。
新一輪生成式人工智能的標志性工作,實(shí)際上就是OpenAI在2022年底推出的ChatGPT。這樣一個(gè)突破性的事件,距今僅有兩年左右的時(shí)間。在這段時(shí)間里,ChatGPT的成功使得整個(gè)學(xué)術(shù)界和產(chǎn)學(xué)界投入了大量的人力和物力來(lái)推動(dòng)生成式人工智能的發(fā)展。
不能說(shuō)當前人工智能技術(shù)的發(fā)展變慢了,實(shí)際上,它仍在加速前進(jìn)。當然,在發(fā)展的過(guò)程中,我們不可避免地會(huì )遇到一些問(wèn)題和新的挑戰,這些都是目前確實(shí)存在的。
NBD:目前人工智能面臨哪些重大挑戰?
鄭驍慶:因為我的研究工作重要集中在自然語(yǔ)言處理和機器學(xué)習方面,所以我從這個(gè)領(lǐng)域來(lái)談。
首先,當前大型語(yǔ)言模型面臨的一個(gè)主要問(wèn)題是“幻覺(jué)”現象,即模型可能會(huì )生成看似正確但實(shí)際上錯誤的信息。因為許多用戶(hù)并不具備鑒別信息真偽的能力,所以很容易被這種“幻覺(jué)”影響。特別是在醫學(xué)、法律、金融等高風(fēng)險應用領(lǐng)域中,存在一定風(fēng)險。
其次,大模型高度依賴(lài)大數據。實(shí)際上,包括OpenAI在內的AI公司,在訓練模型時(shí),也并未透露其使用了哪些數據。因為這些數據多多少少會(huì )涉及版權或個(gè)人隱私。這種問(wèn)題不僅存在于模型的構建和訓練過(guò)程中,在用戶(hù)在使用大模型時(shí),也可能泄露個(gè)人信息。因此,數據的隱私問(wèn)題是另一個(gè)重大挑戰。
最后,AI大模型的算力消耗巨大,資源成本高昂。如何降低使用門(mén)檻,讓更多用戶(hù)特別是中小企業(yè)能夠負擔得起人工智能技術(shù),是我們需要思考的問(wèn)題。在巨大的計算和能源消耗情況下,如何實(shí)現更高效、更節能的AI系統,可能成為未來(lái)的發(fā)展方向。
數據最小化:只取所需,不要貪多
NBD:您認為有哪些關(guān)鍵技術(shù)可能會(huì )去解決或者緩解這些挑戰呢?
鄭驍慶:要緩解“幻覺(jué)”問(wèn)題,一種策略是“對齊”。目前,較為成熟的技術(shù)手段是利用強化學(xué)習來(lái)實(shí)現與人類(lèi)偏好的對齊。在對齊人類(lèi)偏好的過(guò)程中,一個(gè)核心標準是“誠實(shí)性”,即模型必須提供真實(shí)信息,而非胡編亂造。
另外,“檢索增強生成”(RAG)也是一項關(guān)鍵技術(shù)。在提問(wèn)時(shí)先提供相關(guān)的背景資料,模型會(huì )通過(guò)檢索這些資料來(lái)輔助生成答案,這樣可以在一定程度上提高生成答案的準確性和可信度,緩解單純依賴(lài)模型內部知識庫可能產(chǎn)生的“幻覺(jué)”問(wèn)題。
還有一種技術(shù)是答案生成的后續驗證。模型生成答案后,我們可以利用其他模型對答案中的關(guān)鍵觀(guān)點(diǎn)和要素進(jìn)行驗證,以確保正確性。
對于數據隱私問(wèn)題,高質(zhì)量的數據是高質(zhì)量應用的基礎,我認為企業(yè)需要找到創(chuàng )新與數據隱私之間的平衡點(diǎn)。首先,企業(yè)需要遵循數據最小化原則,只收集和使用與目標任務(wù)直接相關(guān)的最少量的數據,只取所需,而不要貪多。
其次,企業(yè)一定要做好數據的加密和脫敏處理。尤其是在A(yíng)I應用中,模型的訓練數據如果沒(méi)有保護好,攻擊者可能通過(guò)模型推測出隱私信息,進(jìn)而對企業(yè)和用戶(hù)帶來(lái)巨大的安全隱患。
我們還可以考慮使用新技術(shù)來(lái)解決這個(gè)問(wèn)題,比如聯(lián)邦學(xué)習,它允許多個(gè)數據擁有者各自貢獻出模型所需的訓練數據,在數據聯(lián)邦的情況下完成模型的訓練,而不會(huì )泄露數據擁有者的數據。
AI處于“高級別模仿”階段 不具備“小樣本學(xué)習”能力
NBD:近日,OpenAI首席執行官薩姆·阿爾特曼在接受媒體采訪(fǎng)時(shí)表示,預計通用人工智能(AGI)將在2025年到來(lái)。在您看來(lái),我們離AGI近了嗎?
鄭驍慶:阿爾特曼作為OpenAI的首席執行官,從商業(yè)的角度來(lái)說(shuō),他對于A(yíng)GI的實(shí)現可能會(huì )比較樂(lè )觀(guān)。但對于我們研究者來(lái)講,我持一定的保留意見(jiàn)。
當前的AI技術(shù),實(shí)質(zhì)上仍是一種高級別的模仿,與人類(lèi)的智能完全不一樣。人類(lèi)的智能,舉個(gè)例子,我們從小就能流利地使用語(yǔ)言,并產(chǎn)生語(yǔ)言的新表達。但實(shí)際上,我們在成長(cháng)過(guò)程中接觸到語(yǔ)言環(huán)境的數據量,遠遠小于當前人工智能模型接觸到的數據量。也就是說(shuō),人類(lèi)大腦具有一種強大的小樣本學(xué)習能力,即僅憑少量樣本,就能泛化到未見(jiàn)過(guò)的情境,而這是目前模型無(wú)法做到的。
目前,關(guān)于A(yíng)GI還存在一個(gè)爭議:AGI是要做仿真(按照人腦思路來(lái)做),還是按照實(shí)用主義的思路來(lái)做?具體而言,仿真路徑主張在深入理解和模擬人腦機制的基礎上構建人工智能系統;而實(shí)用主義路徑則更加注重結果,認為只要人工智能系統的輸出效果與人類(lèi)相當,就可以認為其具備智能。
現在的發(fā)展主要是在走實(shí)用主義的道路,而這條發(fā)展路徑面臨的最大的問(wèn)題在于,盡管AI在某些單一任務(wù)上可能表現非常優(yōu)異,但要從一個(gè)任務(wù)遷移到另一個(gè)任務(wù),尤其是面對全新任務(wù)時(shí),往往需要大量的新數據重新進(jìn)行訓練。比如,我們教會(huì )AI文字表達,它的語(yǔ)音處理能力可能就不理想;而教會(huì )它語(yǔ)音,它的文字表達能力又可能受到影響。因此,在處理涉及多種數據形式(如文本、圖像、音頻)的跨模態(tài)任務(wù)時(shí),AI的表現仍然不夠出色。
人類(lèi)智能完全不同,人類(lèi)能夠依靠在其他任務(wù)中積累的經(jīng)驗,在新任務(wù)上同樣表現出色。即使面對未知的任務(wù),人類(lèi)也能規劃出探索和研究的路徑,從而順利完成任務(wù)。因此,我認為通用人工智能必須具備通用性和遷移性。這種通用性遷移性意味著(zhù),一旦AI在某個(gè)任務(wù)上學(xué)會(huì )某項技能或知識,它應該能夠將其遷移到各種不同類(lèi)型的任務(wù)上。
另外一個(gè)值得探討的概念是,元學(xué)習(Meta Learning)。之所以提及元學(xué)習,是因為當前AI,包括ChatGPT在內,存在一個(gè)顯著(zhù)的問(wèn)題:推理能力不足。元學(xué)習是一種更高層次的學(xué)習方法,它關(guān)注的是“學(xué)會(huì )如何學(xué)習”(learning to learn),而不僅僅是學(xué)習什么。
翻譯
搜索
復制
轉載原創(chuàng )文章請注明,轉載自東莞厚街佰勝機械設備廠(chǎng),原文地址:http://www.geniusextensions.com/post/26481.html