來(lái)源:博觀科技日期:2023-08-09 14:52:17
前段時(shí)間,前特斯拉總監(jiān)、OpenAI大牛Karpathy的一句話,引起了業(yè)內(nèi)的關(guān)注。
在7月初的一次開發(fā)者大會(huì)上,Karpathy聲稱:“我被自動(dòng)駕駛分了心,AI智能體才是未來(lái)!”并表示將來(lái)會(huì)全力投入對(duì)智能體的研發(fā)工作中。
其實(shí),早在2016年,當(dāng)Karpathy開始在OpenAI工作時(shí),就已經(jīng)錨定了智能體的方向,只是由于當(dāng)時(shí)的研究方法還不成熟,所以Karpathy才轉(zhuǎn)去做了自動(dòng)駕駛。
那么,這所謂的“智能體”究竟是什么?為什么會(huì)讓這位AI大牛長(zhǎng)久地念念不忘?
何謂智能體
到底什么是智能體?
如果我們將現(xiàn)在的生成式AI,比作一個(gè)人的話,那么它只具有了大腦(大語(yǔ)言模型),但卻沒有身體,因此只能躺在服務(wù)器上,做一些處理文字、生成圖片的工作。
而智能體,就相當(dāng)于是大模型的“身體”,有了它,大模型才能在更多的領(lǐng)域施展身手。
那智能體究竟能做什么?
最近,一個(gè)名叫Fable的初創(chuàng)公司,發(fā)布了一個(gè)節(jié)目統(tǒng)籌智能體(Showrunner),如同一聲驚雷炸響,讓人們?cè)俅我娮C了智能體的強(qiáng)大。通過(guò)這樣的智能體,F(xiàn)able制作出了一集完全用AI拍攝的《南方公園》!從編劇、動(dòng)畫、導(dǎo)演、語(yǔ)音、編輯……到劇集制作的全流程,都是由AI完成。
在整個(gè)制作環(huán)節(jié)中,通過(guò)自然語(yǔ)言,給不同的智能體分配了各自的目標(biāo),人類導(dǎo)演只需要給出一個(gè)高層次的構(gòu)思提示(標(biāo)題、概要、事件),這些AI智能體就會(huì)開始「自導(dǎo)自演」。之后,人類幾乎就不用進(jìn)行任何干涉了!
在制作過(guò)程中,不同的AI智能體,擔(dān)任了不同的角色,如演員、導(dǎo)演、剪輯等,它們彼此分工合作,互相配合,最終完成了整部影片的制作。而同樣的,類似的案例,也出現(xiàn)在前段時(shí)間清華團(tuán)隊(duì)的研究中。
7月19日,清華團(tuán)隊(duì)用ChatGPT打造了個(gè)零人工含量的“游戲公司”——ChatDev,只要你提出想法,從設(shè)計(jì)到測(cè)試的完整流程,都由AI幫忙搞定。
Fable與制作《南方公園》的思路類似,在游戲開發(fā)的環(huán)節(jié)中,ChatDev的十多個(gè)智能體也分別擔(dān)任了這個(gè)“公司”中的策劃、程序員、設(shè)計(jì)師等不同的崗位。
在項(xiàng)目開始時(shí),人類可以對(duì)這些AI提出一個(gè)大概的想法或創(chuàng)意。之后,各個(gè)智能體之間就會(huì)進(jìn)行一系列討論、制作、測(cè)試的環(huán)節(jié),整個(gè)過(guò)程完全不需要人類的參與,全是自動(dòng)進(jìn)行的。由此可見,有了智能體之后,大模型就能根據(jù)人類給出的規(guī)則和策略來(lái)做出決策,而不需要人類的干預(yù)或指令。
在這個(gè)過(guò)程中,智能體還會(huì)通過(guò)習(xí)得的經(jīng)驗(yàn)或知識(shí),來(lái)改善自己的性能和適應(yīng)性,并根據(jù)目標(biāo)函數(shù)或獎(jiǎng)勵(lì)函數(shù)來(lái)評(píng)估自己的行為。
而這樣的能力,是以往的大模型(LLM)無(wú)論如何都不具備的。
因此,LLM即使再聰明,也是一個(gè)沒有身體的“大腦”,而正是智能體的出現(xiàn),讓LLM有了行動(dòng)的能力,有了自主完成復(fù)雜任務(wù)的能力。
而這樣的能力,正是LLM下一階段進(jìn)行在應(yīng)用層面進(jìn)行落地的關(guān)鍵。
AI智能體需要從神經(jīng)科學(xué)中汲取靈感
就像深度學(xué)習(xí)早期的發(fā)展一樣,AI智能體的發(fā)展可能會(huì)從神經(jīng)科學(xué)中獲得啟發(fā)。
思考AI智能體和神經(jīng)科學(xué)的關(guān)系是很有意思的。
尤其是現(xiàn)在很多人都把大語(yǔ)言模型作為AI智能體解決方案的一部分。
但是如何構(gòu)建一個(gè)完整的,擁有人類所有認(rèn)知能力的數(shù)字實(shí)體呢?
顯然,我們都認(rèn)為需要某種潛在的系統(tǒng)來(lái)規(guī)劃、思考和反思我們?cè)谧龅氖虑椤?/p>
這可能就是神經(jīng)科學(xué)能發(fā)揮作用的地方。
舉個(gè)例子,海馬體是大腦非常重要的部分。
但是AI智能體中什么東西發(fā)揮著海馬體的作用,來(lái)存儲(chǔ)記憶,實(shí)現(xiàn)標(biāo)記和檢索等等的這些功能呢?
我們大致已經(jīng)了解如何構(gòu)建視覺和聽覺皮層,但還有許多的東西我們并不知道在AI智能體中到底意味著什么。
比如潛意識(shí)的所在地——丘腦在AI Agents中又相當(dāng)于什么呢?
這些都是非常有趣的問(wèn)題。
我專門帶了一本神經(jīng)科學(xué)方面的書,是有David Eagleman的《大腦與行為》,我發(fā)現(xiàn)這本書非常有趣,很有啟發(fā)性。
就像早期AI研究在設(shè)計(jì)神經(jīng)元時(shí)所做的那樣,從神經(jīng)科學(xué)中汲取有趣的靈感,也許是我們應(yīng)該重新嘗試的方向。
無(wú)論是人類智能體還是機(jī)器人智能體,它們都以不同的傳感器和執(zhí)行器來(lái)與環(huán)境進(jìn)行交互。
智能傳感器和執(zhí)行器是主要零件
對(duì)于人類智能體而言,我們擁有眼睛、耳朵和其他器官作為傳感器,以及手、腿、聲道等作為執(zhí)行器。通過(guò)眼睛觀察周圍的景象,通過(guò)耳朵聆聽聲音,我們能夠感知環(huán)境。而通過(guò)手和腿的動(dòng)作,我們可以對(duì)環(huán)境做出反應(yīng)和影響。
機(jī)器人智能體則通過(guò)不同的傳感器來(lái)感知環(huán)境,例如攝像頭和紅外測(cè)距儀。這些傳感器幫助機(jī)器人了解周圍的世界。同時(shí),機(jī)器人還配備了各種電動(dòng)機(jī)作為執(zhí)行器,通過(guò)這些執(zhí)行器,機(jī)器人能夠?qū)Νh(huán)境進(jìn)行實(shí)際的操作和動(dòng)作。
除了具有物理實(shí)體的智能體外,還存在著軟件智能體。軟件智能體不像機(jī)器人那樣有實(shí)體存在,它主要通過(guò)計(jì)算機(jī)程序來(lái)感知和操作環(huán)境。軟件智能體可以接收來(lái)自文件內(nèi)容、網(wǎng)絡(luò)數(shù)據(jù)包和人工輸入(例如鍵盤/鼠標(biāo)/觸摸屏/語(yǔ)音)的傳感輸入。然后,它通過(guò)寫入文件、發(fā)送網(wǎng)絡(luò)數(shù)據(jù)包、顯示信息或生成聲音等方式對(duì)環(huán)境進(jìn)行操作。
智能體的傳感和執(zhí)行過(guò)程是人工智能的核心,使其能夠在不同領(lǐng)域發(fā)揮重要作用。通過(guò)傳感器感知環(huán)境和通過(guò)執(zhí)行器作用于環(huán)境,智能體能夠做出決策和響應(yīng),從而實(shí)現(xiàn)智能的行為。
總結(jié)來(lái)說(shuō),智能體是通過(guò)傳感器感知環(huán)境并通過(guò)執(zhí)行器作用于該環(huán)境的實(shí)體。無(wú)論是人類智能體、機(jī)器人智能體還是軟件智能體,它們都通過(guò)不同的傳感器和執(zhí)行器與環(huán)境進(jìn)行交互,從而表現(xiàn)出智能的行為。這個(gè)簡(jiǎn)單而重要的概念是人工智能研究和應(yīng)用的基石。
鄭州博觀電子科技有限公司是一家提供科技類物聯(lián)網(wǎng)開發(fā)軟硬件定制化方案服務(wù)商、也是中原地區(qū)領(lǐng)先的物聯(lián)網(wǎng)終端設(shè)備解決方案提供商。致力共享?yè)Q電柜、智能充電樁、共享洗車機(jī)、物聯(lián)網(wǎng)軟硬件等服務(wù)平臺(tái)的方案開發(fā)與運(yùn)維??偛课挥诤幽鲜∴嵵菔懈咝聟^(qū),已取得國(guó)家高新技術(shù)企業(yè)認(rèn)證證書。經(jīng)過(guò)10多年的業(yè)務(wù)開拓,公司已經(jīng)形成了以中原地區(qū)為中心、業(yè)務(wù)遍布全國(guó)的經(jīng)營(yíng)格局。
* 為了您的權(quán)益,您的一切信息將被嚴(yán)格保密