文章來源:矽星人Pro
文章作者:周一笑
大模型的下一個突破方向是什麼?斯坦福大學教授吳恩達的答案是AI智能體工作流。
在今年4月的一次演講中,吳恩提到多個智能體一起工作,分配任務并讨論和辯論想法,能夠提出比單個智能體更好的解決方案。在他的測試中,基于GPT-3.5構建的智能體工作流,表現超過了GPT-4。
什麼是智能體工作流?大多數人使用大模型的方式是輸入指令——生成答案,這是我們使用工具,來線性完成某項任務的方式。
而智能體協作的工作流是這樣的:讓智能體A進行調研,寫出文章大綱,智能體B寫初稿,智能體閱讀初稿并進行修改,讓智能體C配圖,讓智能體D做翻譯...這一過程還可以持續下去,直到獲得滿意的結果。
通過多智能體協作,可以把一個複雜的任務進行拆解,在流程中加入人對于流程的規劃和定義。從而減少對指令和模型推理能力的依賴,提高大模型處理複雜任務的能力和準确性。
我們可以把智能體之間的協作和人類的工作方式進行類比,比如在一家公司中,每個人都有自己的工作職責,每個人的技能點也有所不同,但所有人最終都是要實現共同的利益或解決共同的問題。這種分工和協作的能力,是人類智能的重要表現之一,也是人類社會的基礎。
這種智能體的工作流,每一個步驟都借助模型的不同智能體的能力和工具來完成,每一步的智能體和工具可能都不一樣,最終把這一系列的步驟串聯起來,如同一個生産的流水線,形成一條端到端的工作流,源源不斷地産生價值。
在智能體方面,OpenAI已經用GPTs和Assistant API率先進行了布局,并且前幾天還免費向所有用戶開放了GPTs的使用,不過這和國内的絕大多數用戶沒什麼關系。
事實上,在國内也有不輸GPTS的智能體平台,比如性能比肩GPT-4的智譜清言,在今年1月就上線了個性化智能體功能GLMs,無論有沒有開發經驗,都能使用文字指令創建智能體,它的門檻有多低呢,在今天智譜的Openday上,一位九歲的開發者許萌萌閃亮登場,他不僅用清言的智能體開發了一款偵探遊戲,還和清言合作寫了一本書《AI少年----火星生存大挑戰》,并且得到了電子工業出版社的出版。
這本書寫的是火星主題的密室逃脫遊戲,這位可能是年齡最小的AI開發者說,從框架情節,到尋求數據支持和修改潤色,都有智譜清言的功勞。智譜也為這位小粉絲送上了一份禮物:剛剛入職智譜的數字員工羅永浩來幫《AI少年----火星生存大挑戰》帶貨了。據官方介紹,AI老羅也将登錄智譜清言平台開放給公衆,看來以後大家在閑魚上賣二手,也可以讓老羅來吆喝吆喝了。
除了輔助創作,智能體在生産力方面也大有所用。為了方便用戶使用智能體構建自己的工作流,智譜清言還推出了一項非常實用的創新功能“清流”,用戶在清言對話框或任意一個智能體内,隻需使用“@”功能,就可以召喚不同的專用智能體,實現在一個對話内将不同的智能體串聯在一起,而免去了在各個智能體的窗口之間來回切換。統一到同一個對話内之後,智能體也能夠更完整地理解上下文信息,讓輸出結果更精準。
這些智能體除了可以自由組合,還具備模型自帶的聯網、繪圖、代碼等能力,支持接入外部工具和知識庫,完成更複雜的任務,形成個性化工作流。
依托于GLM大模型,智譜清言近期還從技術和工程上對智能體的協作進行了針對性的優化,不僅可以支持更多輪的工作流,智能體在工作流中完成任務的效果也得到了提升。
矽星人也在第一時間上手體驗,讓我們來看看大佬們都看好都智能體工作流,落到實操中是否值得期待。
實測“清流flow”:多智能體協作實現1+1>2
想要使用智譜清言的智能體,可以在聊天框直接@召喚,類似在工作群聊中@你的同事分配工作任務一樣,而且你不必考慮它的檔期和工作狀态,智能體是來者不拒的。
不過每次@智能體隻能完成單一的任務,想要形成工作流,需要把不同的智能體組合起來,就像組織一個工作小組一樣。首先來看看如何通過清流flow構建工作流,讓小白也能搞定英文财經新聞的撰寫。
财經新聞撰寫工作流
信息搜集 + 思維導圖 + 數據分析 + 報告撰寫 +新聞改寫
智能體是來幫我們幹活的,所以需求越明确越好。對于财經記者來說,主要進行經濟、金融、市場等相關領域的新聞報道和分析,他們會密切關注衆多市場主體,從龐雜的信息中篩選出有價值的部分傳達給讀者。清流flow的這一套财經新聞工作流,極大的提高了工作的效率,讓我們來看看智能體是如何協作的。
最近巴菲特公司股價閃崩讓我們見證了曆史,針對這類财經事件的解讀,通常有這麼幾個流程:獲取并梳理信息->形成邏輯框架->進行數據分析->文章撰寫->編輯發布等。這些繁瑣的流程,我們完全可以交給智能體合作完成,而用戶隻需要進行整體把控。
流程一:查閱總結相關信息
我們直接輸入指令:“我想知道近期巴菲特公司股價閃崩的原因和相關影響,請搜集互聯網公開信息,并調閱紐交所官方信息”,ChatGLM的搜索能力已經足夠滿足這個需求,因此在這一步不需要調用智能助理。
ChatGLM聯網進行了快速檢索,對相關要點進行了總結,并附上了參考文章的相關鍊接,方便記者進行進一步的查閱以及核實。
流程二:進行邏輯分析
在浏覽了相關信息之後,我們需要對相關素材進行進一步的梳理,思維導圖是一個很好的工具。我們可以@思維導圖 MindMap,輸入指令“請形成有邏輯、進行具體分析的思維導圖”。
智能體思維導圖 MindMap 先是整理了文字内容。
然後調用工具生成了完整的思維導圖。
流程三:分析數據信息
我們引入伯克希爾哈撒韋近期股價變動的解讀,作為背景信息。先讓ChatGLM查閱相關信息。
再@數據科學家,從數據的角度進行分析。輸入指令:“對伯克希爾哈撒韋的股價變動相關數據進行分析,給出數據角度的洞見”。
流程四:撰寫調研報告
有了框架和數據觀點,下一步我們@調研報告撰寫大師,結合以上所有信息進行進一步的綜合調研分析。輸入指令:“把以上所有内容潤色為一篇1000字的調研報告”。
智能體根據我們的訴求生成了一份調研報告,在這裡如果對内容有所不滿,還可以讓智能體繼續調整優化。
流程五:新聞撰寫與翻譯
智譜清言除了精準的中文理解能力,在跨語言理解上的表現也很出色,我們@英文新聞改寫者,撰寫一篇英文新聞報道,輸入指令:“以伯克希爾哈撒韋近期股價變動為主題,寫一篇英文财經新聞報道,要承接中國媒體的視角和價值”。
智能體助理天團,任意挑選組合
在智譜清言的智能體中心,用戶可以用自然語言定義自己的智能體角色、能力和工作流程,也可以根據需求描述一鍵生成智能體。還支持上傳自己知識庫文件,成為專屬私人助理,同時,具備開發能力的用戶還可以接入自定義API,讓智能體調用外部API來實現複雜功能。
在智能體中心,除了官方提供的智能體之外,還可以找到各種類型的由用戶創建提交的智能體,覆蓋了多種功能和場景。這些智能體結合了不同的模型能力,仿佛是無數個不同的專家,有的側重于處理文字,有的則擅長畫圖或是圖表的制作,用戶可以根據自己的特定場景和需求,挑選合适的智能體,開箱即用。矽星人在使用中也遇到了不少比較有意思、有用的智能體,在這裡也一并推薦給大家。
表情包鬥圖啟動!
據說當代年輕人最大的虛拟資産就是手機裡的表情包,鬥圖更是各個群聊裡喜聞樂見的環節,智能體能成為我們鬥圖的助手嗎?當然可以,智能體“表情包鬥圖啟動!”就是為此而生,最近火爆社交網絡的“嗎喽文學”它也替你掌握了。
吸渣體質識别
在感情路上走的不太順利的同學,可能會懷疑自己是不是“吸渣體質”,“吸渣體質識别”智能體是一台專業的吸渣體質指數識别儀,可以給你定位吸渣體質指數,同時幫助你分析自身情感狀态,避開吸渣陷阱。
大衆點評文案
相信大家在外出就餐的時候,經常遇到商家“花式”索要好評,如果體驗尚可,一般也會給個好評,隻不過寫的時候還得想想怎麼誇,有時候還有字數要求。遇到這種情況我們就可以召喚“大衆點評文案”智能體,它可以幫助一鍵生成好評文案,再也不用擔心詞窮的尴尬。
無限流續寫
無限流小說成為了如今網文的熱門題材,一本小說包含多個世界的副本,體現多個世界的差異,可以讓讀者一口氣看個過瘾。有了“無限流續寫 ”智能體,我們甚至可以嘗試自己寫這樣的小說,而不用擔心靈感不夠,或者文筆不夠好,在續寫的每一步,智能體都會進行相應的引導。
生産力方面,“思維導圖助手”在前面的案例中已經展示,它可以根據用戶的主題一鍵生成Markdown格式思維導圖,通過圖形化的方式将信息層次化、結構化地呈現。而“複雜流程圖”則可以用五秒鐘做一張流程圖,主打的就是一個省時省力,以“是否去遊泳”為例,效果是這樣的:
除了單獨使用,我們還可以将不同的智能體任意組合搭配,像上文介紹的财經新聞場景一樣,形成工作流,來解決更複雜的問題,就像是坐擁了海量可以随意調配的小能手和智囊團。
比如,如果你要做一個AI教育類APP,需要寫一份産品方案。可以召喚“頂級産品經理”出一份PRD,讓ChatGLM把得到的PRD轉為框架圖,最後通過“産品規劃師” 進一步細化,生成一個詳細方案,并根據功能方案生成清晰的框架圖。
要寫論文的同學,則可以先使用“學術搜索”确定論文選題方向,再召喚“論文寫作專家”和“論文改寫精靈”分别進行撰寫可以編輯,如果有需要,還可以用“翻譯專家”進行翻譯。中途的每一個環節,都可以根據具體需求進行調整和優化。當然,最後還是需要進行人工審核和修改才能确保論文的質量。
頂級的模型能力+智能體工作流=效率革命
其實無論是學界還是産業界,大家已經圍繞智能體探索了很久,隻不過在大語言模型興起之前,智能體的研究主要用來扮演策略函,解決特定場景下的問題,随着大型模型的發布,智能體領域開始迎來了加速的發展,智能體也被認為是實現AGI的一種方案,在技術圈達成了一定的共識。
最近也出現了一些有意思的探索,比如遊戲和智能體結合,有團隊用基于大語言模型的智能體玩“狼人殺”,主要用來研究主流LLM模型能否模拟人類玩家進行遊戲。
不過智能體要融入我們的日常,還是有很長的路要走。和人一樣,智能體也需要具備持續自我進化的能力,這就離不開模型能力的不斷增強。如果模型能力沒跟上,智能體充其量隻能稱之為玩具,而派不上多大用場。在這一點就不得不提智譜作為國内頭部的大模型公司,在模型能力的提升上一直走在前列。
正如人類最重要的進化是學會了使用工具,對工具的使用也是AI智能體“進化”的關鍵一環。
GLM-4的All Tools功能,讓大模型能夠理解用戶的意圖,能夠結合上下文自動選擇文生圖、代碼解釋器、網頁浏覽等多種工具完成任務執行。智能體商店還内置了常見的工具API,也支持用戶自建API來調用外部工具,這就像是可以給智能體加上不同的“外挂”,賦予了智能體更豐富的行動能力。
除了“外挂”工具,還可以給智能體“外挂”大腦,清言的智能體支持1億字的知識庫,無論文字、表格、音頻還是網頁鍊接,都可以一鍵上傳導入。這意味着清言的智能體就像是永遠不知疲倦的學霸,不僅能學會新招數,還能确保自己永遠跟在知識的最前沿。
在實際體驗中,清流flow對@召喚智能體的功能進行了優化,不僅讓用戶更容易理解AI是如何工作的,輸出的結果也更加可控。
未來GLM模型能力的進一步提升,以及更多工具和API的集成,大模型+智能體帶來的想象空間越來越值得期待。例如,更高級智能體能夠從經驗中學習,并根據新的信息和情況調整其行為,智能體之間,以及智能體和用戶之間的協作也會更豐富起來。
微軟創始人比爾·蓋茨曾經預測:智能體不僅會改變每個人與計算機的交互方式,還将颠覆軟件行業,掀起一場從輸入命令到點擊圖标以來最大的計算革命。AI智能體将迎來大爆發,每個人都會有一個超級助理。
其實,我們能擁有的又何止一個智能助理。當技術和應用走向成熟,我們都能夠擁有多個智能助理,每個助理都有其特定的功能和專長,在不同領域幫助我們。無論是工作、學習還是生活,智能體可以幫助我們自動化更多種類的任務,從而釋放出更多時間和精力,讓我們可以更專注于創新和解決複雜問題,去從事更有創造性工作和娛樂活動。
随着多智能體的協作進化,也許就像馬斯克所說,未來人們可能都不需要工作了。不過這樣的未來離我們還有一些距離,在此之前,大家可以先把智譜清言用起來,搶先解鎖智能體+工作流的體驗。
目前這些7*24小時待命智能體,也許還不能完全替你的工作,但它們可以組隊擔當用戶的智能小助理,幫助打工人提高效率和體驗,關鍵它還是完全免費,支持手機端、PC端及網頁使用。