時間在變,空間随着時間也在變,不變的唯有真知灼見。
2025年01月16日  星期四
首頁
财經
觀察
參考
ESG
公告
市場
研究
IPO
周報
動态
推薦
首頁 > 公司

百度發布“文心一言”,掌握中文和多模态生成的最新生成型人工智能

來源:真灼傳媒 時間:2023-03-16 14:39:04

字号

北京2023年3月16日 /美通社/ -- 擁有強大互聯網基礎的領先人工智能公司百度公司(納斯達克股票代碼:BIDU,港交所股票代碼:9888)("百度 "或 "公司")今天推出了新一代大型語言模型(LLM)和生成型人工智能産品文心一言。文心一言在一系列領域表現出色,包括理解中國語言和文化,生成文學和商業寫作,進行複雜的數學計算,以及制作多模式内容。該人工智能産品可以理解人類的意圖,并提供接近人類水平的準确、合乎邏輯和流暢的反應。

 

從2023年3月16日開始,文心一言将向最初的一批擁有邀請碼的用戶開放,并将很快向更多用戶開放。百度還通過百度人工智能雲提供對文心一言 API的訪問,使企業客戶能夠申請和利用該平台的先進語言能力。自2月以來,已有超過650家企業加入了文心一言的生态系統。

 

大型語言模型和生成性人工智能代表了一種新的技術範式,帶來了任何全球企業都不能錯過的機會。文心一言被定位為一個基礎的人工智能賦能平台,旨在促進金融、能源、媒體和公共事務等各行業的智能轉型。百度聯合創始人、董事長兼首席執行官李彥宏說。"百度設想的未來是,我們與所有人聯手推動人工智能的發展,使每個人都能獲得最先進的生産力工具,并确保所有人都能分享這些進步帶來的好處。"


Robin Li, Co-founder, Chairman and CEO of Baidu delivers speech and presents demos at the ERNIE Bot press conference.

百度公司聯合創始人、董事長兼首席執行官李彥宏在文心一言新聞發布會上發表演講并展示演示。

 

改變生産力的工具

在北京舉行的文心一言揭幕新聞發布會上,李彥宏展示了它在五個場景中的表現:文學創作、商業寫作、數學計算、中文理解和多模式生成。

  • 文學創作。文心一言總結了中國流行科幻小說《三體問題》的基本内容。它根據對話查詢,為故事的潛在擴展提出了五個角度,顯示了它在對話、分析和内容生成方面的全面專業知識,以及它的事實性和由内在知識圖譜支持的推理。

  • 商業寫作。文心一言能夠作為一個多功能的商業文案,展示了其從零開始構建品牌的能力,包括為公司設計一個名稱,制作一個吸引人的品牌口号,以及起草新聞稿等任務。這種高水平的創造能力是可能的,因為文心一言是在數以萬億計的網頁、數以百億計的搜索和圖像數據、數以千億計的日常語音數據以及由5500億個事實組成的知識圖譜上訓練出來的。

  • 數學計算。文心一言還擁有一定程度的認知能力,使其能夠掌握相對複雜的任務,如數學推導和邏輯推理。在面對諸如 "雞兔同籠 "等考驗人類邏輯思維的經典難題時,文心一言可以理解問題的含義,制定正确的解決問題的方法,并按照正确的步驟得出正确的答案。

  • 中文理解。文心一言展示了無與倫比的中文自然語言處理(NLP)能力,這體現在它對中文和文化細微差别的理解上。在一個演示中,文心一言解釋了成語 "洛陽紙貴 "背後的含義,這暗指由于詩歌的流行而對紙張的高需求。文心一言闡述了支撐這個成語的經濟理論--供求法則--并創作了一首詩,将成語的四個漢字作為每行的第一個字。 

  • 多模式生成。文心一言可以在文本提示下生成文本、圖像、音頻和視頻,甚至能夠用幾種當地方言(如四川方言)發聲。文心一言的視頻生成功能由于其相對較高的成本,尚未向所有用戶提供。

"多模式是生成式人工智能不可否認的未來趨勢"李彥宏說。"未來,随着我們繼續完善百度統一的多模态大模型,文心一言的多模态生成能力将得到推進。"

ERNIE Bot demonstrates multi-modal generation ability, able to produce text, images, audio and video given a text prompt.

文心一言展示了多模式生成能力,能夠在文本提示下生成文本、圖像、音頻和視頻。

 

盡管文心一言的能力,這種類型的LLM仍然遠遠不夠完美。基于現實世界的用戶反饋的持續改進仍然至關重要。

"一旦我們将文心一言投入使用,"李說,"我們将建立一個機制,讓真實世界的用戶反饋、開發人員的呼叫和模型的疊代協同工作,以更有效和高效地增強模型。"

 

文心一言的技術基礎

百度首席技術官王海峰說,文心一言是百度多年研究和行業實踐的結晶。這個新一代的知識增強型LLM是建立在百度内部模型ERNIE(知識整合的增強表示)和PLATO(預訓練的對話生成模型)之上。自2019年發布以來,ERNIE已經從一個自然語言理解模型發展成為一個具有跨語言、跨模式、跨行業和跨任務能力的模型平台。

百度使用監督微調、從人類反饋中強化學習、提示學習、知識增強、檢索增強和對話增強來訓練ERNIE機器人。

李彥宏在新聞發布會上發言,強調了百度作為全球少數幾家提供完整人工智能棧的公司之一的獨特地位。這包括人工智能芯片Kunlun、深度學習框架PaddlePaddle、預訓練模型ERNIE,以及各種應用,如搜索、人工智能雲、自動駕駛和小度智能設備。

李彥宏強調,百度的全人工智能棧的優勢在于它能夠實現端到端的優化,大幅提升效率。框架和模型之間的協同作用降低了成本,簡化了模型開發。百度的PaddlePaddle框架已被用于開發4D混合并行技術,這大大提升了超大規模模型的訓練和推理效率。百度的全人工智能棧将促進一個閉環系統,每一層都可以提供反饋,幫助文心一言繼續疊代和改進。

 

新興的商業機會

李彥宏預測,LLMs将為三個新興的商業機會鋪平道路:提供模型即服務解決方案的雲計算公司,專注于微調特定行業模型的公司,以及創建基于LLMs的應用程序的企業。

李彥宏說,百度人工智能雲将很快推出基于文心一言的雲服務和應用産品,包括公共雲和私有化部署。

"文心一言不是中美技術對抗的工具。它是幾代百度技術人員追求技術改變世界的夢想的産物。它是一個全新的平台,使我們能夠服務于數以億計的用戶,并為成千上萬的行業賦能,也是創新驅動發展的有力例證,"李彥宏在會議上說。"我們相信,人工智能(AI)将徹底改變我們今天所知的每個行業。人工智能的巨大長期價值及其對生活各方面的變革性影響僅處于起步階段。未來會有無數突破性的應用和産品,以及更多裡程碑式的事件"。

 

關于百度

百度成立于2000年,其使命是通過技術使複雜的世界變得更簡單。百度是一家具有強大互聯網基礎的領先人工智能公司,在納斯達克以 "BIDU "和港交所以 "9888 "交易。一張百度ADS代表8股A類普通股。 

 

微信掃碼 > 右上角點擊 > 分享