采訪:朱麗琨 程曼祺
作者:朱麗琨
編輯:錢楊
來源 :晚點LatePost
轉載:IT桔子(ID:itjuzi521)
中國的大模型創業者已經集結在十字路口。他們之中既有研究自然語言理解将近 40 年的科學家,也有已經功成名就的前創業者,還有剛剛博士畢業的年輕人。創業者們在各個層面展開競争。這個十字路口甚至是物理的——就是清華大學東門外的那個十字路口。這些公司地理位置上也緊挨着彼此,最近的僅僅隔着幾層樓闆。
搜狐網絡大廈在十字路口的一側。它可能是國内大模型人才密度最高的寫字樓。王慧文的光年之外在三層。孵化自清華計算機系的智譜 AI 租下七到十一層,九層以上都還空着,保留着搜狗在這裡辦公時的痕迹,樓道貼着 “搜狗大事記”。搜狗創始人王小川在第二層的一個會議室裡開了媒體溝通會,宣布開始大模型創業,成立新公司百川智能,但他準備在附近園區選址,“我不跟他們在這裡卷”。這些公司忍受着比北京 CBD 均價還貴的寫字樓租金,隻為物理上 “接近中國最頂尖的 AI 人才”。
路的另一側有 “清華系” 代表團隊聆心智能和深言科技。前者由清華大學計算機系副教授黃民烈創辦,自 2021 年底開始自研 “超拟人大模型”,後者創始團隊幾乎全部來自清華 NLP 實驗室,實驗室的學術帶頭人孫茂松教授擔任公司的首席科學家。創始人兼 CEO 豈凡超想和教授交流時,隻用走幾百米回學校。
他們的創業契機不相同。智譜 AI 于 2019 年成立,是其中最早起步的公司。創業初期,他們基于谷歌 2018 年推出的 BERT 大模型做應用。光年之外 2023 年 4 月初正式啟動。王慧文年初看到大模型的機會,“幾天之内就做完決策”,決定再次創業。
他們都被 ChatGPT 顯示出的 “才能” 震撼。一位大模型創業者讓 ChatGPT 用動态規劃方法列出從北京到上海的最短路徑,每條路的裡程數要被 3 整除。一位資深科技投資人讓 ChatGPT 翻譯日本唱片介紹。ChatGPT 可以把 “N 響” 準确地翻譯成 “NHK 交響樂團”,這是相當資深的古典音樂發燒友才知道的 “黑話”。一位 AI 創業公司的科學家請 ChatGPT 寫人類和 AI 的故事,不斷要求加入新角色,比如一隻哈士奇,不斷湧出的字詞還是自然地組織起來。
真格基金設計了 300 多個問題,包含 “香蕉的平方根是多少”,以及要求大模型模拟抽塔羅牌占蔔。3 月中旬,剛發布幾天的 GPT4 回答準确率超過 70%,同期已發布的國産大模型平均準确率 20%。5 月,國産大模型的平均準确率已經追到 50% 以上。
被大模型能力震撼的創業者們将其比作 “下一代計算機”“火的發明”“人類創造的上帝”;動用各式比喻來解釋他們預計的變化量級,“寒武紀”“工業革命”“文藝複興”“大航海”“蘋果微軟時刻”“黑莓時代” 等等。
質變從 2020 年面市的 GPT-3 開始。這款模型參數量和預訓練數據量比上一代增大百倍以上,展示出更強的語言理解和預測能力。OpenAI 的設想被印證:當數據規模足夠大,模型就能學到其中包含的翻譯、算數、編程等各種任務的例子,因此變得更通用。ChatGPT 沿着這條路更進一步。IDEA 研究院認知計算與自然語言講席科學家張家興在一次活動上,引用《三體》裡著名的那句 “物理學不存在了”,在現場感歎,“傳統的 NLP(自然語言處理)技術不存在了”。
“大模型重點在數據、模型、可以規模化實施的算法,傳統 NLP 研究重點在模型上做很多精巧的設計,但很多在大數據大模型上就不再有效了。” 聆心智能創始人、清華大學計算機系副教授黃民烈解釋。
原本就在 AI 領域的創業者也活躍起來。商湯、第四範式、科大訊飛等公司相繼推出大模型。AI 創業公司出門問問 CEO 李志飛感歎,“大模型的供給比想象中多多了”。他最初認為大模型的資金和技術門檻高,能做的國内公司最多兩三家。一個半月之後,他預感大模型的市場競争可能比上一波 AI 熱潮更激烈。
怎麼理解 OpenAI 的成功,部分意味着這些創業者将怎麼對待他們的競賽。李志飛認為 OpenAI 的成功是 “把研究範式切換為産品驅動”。瀾舟科技創始人、前微軟亞研院副院長周明認為,這家公司把數據清洗、訓練速度等各方面做到極緻,并且集成所有能力,包括優秀的算法、工程甚至 PR。而王慧文認為 OpenAI 的成功是 “正确的使命、願景、價值觀,正确的組織方法的成功”。
創業者們對大模型的終極目标 AGI(通用人工智能)的看法,從定義到理解都有很大差異。
王小川隻跟 ChatGPT 簡單聊了幾輪,就确信 “ AGI 已經來了”。他認為 ChatGPT 印證了他六七年前的判斷:當機器掌握了語言,強人工智能就到來了。在一個小範圍分享會上,幾位 AI 領域創業者僅從功能上定義 ChatGPT 的進步。
“大家把這件事想小了。” 王小川說。他會後接到一個在場者的電話,對方問,“小川,你是不是又在裝?” 幾天後,那人又打來電話:“這次你又說對了。”
王慧文認為,“對 AGI 的認知,随着對事實的掌握和結果的展開,可能會翻轉很多次的。”
共同點在于,他們都确信大模型技術變革比他們經曆過的任何一次變化都大,而他們站在這場可能長達幾十年的變革浪潮的起點。
“這次 AI 的浪潮應該是一個持續幾十年,由多個小浪潮波次構成的大浪潮。它不會一個波次就完成,會在不同的波次裡出現不同的創新。” 王慧文說。
他認同美國投資人埃拉德·吉爾(Elad Gil)的觀點:在部分科技浪潮中,所有的價值都可以由初創企業捕獲,而在另外的浪潮中,大部分價值會歸成熟企業所有,或者會在初創企業和成熟企業之間分配。王慧文認為,AGI 浪潮屬于後者,因為大模型技術跟過去的技術差異化足夠大,導緻了市場的不可預測性,創業公司因此有了發展空間。
直到 ChatGPT 教育了國内市場
2022 年 10 月,多個美國投資人跟李志飛提到一款叫 Jasper 的 AIGC 應用很賺錢。當時 Jasper 僅僅成立 18 個月,估值 15 億美元。Jasper 基于 GPT-3 模型,針對市場營銷場景做了精調,靠生成營銷文案打開市場,2022 年 ARR(衡量 SaaS 或訂閱業務的收入指标)約 8000 萬美元。
“看到它的那一刻,我真覺得自己是傻子。” 李志飛說。
一位美國紅杉的投資人跟李志飛說:“你的時代來了。” 對方還提到美國紅杉的管理合夥人隻讨論 AIGC 項目,别的都不看。當時,投資界的關注點更多在應用而非底層的大模型。
Jasper 解決了李志飛兩年前就開始思考的問題:GPT-3 到底适合應用在什麼場景?李志飛想過文案場景,但隻 “答對” 一半。“過去我們做的是糾錯、潤色、改寫,沒想到完全生成一篇内容”。他 2020 年做過一款基于自研大模型 UCLAI 的輔助寫作應用,因為沒想到好的商業前景,最終沒有上市推廣。
AI 創業公司第四範式也有類似的嘗試。第四範式副總裁兼主任科學家塗威威帶領百人團隊,負責研究全球最前沿 AI 技術并提前投入。2018 年谷歌推出 BERT 大模型,各方面性能顯著提升,塗威威和同行當時都以為,“那就是 NLP 的拐點”。他接到越來越多輔助寫作的需求。其中一些客戶很坦白地說,希望 AI 幫忙生成 “八股文” 式的彙報材料,“AI 都能下棋,這還寫不了?”
塗威威團隊嘗試基于 BERT 和 GPT 系列模型做輔助寫作應用,但隻能實現續寫兩三句,準确性還不高,最終沒有對外發布。
創業公司算力資源有限,注定向投入産出比更高的主營業務傾斜。這些先行者的大模型實驗當時也很難得到外部支持。2020 年 6 月,GPT-3 推出,Google 科學家出身的李志飛看到了大模型更通用的能力。他和工程師結成研究組,“像上瘾一樣” 讀論文。
幾個月後,在一個科技企業家的登山活動上,李志飛花一小時跟同行的人解釋大模型是什麼。他講得興奮,别人 “隻是當故事聽”,并且不斷質疑:“So what?怎麼商業化?” 其中一位企業家委婉地說:“志飛,你就适合當科學家,不适合創業。” 李志飛意識到,“不可能有人投資你做這個”。他們研發的中文大模型最終停在 60 億參數量,沒有足夠的資本支持它走到能力 “湧現” 那一刻——如今從業者普遍認為 400 億-500 億參數量級是模型能力 “湧現” 的門檻。
創投界此時還沒意識到 GPT-3 背後的商業空間。真格基金管理合夥人戴雨森在 2021 年就接觸過兩家大模型創業團隊,他們也想做類似 Grammarly 的 AI 輔助寫作或小說續寫。戴雨森當時并不看好,認為應用場景比較局限。
企業客戶更現實。周明在 2020 年底開始創業,拜訪上百家客戶,得到的反饋往往是:“你做大模型,我們也用不起。” 周明公司的客戶大多是央國企,為了數據私有化,得把大模型部署到本地,至少得投入上千萬元的訓練成本。即使不做訓練,隻做本地部署推理,成本也在一兩百萬元。客戶認為不合算。
直到 2023 年 1 月,ChatGPT 教育了國内市場。李志飛此時已重啟自研大模型 3 個多月,他發現有 “看起來跟大模型毫不相幹” 的人,也來問他得花多少錢、招什麼人能做。塗威威接觸到各行各業咨詢大模型合作的客戶,甚至包括 “農林牧副漁” 行業。
2 月 10 日,一條 “人工智能宣言” 流傳開。“5000 萬美元,帶資入組,不在意崗位、薪資和 title,求組隊。”3 天後,宣言變成傳播度更高的 AI “英雄榜”。王慧文公告了他的決心:打造中國 OpenAI。
他的下場加劇了這一輪 AI 裝備競賽的激烈程度。一位大模型創業公司的員工說,“老王這麼投入” 讓他意識到,這個賽道的火熱程度遠超想象。算力資源明顯緊張起來,一位創業者抱怨,“求爹告娘才搞到一些機器”。
“邊登月邊修螺絲”
2 月 7 日開始,王慧文給他認為适合大模型創業的人一個個地打電話。他總在問 “你怎麼看……”,再問,“你要不要幹?” 聽到的回答經常是否定的,“太燒錢了”“這是巨頭的事”……一周後,他決定自己下場。“大家往往低估了看到大變化立刻沖進去的重要性。” 王慧文說。
美團到家事業群總裁王莆中評價王慧文 “人才識别能力超強”。因此,被王慧文聯系過的大模型人才也受到其他競争者的關注。深言科技 CEO 豈凡超就是其中一位。豈凡超在清華 NLP 實驗室讀博期間,參與研發智源研究院 “悟道” 大模型,在國際頂級刊物發表 30 多篇論文,和同學研發産品 “WantWords 反向詞典”,吸引超過 500 萬用戶。在一位深言科技員工眼中,豈凡超是難得的兼備技術和産品能力的人才,他的創新意識驅動他做科研、做産品,“他不願意做跟别人一樣的事”。
GPT4 發布後的一個月,創投圈氛圍逐漸升至沸點。各公司開發布會,展示大模型如何在辦公、營銷等場景落地,如何跟醫療、智慧交通等行業結合。投資機構開閉門會,要求被投公司跟緊變化,避免被颠覆。一年前被派去新加坡看 web3 項目的投資人回來 “猛學 AI”,不少投資經理開始攻讀技術論文。陸奇讓團隊的人做 “大模型日報” 來同步最新信息,感慨新出的論文多到他 “實在是跟不上”。
王小川提問 ChatGPT:我想做好這次創業,招更多合夥人和優秀的領軍人物,應該做些什麼?得到的建議之一是:你應該先把你的想法告訴外界。他聽取了 ChatGPT 的建議,召開媒體溝通會,第一次宣告成立百川智能,計劃年底發布對标 GPT-3.5 的大模型。
錢迅速湧入。王小川剛和朋友透露創業想法,就被問 “能不能加個親友股”。百川智能啟動資金 5000 萬美元均來自他個人及好友的支持。王興以個人身份投資王慧文的光年之外,宿華則投資了多家生成式 AI 相關公司。
目前,國内估值最高的兩家創業公司是光年之外和 MiniMax。
真格基金是最早認投光年之外的投資機構之一。真格基金管理合夥人戴雨森認為,大模型技術産品化這個過程很難由科學家完成,需要一個有商業思維的人。同時,大模型資金門檻高,需要創業者有 “融幾億美金并且有效地花出去” 的經驗。
MiniMax 公司名字取自一種算法,人們對它還不熟悉,但它的合作方有不少知名公司:4 月 18 日,火山引擎總裁譚待在發布會上專門提到 “火山引擎上跑了抖音,也跑了 MiniMax”;同一天,金山辦公發布 WPS AI,CEO 章慶元介紹其底層大模型由 MiniMax 提供。
MiniMax 于 2021 年 12 月成立,已有文本、語音、視覺 3 個模态的自研基礎模型。2023 年 3 月,MiniMax 推出面向企業用戶的 API 開放平台,支持文本和語音模型的服務調用。
聯合創始人楊斌曾任職于 Uber AI 研究院,獲得過英偉達 2018 年先鋒研究獎和微軟 2021 全球博士獎學金。MiniMax 團隊成員大多出生在 1990 年代。多位創投人士認為,開始大模型創業的最佳年齡在 35 歲以下。他們認為大模型技術更新速度 “以天計算”,年輕人能更快疊代認知,并且知識結構不陳舊。
雲啟資本是 2021 年底唯一參與 MiniMax 天使輪投資的早期投資機構。雲啟資本合夥人陳昱學計算機出身,他指出機器學習領域近年有兩個裡程碑式進展:2012 年 CNN 架構爆發,2017 年 “所有人一邊倒地去搞 Transformer 架構”,GPT、BERT、LLaMa 等主流大模型都基于 Transformer。“一個人在不同年份開始接觸機器學習,知識結構完全不一樣。” 他認為新技術已經覆蓋和超越傳統 NLP 技術,“早年的知識不是經驗,而是累贅。”
MiniMax 團隊有一種活潑的面貌,自驅力強。他們内部最初給大模型起的昵稱叫 “ABAB”,因為剛開始做語言能力訓練時,模型隻能像嬰兒那樣 “啊巴啊巴”。現在公司創立近 18 個月,他們自信模型能力國内領先。MiniMax 的企業文化受到 SpaceX 啟發,創始團隊常把做大模型比作造火箭,希望用不走捷徑的方式實現 AGI。
現在,國内更多組織把 AGI 作為願景,從零開始搭團隊、争取資源。一位大模型創業團隊成員形容此刻的局面,所有人都在 “邊登月邊修螺絲”。
“新大陸上,最值錢的不一定是黃金”
創業者們基于各自的經驗,探索 “技術——産品——商業化” 的不同路徑。
戰略層面,多位創業者同時做大模型和商業化應用。周明稱之為 “邊煉邊用”。周明是國内最早出發的大模型創業者之一,他認為瀾舟科技的模型和應用之間已經形成 “反饋鍊”,有先發優勢。王慧文将 “雙輪驅動” 定為光年之外的戰略。他認為,隻做應用和隻注重做模型都有戰略風險。前者風險在于模型能力不斷進化,很多應用場景可能被完全覆蓋。後者風險在于市場被注重商業化的對手搶占、研發後期難以衡量模型好壞,以及無法通過應用收集更多數據。
李志飛認為,OpenAI 比 Google 等對手更早 “見到真實用戶數據”,是 OpenAI 堅定研發方向、形成壁壘的重要原因。他提出 AI 應用數據分為三個階段:上線前,研發者假設的用戶數據;上線初期收集到的大量 “假數據”,比如每天流入流出的新用戶,留下無意義的互動。“絕大部分産品跨越不了這個階段。如果你不警惕,你會誤以為這就是用戶真實的需求。” 而 OpenAI 的應用已經走到第三階段,有留存用戶、付費用戶,數據更接近真實。
産品路線也各不相同。周明堅定選擇 2B,做針對特定領域的專用大模型,“節奏慢但是更務實”。他認為 2C 像是一條 “不歸路”。2C 需要把語言理解能力和做各種任務的能力放在一個模型裡,相應地模型參數規模必須大,未來會進入參數規模、數據量和算力的軍備競賽。
周明認為 2B 和 2C 是完全不同的兩條路,打算兩者都做的創業者屬于 “沒想明白”。而 MiniMax 和深言科技都認為,現階段大模型可以在通用場景發揮價值,2B 和 2C 的市場需求都能滿足,不會刻意區分。
李志飛選的方向是 to “professional consumer”,用戶是 “産消者”。他們希望為創造某些内容而消費的個體提供 AIGC 工具。
出門問問曾以 AI 識别為重點,但這個方向困難重重。做 2C 的語音助手時,李志飛發現很難滿足用戶的期望。盡管語音識别、語音合成等基礎技術很成熟,但一個語音助手産品包括自然語言理解、對話、數據查詢等 8 個環節。在上一代 AI 技術條件下,每一步都有可能出差錯——這也是 Siri 們總被調侃是 “人工智障” 的原因。他也做 2B 業務,但 “沒法第一天就有商業模式”,往往是客戶免費試用半年,再打磨産品,才有可能收到錢。大公司也在搶同樣的客戶,有些産品還免費。
李志飛處在一種苦悶的狀态裡,直到他在 2020 年的 CES 國際消費電子展得到啟發。那是在三星的展台,他突然聽到背後有說話聲,“毛骨悚然的感覺”。他回過頭,看到和他一樣高的屏幕上,用極高畫質渲染出來的數字人 Neon。他第一次被 AI 生成的體驗震撼。回去後,他調整研發重點,帶團隊開始投入生成式 AI 。
不久後,他帶團隊研發的 AI 配音平台 “魔音工坊” 帶來讓他驚喜的利潤。2023 年 4 月,出門問問發布基于自研大模型發布 AI 寫作應用 “奇妙文”,“魔音工坊” 等應用也開始與大模型整合。他樂在其中,生成了一位數字人李志飛,代替他本人參加活動。
不同的産品路徑,有一些共同的問題亟待解決。比如,怎麼讓大模型避免胡說八道?一種實踐是引入專家知識去幹預。對于 2C 産品,這幫助它們和人的價值觀對齊——這也是陸奇近期演講提到的 “OpenAI 現在優先級最高的工作”。聆心智能創始人黃民烈介紹了他們設計的一個重要規則:當他們的情感陪伴類産品識别出用戶有危險行為時,機器能以符合專業幹預技術的方式施行緊急援助。
對于 2B 産品,引入專家知識和規則幫助它們表現得更準确。第四範式于 4 月底首次公布 “以生成式 AI 重構企業軟件(AIGS)” 戰略,提出企業級 Copilot(助手)的進階 “Copilot+ 知識庫”。塗威威解釋,這可以理解為第四範式 “培養” 出大模型的基礎能力,等它進入企業後,接上内部知識庫就能 “自學”,更準确地理解任務、知道什麼工作該調用什麼資源,輸出結果也能溯源,“像一位董秘”。
多位創業者認為,考慮 2C 商業模式、監管等因素,ChatGPT 在國内并不是最适合的産品形态。王慧文願意嘗試 “Chat” 這個已經被充分驗證的機會,但他更強調 “keep open-minded”,别在起跑時就笃定哪一條路是正确的。
他計劃組織一支産品團隊,每天探索不同方向。“我們嘗試的時候可能起點很低,” 王慧文說,“要勇于從别人看不見、看不起的東西着手去嘗試。不斷收集信息,不怕 low。”
戴雨森把 ChatGPT 比作新大陸剛挖出的黃金,前往新大陸的探險者們 “去了可能發現棉花價值更大”。
更大的機會,更嚴苛的環境
陸奇在近期演講中,給出中國大模型發展第一階段的标準:誰先達到 GPT-3.5 水平,誰将能進入第一梯隊。在此之前,許多事要從零做起。
戴雨森認為 “中國幾乎沒有人有做萬卡并行訓練的經驗”。而缺少工程經驗會帶來各種意想不到的難題。一位創業者說,剛把算力加上去,機房電不夠了。他認為目前市面上絕大部分機房的電量配置,都滿足不了大模型的訓練需求。
面對算力 “卡脖子” 的現狀,李志飛盡量讓自己樂觀:“真正有意思的是你在有限的資源下做出别人做不到的事情。” 他用精打細算的方式煉模型,經常埋在論文裡研究半天,隻為了找到最合适訓練大模型某項能力的框架或超參數。他所說的合适意味着,“雖然冒一定風險但可以大幅降低成本”。
數據工程也需要一點點摸索。黃民烈介紹,聆心智能制定了包括數據搜集來源、清洗加工等各環節的标準流程,建立起相對高效的數據工程,數據體系趨于成熟用了 1 年。他認為初創團隊做數據工程的 “髒活累活” 需要的時間,不會因為技術快速發展而減少很多。
更核心的難題在于找到真正的人才。一位有技術背景的大模型項目的投資人在 2、3 月密集地和 50 多位國内頂尖的從業者交流,他認為真正擁有前沿洞察的人不超過 5 位。
王慧文希望找到這樣的人:真正向往偉大事業、對工作有主人翁精神、理解不同職能和技術,足夠聰明、足夠自信……他認為吸引越多具備這些特質的人才,團隊才能形成多種組織能力,不同職能之間有效合作。但他也承認,這樣的人才非常稀少。
定下雙輪驅動的戰略後,王慧文認為最大的挑戰來自組織能力。AGI 是執行屬性和探索屬性都很強的業務,鍊條也很長,這種事情對組織的要求很高,它比單獨探索和單獨執行,難度都高很多。
“比移動互聯網更大的機會” 激勵着每一位投身大模型的人。同時,他們也面臨比移動互聯網初期更嚴苛的監管環境。全球政府都更早介入監管。4 月 11 日,網信辦發布《生成式人工智能服務管理辦法(征求意見稿)》公開征求意見的通知。同日,美國商務部下屬的國家電信和信息管理局 (NTIA) 宣布征求公衆意見,關于如何制定人工智能問責措施。NTIA 負責人艾倫·戴維森(Alan Davidson)對《衛報》表示,美國立法者 2021 年提出 100 多項人工智能相關法案,“這跟社交媒體、雲計算甚至互聯網早期有很大不同”。當地時間 5 月 16 日,OpenAI CEO 山姆·阿爾特曼(Sam Altman)首次參加美國國會聽證,呼籲政府制定監管 AI 的措施。
創業者也将面臨來自大公司的激烈競争。移動互聯網時代的巨頭比 PC 時代更難颠覆。它們不僅在算力、資金、某些垂直領域數據有優勢,也滲透進更多應用場景,有高度成熟的商業變現體系。
王小川認為,現有的大公司雖然有資源優勢,但定目标 “想象力不足”,需要跟已有業務配合,“老闆不會把 AGI 當作公司的總目标”。大公司複雜的組織結構,還容易導緻個人目标和公司目标産生偏差。他認為大模型時代相對互聯網時代将發生 3 個重要變化:交互方式從連接改為陪伴,信息服務變為知識服務,免費模式變為付費訂閱模式。
他相信一定是新的組織引領這些變化,“兩到三年會看到一批新的巨頭”。
相比與創業公司競争,李志飛說,“我唯一怕的是巨頭。” 他創業超過 10 年,2017 年他在做智能音箱,趕上 “百箱大戰”,和大公司正面遭遇過。那是他第一次深刻意識到,“競争是很殘酷的”。最近他去矽谷跟人交流時會被問:“你怎麼了?你是受了多少折磨?” 他才意識到自己一直在談競争,不像過去在 Google 當科學家時那樣暢聊技術。
“創業很痛苦,如果沒有樂趣堅持不下去。” 他說。2020 年,AI 市場繼續下行疊加疫情,他郁悶難解。研究 GPT-3 的論文成了他的精神支撐。
如今,自研大模型讓他找回了樂趣。他經常跟他和團隊自研的大模型 “序列猴子” 聊到淩晨一兩點。最初,他像輔導功課的家長,反複教 “序列猴子” 做算術題:一個蘋果兩元,一個梨子三元。我買三個蘋果,五個梨子總共花多少錢?“序列猴子” 總是列不對方程式。他發現,大模型就像有自己的脾氣,有時堅持不改錯,有時會立刻改。
随着研究深入,李志飛理解,這不是機器産生了意識,而是大模型在各信息之間權衡,什麼是更有可能正确的答案。
4 月中旬的一個晚上,他和朋友吃飯時收到同事的消息:“序列猴子” 有了一個還不錯的新版本,讓他試試。他随意問了幾道地理題,比如 “湖北和湖南兩個省的省會人口哪個更多?” 從簡單到複雜的問題,“序列猴子” 都很好地對答。而這些看似簡單的問題與結論,實際上需要機器先理解問題中的概念,再作比較。李志飛感到驚喜,“序列猴子” 可能擁有了二階邏輯推導的能力,而他們并沒有刻意訓練過。
那一刻,他非常興奮,匆匆結束飯局跑回家,從對話、數學、多步推理等各個方面又測試了幾個小時。他發現 “序列猴子” 跟過去他做的所有 AI 系統都不一樣。過去,他明确知道機器能做什麼、不能做什麼。現在,他意識到 “序列猴子” 能聽懂問題,還不時給他意料之外的答案。
“序列猴子” 在努力理解人類的語言,李志飛在努力理解大模型——這是創業中他最珍視的部分。“也許我永遠不能完全理解它,就像真相隻能逼近。但我還是想知道 why,提出假設,做各種實驗。”
“我認為今天是非常偉大的一個時間點。” 王慧文說,他認為起步年代意味着未來能打開的空間大小。“在這個時間點起步的公司,有希望形成研發能力與商業能力的正循環”。
他把這次變化的節點類比于 1980 年代左右,個人數字設備起步的時間點。蘋果和微軟兩家公司在那個時候啟動,建立了研發和商業的正循環,成為人類數字科技進步浪潮的主要推動者,當浪潮由别人推動時,它們也有能力跟進。
不止一位創業者會從科技史、商業史的角度打量過去浪潮中誕生的創業公司,從它們的故事中尋找規律,以它們的曆程激勵自己前進。中國的大模型創業者們的競賽剛剛開始。肯定的是,競争将十分激烈,環境将十分嚴苛,賽程将十分漫長。