文章來源:矽星人Pro
文章作者: Yoky
2023年4月,産品經理松鵝(化名)從騰訊離職兩天後,就從深圳來到北京,加入一家基座大模型的初創公司。彼時,這家公司還沒什麼資本追捧和用戶聲量,隻有一個聽起來挺拗口的中文名字:月之暗面。
那時候這家公司的産品團隊,隻有松鵝一個人。
同月,曾經在字節跳動全程參與搭建抖音和TikTok等産品的王長虎,在中美都狂“卷”文生圖時,創業成立一家文生視頻公司:愛詩科技。
幾乎也是同一時間,在嘗試了AI口語軟件、AI換臉、AI心理咨詢等多個AI項目之後,用戶量的激增、投資人的熱情讓身在騰訊的萬磊發現:屬于AI的風口真的到了。
大模型最終要靠産品來落地,這是這些嗅覺靈敏的産品經理們看到的機會。而故事也就此開始。
松鵝來到月暗6個月後,他們做出了Kimi,又過了6個月,Kimi在全網爆了;在Sora沒火之前,愛詩的産品團隊已經開始重點突破“一緻性”的難題,反複進行疊代優化;萬磊被投資人質疑多次“AIGC應用沒有核心技術壁壘,很容易被模仿”之後,在藍馳的閉門會上遇到了剛剛從蘇黎世聯邦理工大學畢業,帶着大模型技術的姜昱辰。一個懂産品,一個有技術,他們組成了波形智能。
如果拿移動互聯網的曆史來對照,一個技術滲透到普通人生活的必經之路,就是應用的井噴。大模型領域今天似乎正在經曆相似的事情。每天都能看到一兩個新的産品誕生,走紅,被廣泛讨論,它們的目标都是成為一款“AI Native”的超級應用。
而在這些看似新生的AI明星産品背後,一個有意思的現象越來越明顯:
在它們身上你總能找到上個時代的影子,更确切一些,是騰訊和字節的影子——這兩個中國移動互聯網時期産品最強的公司,正像幽靈一樣,在中國大模型産品的上空徘徊。
01
騰訊的“門徒”
騰訊的人出來,總是很“騰訊”。他們做産品,也是忠誠的門徒。
松鵝的個人欄目叫《鵝庫》,而萬磊存着一堆張小龍的表情包。
鵝和張小龍,都是騰訊的“圖騰”。
在産品風格上,騰訊的産品經理們深受張小龍這位“微信之父”的影響。産品,是馬化騰一直強調的“連接器”,它是技術和用戶之間的連接,在騰訊的産品體系中,2C産品就是要把使用體驗做到“極緻”。
2023剛開年,松鵝還在騰訊會議團隊待的好好的,用他自己的話甚至可以說是“很開心”。
它是目前最可用的會議工具之一,甚至一度可以說是騰訊繼微信之後的下一個明星産品。在其他所有廠商将IM、會議、文檔、OA都打包整合成一個軟件的時候,騰訊把它們拆開了。
極簡,是張小龍時代提出的“少即是多”的理念,而松鵝離開騰訊會議後繼續執行着這樣的理念。
松鵝曾在社交平台上分享道:“做一個産品,添加一個功能很容易,不添加功能疊代用戶體驗很難,減少一個功能最難。大部分産品都是因為不停地加功能而變的臃腫。”簡直是張小龍産品語錄的翻譯版。
而Kimi身上确實也能找到對應的烙印。
早期打開Kimi,除了對話框,幾乎什麼都沒有。在不斷更新的版本中,它“長”出了幾個按鈕。
這些按鈕包括了“首頁”、“新會話”、“曆史會話”和“Kimi+”,和Kimi的特色能力“網頁鍊接”、“文件上傳”,将核心功能凝聚成一個個按鈕,是騰訊的另一個傳統。
為了讓用戶能夠了解按鈕的作用,Kimi中也存在着大量的“氣泡”,來進行進一步解釋。不僅如此,在Logo的下方,具有文藝感的文案,句句不同。
根據松鵝公開分享的一個有意思的例子,也能看出這種騰訊的烙印并非所有做産品的人都默認的原則。尤其是,當你的團隊也有了字節系的人——4月18号,在一些産品讨論中,松鵝提出在産品的某個位置需要一個文案。而“一位來自字節的同事覺得無可厚非:在字節做産品從來不會有這種要求,這不會提升轉化。”他分享到。
“但這裡确實得有個文案,還得是比較有功底的文案。嗯,現在差點意思。”頓了頓,松鵝講道:“我們在騰訊做産品是這樣。”
把用戶的需求一個個拆到“事無巨細”,以人為本是騰訊做産品的靈魂。目前Kimi是唯一一個國内大模型,兼具了網頁版、App小程序形态的大模型産品,一位獨立開發者對我們反饋道:“表面上Kimi設置的網頁版、APP版和小程序版和其他同類産品沒有太大的差别,但當其作為插件在網頁中使用時,Kimi的呈現效果要更好。”
右側為Kimi插件
靈活的産品形态讓Kimi更具有大衆性和普遍性,Kimi插件可以直接翻譯+整理重要信息,同時還可以進行自定義調整需求,進行個性化設置。根據公開信息,網頁插件版本是開發者自發調用API生成的,并不出自月暗團隊。
同樣由騰訊系産品經理打磨的蛙蛙寫作,産品形态上和Kimi有很多風格相似的地方。對于不同場景的拆解和功能介紹、教程導覽,在很多細節上的“較真”和“死磕”。
比如,對于一款生成文本内容的AI産品,萬磊的團隊發現,目前的模型生成能力往往并不能夠直接生成整篇可用的内容,往往部分可用需要進行二次甚至三次調整。他們給出的答案很騰訊——在大模型的生成結果中,添加了“滑詞”功能,以便于AI生産後的二次優化。
與此同時,騰訊的另一個靈魂“社交”,也快速展示在這些産品身上。
大學畢業之後,萬磊進入了騰訊,在全民K歌中負責社交關系鍊的部分,後又轉到“創新項目”部門,不斷追趕互聯網風口,做過數字人、元宇宙遊戲,陌生人交友,也做了一堆和AI相關的小項目,在不斷的探索中,他對于産品的思考越來越寬。
全民K歌推出之前,K歌已經有了标杆産品“唱吧”。那時的唱吧已經吸引和培養了一大批KOL,也在産品細節比如調音、制作MV上下足了功夫。
這盤逆風局,怎麼打?參考了以前微信借勢QQ、企業微信借勢微信的套路,全民K歌更加強調“誰在聽”而不是“誰在唱”。和微信打通之後,社交關系鍊自然而然的轉移到了K歌平台,也為後續的發展創造了土壤。
當你打開蛙蛙寫作就會發現,和其他産品不同的是,它更強調社交傳播,“邀請送會員”、“進群有禮”讓人夢回2018年全網都在“裂變”拉新之際。
我們曾與多位Agent創業者聊過當下的創業環境,他們的反饋往往是,“如今面臨的不是做不出來,而是做出來給誰用的問題”。
“找用戶”,無論是在移動互聯網時代還是AI時代,都是第一個核心問題。對于文案寫作工具而言,寫出來是一方面,給誰看是另一方面。在群裡,用戶可以溝通和交流經驗,互相分享成果,甚至通過蛙蛙寫作的渠道報名參加小說比賽。
萬磊分享道:“我們光電話訪談的用戶累計有上百個了,有時候我們會把關鍵用戶叫到辦公室,當着我們的面使用産品,發現問題後産品團隊立刻進行調整,我們希望借助自研模型把工具做細膩做透,和市面上其他套殼的寫作工具拉開差距。”
這些産品風格上的“路徑依賴”正随着産品的長大而凸顯,這些主觀、細碎甚至有些執念的做法,很騰訊。
02
字節的“繼承者”
但字節的風格幾乎是光譜的另一端。體現在新的一批AI産品上,則是它不以人為載體傳承,而強調一種産品邏輯上徹底的創新。
字節的人出來創業,帶着的是一種做産品的方法,而不是産品的風格。
“19年的時候我們組裡來了一個字節的小女生,感覺很不一樣。雖然我們平時也會看數據,但明顯她對數據和AB test更加敏感,所有的需求根據數據結果進行推演,包括好與不好,都是通過數據來評判。”萬磊回憶道。
字節系的産品跑得比較好的,産品模型基本長得很相似且粗暴簡單,推薦系統中台+足夠規模化的數據input,從内涵段子到頭條到抖音到後來小一點的懂車帝,番茄小說都一樣,而騰訊産品做得好的産品基本離不開社交關系鍊。
騰訊像文科生,做産品的都是人類社會學研究學者;而字節是理科生,灌數據、做AB測試,然後跑數據,出結果。愛詩科技産品負責人牧之這樣總結。
算法是整個“字節系”産品的靈魂,公開資料顯示,王長虎在字節跳動負責了視覺算法平台和業務中台的搭建,用算法為代表的方法論來決定産品的樣貌,這種方式同樣帶到了他的愛詩科技。
“推薦算法技術中台的打造是最困難的,他需要給足夠的空間和自由度,讓産品能夠在短時間内完成更多需求測試,同時他也需要足夠開放,對未來産品發展空間的承壓能力和适應空間。”牧之說道。
參考移動互聯網時代的抖音,幾百萬視頻播放量時搭出的推薦算法框架,到了幾百億觀看的規模,算法是不是仍然适用,仍然能夠高效的分析每個用戶的喜好。
這裡我們舉個簡單例子,用雙向标簽對照的體系,為用戶打标簽,也為内容打标簽,進行雙向匹配,這樣無論内容體量多龐大,用戶體量如何增長,這樣的機制能夠保證實現“千人千面”。
字節系信奉這套方法論,在不同的場景、不同的行業這套方法論會出現不同的結果,也會遇到不同的難題。比如,對于愛詩來說,産品經理想設計一套機制,跑一個推薦模型,怎麼讓你的Tranformer或者Diffusion模型,通過産品能夠拿到足夠多的前期數據?
“第一重要的仍然是需要知道用戶到底要什麼,他要這個視頻來做什麼,對應到我需要什麼楊的數據,第二是設計一套機制,無論是自己生産數據,采買或者爬取數據,還是強化學習來回收數據也好,input到你的模型。”牧之講道。
所以在推出PixVerse之前,愛詩産品團隊做了很長時間的時間用戶調研,為了完成第一步。
通過對國内外比較核心的專業視頻生産者的前期調查,愛詩發現,清晰度是用戶的一個核心剛需,一緻性是對視頻生成模型能否成為生産力的一個更高标準,産品通過市場調查反哺技術,技術團隊對此進行模型突破。
對于AIGC的使用場景,在早期根據曆史軌迹的推演下,隻能替代現有的一部分而很難開發新場景,且在技術發展的早期,比如文生視頻的時間隻能有3-4秒的高質量輸出,能夠滿足的需求有限,産品需要找到一個合适的切入點。
有了切入點以後的下一步,是建立一個良性的算法模型。
牧之舉了一個例子,在訓練鏡頭這個事情上,如果産品能明确好當下用戶其實最為需要的是一些專業性的鏡頭,那麼你在做數據收集和數據标注以及清晰的時候,是會存在很強的傾向性的,就是需要這些專業鏡頭的數據, 有了這樣的判斷,往往能用更少的數據和更低的訓練成本得到一個更好的結果。
随着用戶量的增長,标注的元數據越來越多,算法也就越來越靈。
目前PixVerse在海外文生視頻産品榜單中下載量連續排名靠前,也通過不停的算法優化和數據積累,形成了産品突破力,滾動的雪球開始有了實體。
03
技術與産品的新羁絆
騰訊和字節的産品風格區别,其實還暗含着一個本質的問題:技術與産品之間的平衡。
騰訊系的産品誕生和成熟于互聯網時期和移動互聯網初期,技術是現成的,需要産品提供的對用戶需求的準确理解,來把它的價值體現出來。字節系的産品在移動互聯網的另一個階段快速成長,這時候以算法為核心的技術,本身在一種不穩定中快速進步,它帶來的強大能力是頭條和抖音這類産品可以出現的根本,産品經理的“上帝”的角色就讓位給了算法技術。
這種産品與技術之間的牽絆在今天AI大模型時代,換了形式繼續籠罩在各個産品的制造過程中。
“如今做産品和移動互聯網最大的不同是,需要思考技術能解決的問題,和産品能解決的問題”。幾乎我們問到的所有産品經理,都給出了這樣的答案。但同樣的,不同的底色依然決定着問題的答案。
對于視頻生成産品,一方面模型的效果本身就與技術資源密切相關:比如顯卡、顯存的限制或者算力的不足會直接影響效果;另一方面,視頻本身存在着大量的叙事邏輯,和對于劇情的完全可控,這導緻了無法滿足理想的産品形态。于是就像字節的産品那樣,愛詩的産品設計也要很大程度從算法技術出發思考。
一開始大多數的視頻生産産品隻能生成4s的視頻,但一個電影的平均單個鏡頭都有6秒,技術要進步如何突破時長,而産品則需要思考,即便是4s的視頻,能夠使用在什麼場景。
而即便是在4s的限制下,仍然能解決傳統的影視制作中,補缺一些空鏡頭和漏幀,解決重拍補拍的成本高昂的問題。
而且在底層大模型還在不停疊代的今天,對産品細節的追求,也要建立在技術差異之上,它甚至直接決定了産品的形态。Kimi和蛙蛙寫作看似都是文本生成類的大模型産品,但技術能力完全不同。
衆所周知Kimi擅長的是長文本的輸入,能夠一口氣讀完一本《三體》,但在應用中就會發現,Kimi的長文本輸出能力不夠強,無論給怎樣的提示詞,其輸出的内容經常為1000字左右,所以Kimi的使用場景經常為“修改部分論文”、“寫小紅書文案”等等。
而蛙蛙寫作作為一款在創意文案生成上更垂類的産品,它的核心技術能力是長文本輸出和長期記憶,以小說功能作為切入點,通過對小說的背景、任務、主線劇情進行設定,蛙蛙寫作往往能夠生成幾千字的小說内容,并能夠完整保存前序劇情。對于企業級的數據庫定制和固定文件的模仿輸出,也更遊刃有餘。
“在所有文本生成中,寫小說其實是最難的。它需要嚴格按照世界觀框架輸出、人物情緒刻畫要到位、人物台詞要足夠拟人、故事反轉要緊扣設定等等。即便Sora是物理世界的模拟器,它仍然需要文字先将所有的前情全部設定好,再進行生成。未來文字創作内容将作為底層,各個獨立的多模态技術真正要落地,還是要被底層所調用才能有更大的價值”萬磊講道。
但相信産品依然是個“手藝活”的人們,并不會就此把一切都交給技術。
你可以看到,國内的通用大模型産品,在生成内容底部,往往會出現一個“點贊”和“點踩”的按鈕,這是人類自主給大模型進行的評價和反饋。
萬磊講道:“如果讓技術自己識别哪些生成内容是好的,哪些是不好的,靠技術實現很困難,但是在産品中加了一些設計,便可以反哺技術,讓生成結果越來越精準。”
更重要的是,在這個階段,産品是扔向市場的一個“鈎子”,隻有不斷的使用、不斷反饋才能不斷疊代不斷進化。隻有産品鈎得住用戶,之後的一切才有意義。
“技術的高速發展最終的結果就是越來越同質化,這時候需要産品形成差異性,我認為那時候産品經理的空間将會更大。”牧之說。
從做産品的方法,到所謂的産品哲學,再到産品與技術的關系,這些決定着中國AI未來走向的問題,某種程度都在延續着騰訊和字節在移動互聯網的故事,這兩個幽靈會繼續遊蕩在中國AI的上空。