文章來源:量子位
作者:白交 西風
大家好,我們又見面了。
在商湯2024年年會上,湯曉鷗數字人現身,來了一場跨越時空的重逢。
按照以往習慣,每年湯老師都會說上一段脫口秀,已經成為商湯年會保留節目。
熟悉湯老師演講都知道,他是被人工智能事業耽誤的“脫口秀大師”,如今以數字人的形象,再度用幽默的方式與我們相見。
除了被他的幽默感染,不少人還被逼真的效果所驚豔,堪稱“年會最佳彩蛋”。
并由此引發大家對湯教授的懷念。
01
湯曉鷗數字人現身商湯年會
不講企業經營,也不講公司管理。還是老規矩,唠兩句嗑。
每年湯曉鷗演講的開場都是“我們先來複習一下去年的演講”,今年數字人也不例外。
按照商湯CEO徐立的話說,這是特有的湯氏套娃演講風格。
複習之前,他被cue到“彈鋼琴”,結果他說:今年沒接到通知啊。
到了正兒八經的複習環節,結果已經有人會搶答了。(Doge)
首先他說道:自己的推薦是有一點前瞻性的。嗯,确實是這樣的。
比如《波西米亞狂想曲》第二年就斬獲奧斯卡;還有“人類文明的起點是一根愈合的大腿骨”結果被引用到《流浪地球2》中李雪健老師拯救地球去了;最後還是聊到了他多次提及的“大兄弟”——宮崎駿,重出江湖拍了部《蒼鹭與少年》……
他感歎像宮崎駿這樣的大師創作并不容易,“人生中最重要的事就是很麻煩的”,對此他也深有體會。
比如徐立每次深夜找他要聊聊的時候,他都有這樣的感覺。對此他的解決方案是:
既然解決不了麻煩的問題,那就要解決麻煩的人。所以索性不接他的電話。
後來麻煩的人越來越多,他就直接選擇關機。
之後,他提及了最近上映的《熱辣滾燙》、東北取材電視劇《漫長的季節》,并借着《漫長的季節》結尾橋段“火車在天地裡往前開”,談到商湯也坐着新洲樓下小火車,在AI這條路上往前開。
你看要不說咱們有前瞻性呢,小火車在2021年就備好了,就等着《漫長的季節》火一把呢。
談到今年春晚最幽默的新疆人小尼,他作為東北人不服氣,于是推薦了一部小品《吃面條》。并介紹了這背後的花絮,正是因為編導最後開播前确定讓演員上場,才有了春節第一部小品。
借此就來到了他以往多次提及“原創”這件事。不得不說,這很湯式風格。
堅持原創這件事,是留給有勇氣的人做的;而真正支持創新的人,是有勇氣擔責的。
也因為這樣的堅持,才有了喜劇事業蓬勃發展,才有了很多優秀的喜劇工作者。
趙本山、趙麗蓉、馮鞏和我。
(傳下去,這是四大喜劇天王)
最後他談到以前的喜劇之所以那麼好看,是因為時間的沉澱才成為經典。也許前路一片迷霧,而他們隻是一群選擇出發,并堅信趕路的人。
還是一樣的引經據典,還是一樣的湯式風格,這樣一段不足十分鐘的數字人演講已經讓人感懷。
AI的高級意義。
動容的同時,也着實被技術細節驚豔到了。比如中場湯老師還喝了一次水。
效果這麼逆天嗎?其他家都是正臉,這個低頭和手部動作都挺自然的。
02
打破次元的如影數字人技術
真實世界的湯曉鷗老師已經與我們告别。這一次特殊演講的開篇,就提到讓湯老師“跨越次元”的,是商湯如影數字人技術。
最早在去年四月,商湯發布“日日新”大模型體系,如影(SenseAvatar)首次亮相。
據了解,僅需要5分鐘真人視頻素材,如影就可以生成出動作聲音自然、口型準确、多語種精通的數字人分身。
3個月後,商湯“日日新”大模型體系全面升級,如影也進化到了2.0版本。
語言方面,如影2.0打造的數字人将英語、日語、西班牙、阿拉伯語等多語種的精準度提升30%以上,而且口型和語音匹配得更加自然。
生成效果方面,如影2.0支持實現影級4K高清視頻的輸出,成片質感再度提升。
同時也帶來了新玩法,用戶可通過輸入提示詞自動生成與描述匹配的專屬數字人形象,還是可以實現數字人歌唱功能的那種。
03
電影照進現實
當湯曉鷗數字人現身為大家表演脫口秀的那一刻,其自然逼真的表現效果讓不少網友為之震驚,直呼這就是《流浪地球2》照進現實。
這一場景,就如電影中,科學家圖恒宇通過量子計算機“複活”了其因車禍去世的女兒:
其實,類似案例如今正在更為頻繁地照進現實。
比如,音樂人包小柏同樣依靠AI技術,“複活”了女兒。
△抖音熱榜
2021年包小柏的女兒因罕見疾病去世,年僅22歲。經曆失去愛女的悲痛後,包小柏決心攻讀博士開始鑽研AI技術,期望能在虛拟世界中保存女兒的存在。
經過反複探索,包小柏如願複刻出了“數字女兒”,在包小柏妻子生日當天,“女兒”還為媽媽唱了一首生日歌,為這個家庭帶來了些許慰藉。
△來源:紅星新聞
B站up主吳伍六,前段時間用AI工具生成了奶奶的虛拟數字人,也引起了不小關注。
隻見視頻中,數字人“奶奶”講着流利的湖北的方言與up主對話。
如奶奶生前一樣,囑托其父親“别喝酒,要節約,别打牌”:
事實上,自生成式AI技術興起以來,一直有人在探索用AI“複活”親人這種方式來寄托思念。
比如在三年前,當時最先進的對話系統,還是由GPT-3驅動。一位因未婚妻離世而備受折磨的青年約書亞,就決定用技術“複活”亡妻。
根據程序設定, “她”和人類一樣有着生老病死,每說一句話,壽命就減少一點。
當“她”隻剩20%壽命後,會開始胡言亂語。當系統壽命耗盡到0%,虛拟人的生命也走向終結。
如今,随着技術發展逐漸成熟,遠去之人的身影已經可以做到具象化。說話風格、語音語調、還有外在形象也都能完整地保留。
這段時間,視頻生成的進展如火如荼。像阿裡就發布了個由音頻驅動的肖像視頻生成框架——EMO。
輸入單張參考圖像,以及一段音頻(說話、唱歌、rap均可),就能生成表情生動的AI視頻。
于是就有人生成哥哥張國榮,為大家帶來一首陳奕迅粵語版的《無條件》。
或許之後随着技術逐漸進化,人類的思念也将有實實在在的歸處。
最後,沒想到還能再以這種方式見到湯曉鷗教授。感念!