“AI複活”,安慰還是生意?
來源:定焦(dingjiaoone)原創
時間:2024-03-20 21:38:11
來源:定焦(dingjiaoone)原創
作者: 蘇琦
編輯:金玙璠
“起死回生”這件事,過去隻在科幻電影裡見過,但今年,被“複活”的案例越來越多。
2月底,知名音樂人包曉柏用AI“複活”女兒,女兒在媽媽生日時還為她唱了一首生日歌;3月初,商湯年會上,剛去世不久的商湯科技創始人湯曉鷗以數字人的形式被“複活”,還來了一場“湯式風格”的演講;近日,還有有網友用AI技術“複活”李玟、喬任梁等已逝明星,備受争議。和逝去的親人“再見面”,這門此前隐秘小衆的生意,開始頻繁地出現在大衆眼前。但因為用到的技術不同,價格不同,效果也不同。花10元,能讓去世親人的照片“眨眼”,背後是簡單的圖像處理技術;花千元,能和沒來及道别就離開的親人視頻通話,用到的是AI換臉變聲技術;花萬元,則可以和電子屏幕裡親人的克隆數字人聊天,數字人能說會動有表情,真實感更強。“AI複活”是一門有強烈需求的生意,醞釀着億級市場,盯上這塊蛋糕的商家卻魚龍混雜。有的下載軟件就能制作“會說話的照片”進行售賣;有的本身是數字人服務商,在向B端售賣直播、會展、主持人等數字人之1外,開發面向C端的數字人定制APP;還有一批商家,看準了用戶複活親人、克隆明星的需求,用自研+接入第三方技術接口的方式,為用戶提供定制化服務。“AI複活”或許在将來會成為一個像拍照一樣常見的服務,但其中也存在數據隐私、法律倫理等問題。有業内人士表示,AI換臉變聲技術的成熟,還會讓一些人借着用戶對親人的想念和信任實施詐騙,“回憶雖好,謹防被‘割’”,他提醒道。
1
“複活”親人,需要多少錢?
目前市面上的“AI複活”産品,根據成本高低、技術難易,可以分為三個等級,也對應着用戶在AI“複活”某人之後,與親人“再次相見”的三種方式。其中最低一檔是照片驅動,俗稱talking photo(能動的照片),前幾年就有類似的APP火過一陣。利用深度學習、圖像處理等技術,就能讓照片裡人物的嘴巴和眼睛動起來;如果讓照片裡的人開口說話或唱歌,則要用到對口型(唇語匹配)和語音生成。“這些技術都已經成熟且開源,量産之後,單次成本可以壓縮到10元以内。”有10年AI創業經驗的極鍊科技創始人&總裁董慧智介紹。第二檔是表情捕捉驅動的僞直播,給真人模特換上逝者的形象和聲音,進行語音電話或視頻電話等互動,或生成祝福短視頻等。這裡面用到了語音克隆、AI換臉、動捕(表情捕捉)、深度僞造(deepfake)等技術來變人變聲。董慧智稱,這是一種特别讨巧的方式,技術不新鮮,部分AI詐騙用到的是類似的技術。動捕器材及人力成本稍高一些,需要數千元。這類“AI複活”的視頻片段在短視頻平台播放量很高,一般是小輩為家裡的老人下訂單,找人用逝者的臉和聲音與老人通話,對老人謊稱逝者在外工作,将“善意的謊言”繼續,老人一般也看不出異樣,隻是頻頻抹淚。
第三檔是近期比較火的用數字人技術“複活”親人,因為交付的産品不一樣,成本也有所不同。一般來說,通過收集人物生前的照片、聲音等數據來克隆數字人的形象和聲音,然後底層搭載大語言模型模拟逝者的思想,可與之進行實時的文字或語音交流。51數字人有這項業務,創始人陳鴻告訴「定焦」,一般産品交付的是一個帶有數字人的屏幕,大屏有電視那麼大,小屏可以是iPad那麼大。用戶登錄賬号之後,就能看到逝去親人的數字人形象,用戶可以通過語音或文字與數字人互動,産品還可以提供語音電話叫醒服務。“定制類的‘複活親人’業務,一般要5萬元以上。”陳鴻稱,因為客戶都是長期付費,後續還會不斷在細節上調優,也有一些客戶是一個家族湊錢一起做,要求更高。“AI複活”對于數據質量的要求非常高,被克隆者生前的照片、視頻或語音樣本越多、越清晰,數字人的相似度就越高。再輸入一些個人特征數據,比興趣愛好,才能模拟其性格。“素材不夠全,成本還會再增加。”陳鴻表示。因此,精度越高、數據越定制化,效果也就越接近真人,價格也更貴。所謂的精度,主要體現在以下幾個方面:人物口型準确度、分辨率清晰度、動作複雜程度、服飾發型和表情豐富度、語音(音色、語氣)相似度、是否有電音、是否有抑揚頓挫(多情感)、是否帶交互、交互是否更貼合本人性格等。放到數字人領域,需要完美克隆某個人的技術難度可謂“上不封頂”。商湯科技“複活”的創始人湯曉鷗,就是一個案例。
“數字人”湯曉鷗在年會上的演講 圖源 / 視頻截圖商湯科技數字空間事業群數字文娛事業部總經理栾青告訴「定焦」,為了還原湯老師的音容笑貌,用到了不同技術。整個制作過程中,商湯運用了自研的TTS語音生成大模型,截取了湯老師四、五段不同說話風格的聲音作為prompt(提示),總聲音素材不過十幾秒,還原了湯老師的東北口音、音色、常用的語氣詞和語調以及冷幽默的風格。此外,商湯如影數字人技術團隊采用了湯老師之前清晰有效的視頻,用商湯自研的視頻生成技術進行動作生成和場景過渡,還原走動、喝水等動作,以及微笑的表情。受限于素材不多,以及算力、成本的考量,目前很多數字人的視頻和産品看起來還是很“假”。“這些都不算是完整地‘複活’數字人,技術和服務的最高交付上限,也無法滿足人們的最低需求下限”,陳鴻稱。形象不夠像,就得用情緒價值來補,在數字人的設計上加入一些交互細節。他舉例,比如一個客戶的爺爺最喜歡老四,聊天時爺爺突然會說下個月是老四的生日了,家人要多聚、兄弟要和睦,客戶就會一下子被打動。總得來說,前兩檔用到的都是相對簡單的圖像處理、換臉和聲音克隆技術,能看到人臉、模仿聲音,但因為成本低,效果粗糙,市面上看到的還原度比較高且能動起來、能對話的都屬于第三檔數字人,越像越貴。
2
誰在靠克隆人賺錢?
從過往“複活親人”的案例可以看到,大部分不像真人且讓人出戲甚至尴尬。而随着生成式AI技術的發展,栾青觀察到,“AI複活”在技術上的可行性和真實度上都變得更高,能讓人投入、想哭,使得這類需求被進一步激發出來。由此,一條産業鍊應運而生。在這條産業鍊上,一部分是跟風商家,一部分是數字人服務商,一部分是AI從業者,還有一部分是專門做定制AI複活(複活或克隆親人、明星、企業家等)的玩家。電商平台上,有不少店鋪提供“AI複活”服務,讓照片說話的标價多為10元、50元。短視頻平台上,也有不少人以“AI造夢”“AI療愈”的名義提供類似服務。“收費便宜、效果粗糙,但這是一個長期存在的長尾市場。”董慧智稱。
這類生意也存在灰色空間,有短視頻博主發布“複活”李玟、張國榮、喬任梁等已逝名人的視頻,讓他們開口唱歌和說話,雖然稱“旨在緻敬和紀念,無商業目的”,但此類視頻獲得的流量頗高,還有部分會借此引流做“親人複活”生意。同時,一些提供“AI複活”服務的店鋪也注明“隻做懷念,人臉識别請繞道”。目前,技術成熟的數字人服務商和AI從業者,更多是将商業模式放在B端,比如AI客服、數字人直播、AI老師、A主持人、AI醫療等,有部分推出了面向C端的類似工具,但并未大規模宣傳。有網友曾用大模型初創公司MiniMax的語音大模型,将一段90秒的音頻素材進行語音克隆,并用MiniMax旗下的海螺問問APP生成智能體,與之進行語音對話。矽基智能也有“生命克隆和數字永生”業務,其旗下的炎帝大模型基于用戶提供的數據克隆出數字人,用戶則可以通過DUIX APP與數字人實時交互。
矽基智能DUIX APP定制數字生命
陳鴻和團隊主要做的是高精度定制市場,平均一單5萬元起,圍繞大客戶開發場景,比如數字墓地,去墓地緬懷先人時,先人從電子屏裡走出來跟大家聊天;比如紀念館智能工程,包括建築空間搭建等;比如名人“複活”,用初期古畫“複活”了朱熹等。
“提供定制服務的公司,不僅考驗底層技術能力,更考驗的是渠道深度以及服務的落地程度,這決定了能否讓用戶真正把數字人用起來。”陳鴻認為。從技術提供方的角度來看,栾青認為,商湯如影的定位就是通過數字人技術賦能各個行業,誰更了解行業,誰更能下場服務好用戶,誰有更深度的解決方案,誰就能吃到更多蛋糕,“複活親人不是一個純粹從技術角度就可以做的生意。”“AI複活這門生意更适合中型團隊去做”,董慧智分析,大公司的運營和研發成本很高,同樣一套技術,他們會優先去做标準化、批量化、适用更多場景的B端生意。陳鴻也表示,大廠不願意做,小團隊沒有實力做,這個市場年收入500萬到1億,是中型團隊的機會”。目前看來,“AI複活”看似門檻不高,但真正做好還要面對很多難題。當前,“AI複活”還存在技術受限、素材儲備缺乏、家中有人反對等局限,普及仍有難度。大部分數字人需要攻克的技術難點是,能否做到人機難辨。栾青提到,數字人在說話、動作、場景銜接等方面已經向前進了一步,但在較長時間的交互過程當中,仍然未能達到真正的人機難辨,在情感傳達、理解力、意識等方面還有待完善。而真的想讓一個人“複活”,細節體現在方方面面。陳鴻以一個交互場景舉例說,在與數字人爺爺對話時,如果用戶問到了數字人數據庫裡沒有的信息,比如“誰是尼采”,數字人就會跳轉到大模型,根據公開的答案回答,雖然可以持續進行多輪對話,但就會很假,用戶的沉浸感就會被打斷。
4
“AI複活”,仍需敬畏
“AI複活”的需求旺盛,但不是所有人都持支持态度,背後隐藏的隐私安全和倫理問題也不可忽視。 支持派認可的是其提供的情緒價值,認為“複活”親人,是對生者的慰藉和對遺憾的滿足,是技術向善的例子。
質疑派則認為人永遠不可能“複活”,也無法進行“授權”。即便“AI複活”得到了親屬的授權和認可,但逝者本人的意願無從得知。“數字永生沒有那麼容易,即使使用大模型,最終複刻出來的隻是一個長着相同面孔的GPT,當他以相似的記憶和遠勝于本人能力和智商跟你對話時,你的感受一定會好嗎?”董慧智反問。3月16日,針對兒子肖像被短視頻創作者侵權使用一事,喬任梁父親表示不能接受,感到不舒适,希望對方盡快下架,“他們未征求我們同意,是我侄女刷到視頻發給我的,這是在揭傷疤。”如果克隆數字人出現問題,對生者可能将帶來二次傷害。太多影視劇作品探讨過其中的倫理困境和人性幽微。2013年播出的《黑鏡》,其中一集講的便是女主“複活”了在車禍中去世的丈夫,雖然複制了丈夫的記憶和軀體,卻無法複制情感和選擇,這位AI丈夫無需睡覺、不會受傷,隻會呆闆地按照命令行事。女主意識到“你不是你,你隻是漣漪”,最終将機器人鎖在閣樓上,卻怨恨自己離不開這虛假的真實。
随着“AI複活”産業鍊的成熟,“複活親人”“克隆明星”的需求和案例增多,其中涉及的隐私數據洩露、AI詐騙等諸多法律風險,也受到關注。現實生活中,通過AI換臉實施詐騙的案例時有發生。今年315晚會就曝光了多起利用AI技術換臉變聲成親人,實施詐騙的案例。此外,假冒名人也是騙局中的重災區。今年3月,劉德華經紀公司映藝娛樂通過微博發布聲明,稱劉德華聲音被克隆僞造,提醒各方人士警惕騙局。複刻親人時,為了更高的還原度,用戶隻能對技術提供方保有更大的開放度,這就決定了用戶很難保護自己,一旦遇到騙子,很難界定到底是服務還是詐騙。對此,陳鴻建議,想要“AI複活親人”的用戶,在下單前應該簽署合同,規定數字人的各項權利屬于個人,以及提供的個人信息不被洩露。“AI的發展是超速的,而安全問題不管是從法律層面、文化層面、公民意識層面還是技術層面的,都處于滞後狀态。”董慧智稱,最終産業的發展還是要靠從業者自律和監管條例的規範。栾青稱,行業的規範和安全是業務發展的大前提。在中國信通院牽頭下,商湯聯合多家AI公司共同制定了“可信數字人”的标準。不可懷疑的是,人和AI的關系會在今後變得更加緊密和多元,“AI複活”這件事,以後有可能會成為一個标準服務,就跟打印一張照片一樣簡單。随着技術進步,“AI複活”的概念還在繼續升級,比起一段視頻、一個聊天機器人産品,有人提出了數字永生、數字陪伴、随身親人等概念,“有富翁在自己還活着的時候,就開始着手複制自己,搭建自己的這種數字永生庫”,董慧智稱。2015年,俄羅斯億萬富翁德米特裡·伊茨科夫發出倡議,宣稱到2045年将為所有人打造一副機器人身體來實現永生,這項計劃面臨一定争議。2022年,伊隆·馬斯克在推特上提到已經将自己的大腦上傳到雲端,并與自己的虛拟版本交談過,但有人認為這是馬斯克在宣傳自己的腦機接口公司Neuralink。随着“AI複活”褪去神秘感,行業或許也會開始進入價格内卷的時代,如果不想出現“劣币驅逐良币”的情況,行業還需保持敬畏之心。