不知道你有沒(méi)有刷到過(guò)這些視頻。
鏡頭里,不同國(guó)籍、不同膚色的外國(guó)美女們集體操著一口流利的中文侃侃而談,她們有的能默背論語(yǔ),有的喊著要做中國(guó)好媳婦。
此話一出,可是把每一個(gè)路過(guò)的大爺大媽哄得心頭一熱。于是,中國(guó)人樸素的熱情和好客,溫暖了每一條視頻的評(píng)論區(qū)。
不過(guò),但凡是沖過(guò)浪、稍微有點(diǎn)辨別能力的差友們,應(yīng)該都覺(jué)得這玩意一眼假。
因?yàn)檫@些數(shù)字人很好辨認(rèn),雙目無(wú)神、口型難對(duì)、肢體僵硬,再加上中文流利得異常,基本可以鑒定為 100% AI 生成,人含量為 0。
但最近,世超卻發(fā)現(xiàn)這幫數(shù)字人好像超進(jìn)化了。
下面這幾個(gè)直播間,我估計(jì)俄羅斯美女本人來(lái)認(rèn),估計(jì)也不一定能看得出到底哪個(gè)是數(shù)字人。
正確答案是,除了最右邊的,其他全部都是。
沒(méi)錯(cuò),現(xiàn)在的數(shù)字人不光能對(duì)口型和表情,甚至都有轉(zhuǎn)頭、低頭看手機(jī)這種大動(dòng)作。
你可能以為這應(yīng)該是什么專業(yè)設(shè)備搓出來(lái)的,但其實(shí)世超現(xiàn)在用我的手機(jī)隨手一拍,也能整個(gè)八九不離十。
比如,我花了兩分鐘時(shí)間,就復(fù)刻出了一個(gè)隔壁差評(píng)君聲優(yōu)出來(lái)。這活人感不足的表情,和似笑非笑的嘴型,比蛋蛋本人都更像真人。
當(dāng)然了,這不是世超我有啥秘訣,而是百度慧播星數(shù)字人里面自帶的一個(gè)免費(fèi)功能【 一鍵開(kāi)播 】。咱們只要發(fā)一條 2 分鐘的露臉視頻,就能得到一個(gè)賽博分身。
不了解數(shù)字人的差友可能不知道,這事有點(diǎn)牛的。
通常來(lái)說(shuō),數(shù)字人的聲音和外形都得分開(kāi)兩次處理。而且,一般要求素材 5 分鐘起步。因?yàn)樯蟼饕曨l時(shí)越短,克隆的難度越大。
百度這是拿一份錢(qián),高效地干完兩個(gè)人的活。
世超我這段素材清晰度還賊低,你現(xiàn)在用手機(jī)前置錄一個(gè)上傳,表情捕捉和口型效果會(huì)比我好一大截。
而且,生成好了之后,點(diǎn)一下右下角的預(yù)約開(kāi)播,就能直接開(kāi)業(yè)上崗。速度比發(fā)一條朋友圈還快。
可惜,火鍋主播因?yàn)樗夭牟灰?guī)范,分身失敗了
當(dāng)然了,世超只是外行小白,就純粹弄著玩的。但在真正的商家手上,那數(shù)字人就是實(shí)打?qū)嵉纳a(chǎn)力了。
開(kāi)頭那些以假亂真的直播間大家也看到了。后來(lái)世超蹲在百度各種直播間里抓數(shù)字人,卻屢戰(zhàn)屢敗,見(jiàn)識(shí)了它們各種騷操作。
你可能還是認(rèn)為我在搞抽象,覺(jué)得 AI 生成的,說(shuō)破天也不可能真到哪去,哪用得著這么仔細(xì)辨別。
下面這個(gè)女裝直播間,我覺(jué)得如果我不說(shuō),在座應(yīng)該很難有人通過(guò)這短短幾秒的動(dòng)圖,識(shí)破這是 AI 。
主播不僅可以摸頭發(fā)、摸嘴擋臉,甚至是出畫(huà)來(lái)更換衣服、換包。不管怎么遮擋,都可以保持唇形和面部的高度一致。
而且,它的話術(shù)也不是傳統(tǒng)數(shù)字人那樣機(jī)械式地重復(fù)好聽(tīng)話,各種帶場(chǎng)子、逼單的話它是一套又一套。
感覺(jué)氣氛到位了,突然說(shuō)要給大家發(fā)一波紅包。“ 呃這樣好吧,今天比較特殊,那我再做一波補(bǔ)貼,我臨時(shí)做的決定,好不好。”
紅包發(fā)完之后,還不忘熟練地敲打一下直播間潛水的人。
“ 這件衣服以后我不會(huì)再做了。因?yàn)檎娴奶y做了,我把我工廠的工人都逼瘋了 ”、“ 這批是我給大家爭(zhēng)取到的 1000 件,你要是搶不到,之后我不會(huì)再翻單了。”
這一套話術(shù)灌下去,誰(shuí)能忍住不搶一下。俄羅斯美女來(lái)了,都得在直播間買(mǎi)兩件衣服再走。
后面,世超專門(mén)去了解了一下。才知道,慧播星數(shù)字人的背后是有多個(gè)智能體的。
簡(jiǎn)單來(lái)說(shuō),就是有一個(gè)腦子負(fù)責(zé)當(dāng)主播,還有一個(gè)腦子負(fù)責(zé)當(dāng)運(yùn)營(yíng),還有一個(gè)可能負(fù)責(zé)場(chǎng)控調(diào)度。
所以,百度的數(shù)字人不僅僅是單純地文本宣讀器,它可以一邊跟你嘮嗑,一邊及時(shí)地發(fā)紅包、促單、開(kāi)價(jià),同時(shí)直播間有人要看產(chǎn)品細(xì)節(jié),它能立馬把鏡頭切換過(guò)去。這些操作和反饋,它都可以實(shí)時(shí)響應(yīng)。
這早就跟那些僵硬地朗誦“ 我愛(ài)中國(guó) ”的數(shù)字人,不是一個(gè) level 的了。
我舉個(gè)最簡(jiǎn)單例子,就說(shuō)賣(mài)車(chē),這事一般數(shù)字人根本干不了。這類復(fù)雜大件,顧客是一定要看到實(shí)物細(xì)節(jié)的。比如內(nèi)飾、后排空間等等,不然說(shuō)破嘴皮他們都不會(huì)多看一眼。
結(jié)果,世超我在嵐圖的直播間問(wèn),能不能看看車(chē)?yán)锛?xì)節(jié)。
主播接完“ 可以的寶寶 ”之后,馬上就給我切到了車(chē)內(nèi)直播的機(jī)位,還調(diào)出了四五個(gè)內(nèi)飾的細(xì)節(jié)鏡頭,生怕我有哪塊走線沒(méi)看清。就這貼心程度,難怪讓?shí)箞D試駕率提高了幾倍。
新能源車(chē)行業(yè)還不是被數(shù)字人搶飯碗最嚴(yán)重的,隔壁的教育教輔,數(shù)字人的轉(zhuǎn)化率快比真人還要高了。
不過(guò)倒也不難理解,講課和查資料就是 AI 的老本行啊。
而且,百度也把模型這塊給拉滿了,提供了文心 4.0、文心 4.5,還有 DeepSeek-R1 和慧播星定制四種選擇。
在賣(mài)書(shū)的直播間里,它可以從三國(guó)聊到紅樓夢(mèng),從語(yǔ)數(shù)英聊到政史地。所以,三千多塊錢(qián)的貴價(jià)學(xué)習(xí)機(jī),數(shù)字人都能賣(mài)得動(dòng)。
你也不用擔(dān)心,它會(huì)不會(huì)跟賣(mài)衣服一樣瘋狂催單,反而讓聽(tīng)課的寶爸寶媽們出戲。
因?yàn)榛鄄バ沁€有一個(gè)功能叫【劇本模式】。簡(jiǎn)單來(lái)說(shuō),就是你可以給它立一個(gè)劇本。比如董宇輝這種博古通今的講師,或者牙尖嘴利的帶貨主播。它就能根據(jù)劇本內(nèi)容實(shí)時(shí)調(diào)整語(yǔ)調(diào)、表情和動(dòng)作,聲形音高度統(tǒng)一,且情緒轉(zhuǎn)換和動(dòng)作銜接都能像真人一樣自然流暢。
有了劇本人設(shè)的打底,再加上多模型和多智能體的調(diào)用,才讓數(shù)字人從【形象 感知 行動(dòng)】全方位地?cái)M人。
這幾個(gè) buff 里但凡少了疊了一層,都沒(méi)法做到百度慧播星數(shù)字人這樣的高說(shuō)服力。
當(dāng)然了,哪怕人設(shè)寫(xiě)得再好,賽博世超也沒(méi)辦法成為第二個(gè)董宇輝。AI 分身的個(gè)人魅力,和頭部主播比還是差了不少。
但僅一年多,它們就從一開(kāi)始嘴型都對(duì)不好,到可以匹配手勢(shì),再到現(xiàn)在百度這套高說(shuō)服力數(shù)字人。世超也才后知后覺(jué)地發(fā)現(xiàn),原來(lái)我們已經(jīng)過(guò)了討論數(shù)字人真不真的階段,它早在實(shí)打?qū)嵉貛蜕碳覓赍X(qián)了。
作為全棧式數(shù)字人直播,百度在站內(nèi)對(duì)數(shù)字人做額外的流量?jī)A斜。
比如前面的女裝直播間一個(gè)月能賣(mài) 15 萬(wàn),收益率被提高了 30%。有的女裝直播間甚至可以做到 GMV 提高 60%。一個(gè)叫【東北翠花在東北】農(nóng)產(chǎn)品直播間,數(shù)字人讓它一季度賣(mài)了 50w ,單量漲了十倍。
甚至最近美國(guó)瘋狂關(guān)稅轟炸后,百度數(shù)字人更是成了不少外貿(mào)人的救命稻草。
突然的天災(zāi),使得很多商家根本來(lái)不及反應(yīng)。出海美國(guó)的工廠基本 50% 的訂單都受影響,不少客戶直接要求退貨。有商家和世超說(shuō),自己身邊主做美國(guó)市場(chǎng)的工廠大部分停工了。
當(dāng)然了,美國(guó)不能進(jìn),還有大把其他市場(chǎng)可以做。但換陣地,就意味著主播、運(yùn)營(yíng)、直播間都需要重新招募和搭建。
工廠和庫(kù)存停擺一天,對(duì)商家都是巨大的成本壓力。之前交個(gè)朋友的主播朱蕭木說(shuō)過(guò):“ 電商的死法只有一種,就是庫(kù)存沒(méi)管好。”
這個(gè)時(shí)候,搭建快、支持多語(yǔ)種的數(shù)字人,就成了很多商家爭(zhēng)分奪秒的首選了。
商家們可以只花幾個(gè)小時(shí),就快速地搭一個(gè)可以上線的直播間。并且,不需要再額外招聘外語(yǔ)主播,因?yàn)榛鄄バ菙?shù)字人支持 9 種語(yǔ)言。據(jù)了解,該功能也將盡快全量上線,規(guī)模化支持商家拓展海外市場(chǎng)。
最重要的一點(diǎn)是,它是真的省錢(qián)啊。
一個(gè)主播給我算了一筆賬,就算是運(yùn)營(yíng)和出鏡全都靠自己,僅搭建最基礎(chǔ)直播間也起碼得三部手機(jī)起步。
要是想要專業(yè)一點(diǎn),場(chǎng)地租金、燈光設(shè)備、收音器材等硬性投入都跑不了,頭部直播間每月得耗資數(shù)十萬(wàn),小品牌也少說(shuō)數(shù)萬(wàn)。
但數(shù)字人就是拍一段視頻,一點(diǎn)電費(fèi)和流量錢(qián)。如果在百度站內(nèi)播,數(shù)字人使用是完全免費(fèi)的,連服務(wù)費(fèi)都沒(méi)有。
這一兩年時(shí)間,百度還在不斷壓縮成本,現(xiàn)在后臺(tái)數(shù)字人的運(yùn)算處理成本只有半年前的 1/3。
不過(guò),即便這行已經(jīng)脫胎換骨、天翻地覆了,很多人應(yīng)該和世超一樣感知不深。因?yàn)樵蹅冞€是天然地覺(jué)得直播門(mén)檻很高,用數(shù)字人直播就更是想都不敢想的事。
所以,百度也一直在嘗試降低門(mén)檻,從原先需要上傳半個(gè)小時(shí)才能生成,到現(xiàn)在 2 分鐘就夠了。這次的一鍵開(kāi)播,更是把門(mén)檻踩爛了,讓數(shù)字人直播變得比發(fā)個(gè)朋友圈還簡(jiǎn)單。
真正做到一部手機(jī),人人都是主播。
畢竟,判斷一個(gè)直播間好壞的標(biāo)準(zhǔn),從來(lái)就不是它到底是不是真人在播,而是看它能不能精準(zhǔn)地接住你的梗,能不能在你需要的時(shí)候及時(shí)遞上你想看的產(chǎn)品細(xì)節(jié),能不能用實(shí)打?qū)嵉膬?yōu)惠和服務(wù)把你留住。
當(dāng)“數(shù)字分身”能比真人更懂運(yùn)營(yíng)、更能說(shuō)會(huì)道、還能 7x24 小時(shí)全年無(wú)休時(shí),“ 人人都是主播 ”就不再是一句空泛的口號(hào),而是一個(gè)馬上就會(huì)實(shí)現(xiàn)的未來(lái)。
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。