新京報(bào)貝殼財(cái)經(jīng)訊(記者羅亦丹)記者9月10日獲悉,“清華系”AI公司生數(shù)科技旗下視頻大模型Vidu正式推出Vidu Q1參考生圖功能,以支持7張參考圖輸入打破國(guó)內(nèi)生成上限,并在一致性、還原度等關(guān)鍵指標(biāo)上正面對(duì)標(biāo)最近爆火的Nano Banana。
生數(shù)科技方面表示,從單圖參考到多圖參考,是AI生圖在一致性上的不斷突破,“可以說(shuō)沒(méi)有一致性,就沒(méi)有大規(guī)模商業(yè)化應(yīng)用?!辈煌趩螆D參考的單一限定條件,Vidu Q1參考生圖可以指定人物、場(chǎng)景、道具進(jìn)行自由創(chuàng)作,通過(guò)多個(gè)參考對(duì)象實(shí)現(xiàn)對(duì)畫(huà)面的更強(qiáng)可控。
如下圖的“讓萊昂納多坐在霍格沃茨學(xué)院的教室里練習(xí)魔法?!陛斎氲亩鄰垍⒖紙D中包含了人物、道具、服飾、配飾等多個(gè)主體,場(chǎng)景非常復(fù)雜。
從輸出的結(jié)果來(lái)看,Vidu Q1參考生圖嚴(yán)格遵循提示詞,人物發(fā)型、五官均保持與原圖一致,每個(gè)物品位置擺放正確,且比例合理。左側(cè)亮起的臺(tái)燈照亮了萊昂納多的側(cè)臉和桌面上攤開(kāi)的書(shū)本,寵物海德薇站在紅色行李箱上毫無(wú)違和感,多個(gè)主體的融合高度一致。
生數(shù)科技方面表示,作為Vidu首款參考生圖產(chǎn)品,Vidu Q1一經(jīng)推出便實(shí)現(xiàn)對(duì)谷歌Nano Banana的全面對(duì)標(biāo),在AI生圖這一巨頭云集的賽道中展現(xiàn)出中國(guó)創(chuàng)業(yè)公司的硬核技術(shù)實(shí)力。Vidu Q1參考生圖的發(fā)布,是中國(guó)AI多模態(tài)領(lǐng)域的一次重要突破。它證明了中國(guó)團(tuán)隊(duì)不僅能夠緊跟國(guó)際發(fā)展,更能在關(guān)鍵技術(shù)上實(shí)現(xiàn)差異化創(chuàng)新甚至局部超越。
校對(duì) 穆祥桐