可靈AI在北京舉行“靈感成真”2.0模型發(fā)布會,會上正式發(fā)布全新可靈2.0視頻生成模型與可圖2.0圖像生成模型。據(jù)介紹,可靈2.0在動態(tài)質(zhì)量、語義響應(yīng)及畫面美學(xué)等多個維度繼續(xù)保持行業(yè)領(lǐng)先地位;而可圖2.0則在指令遵循、電影質(zhì)感及藝術(shù)風(fēng)格展現(xiàn)等方面實現(xiàn)顯著提升。
值得一提的是,早在3月27日,全球AI基準測試機構(gòu)Artificial Analysis便已發(fā)布最新的全球視頻生成大模型榜單,快手可靈1.6pro(高品質(zhì)模式)憑借卓越性能,成功登頂圖生視頻(Image to Video)賽道。
在本次2.0模型的迭代中,可靈AI正式發(fā)布AI視頻生成的全新交互理念——Multi-modal Visual Language(MVL)。該理念使用戶能夠結(jié)合圖像參考、視頻片段等多模態(tài)信息,將腦海中包含身份、外觀、風(fēng)格、場景等在內(nèi)的多維度復(fù)雜創(chuàng)意,直接且高效地傳達給AI。
基于MVL理念,可靈AI推出多模態(tài)編輯功能,該功能不僅局限于圖片和視頻,還可以引入聲音、運動軌跡等其他模態(tài)的信息,使用戶實現(xiàn)更為豐富的表達。為此,快手副總裁、可靈AI負責(zé)人張迪發(fā)布全新的可靈2.0大師版。這一版本全面升級視頻及圖像創(chuàng)作可控生成與編輯能力,并上線全新的多模態(tài)視頻編輯功能。
此外,可圖2.0的文生圖能力也迎來全面升級,包括大幅提升指令遵循能力、顯著增強電影美學(xué)表現(xiàn)力以及提供更多元的藝術(shù)風(fēng)格等,為用戶帶來更加出色的創(chuàng)作體驗。