近日,阿里巴巴智能計(jì)算研究所發(fā)布了一款名為EMO(Emote Portrait Alive)的生成式AI視頻模型,引發(fā)了業(yè)界的廣泛關(guān)注。然而,關(guān)于EMO是否開源的問題,卻成為了人們討論的焦點(diǎn)。
阿里emo開源嗎:
EMO以其獨(dú)特的技術(shù)優(yōu)勢(shì),實(shí)現(xiàn)了將人物肖像照片與音頻文件結(jié)合,生成出讓人物按照音頻內(nèi)容“張嘴”說話或唱歌的視頻。這一技術(shù)的出現(xiàn),不僅讓生成的頭像視頻效果更加自然生動(dòng),也展示了阿里巴巴在音視頻技術(shù)領(lǐng)域的深厚實(shí)力。
然而,關(guān)于EMO是否開源的問題,卻成為了眾多開發(fā)者關(guān)注的焦點(diǎn)。盡管EMO的技術(shù)實(shí)現(xiàn)已經(jīng)通過論文形式發(fā)表在了arXiv上,但在GitHub等代碼托管平臺(tái)上,并未出現(xiàn)官方開源的EMO項(xiàng)目。雖然有一些疑似開源的repo與EMO同名,但這些repo往往處于空倉狀態(tài),沒有提供任何實(shí)質(zhì)性的代碼或文檔。
這種情況引發(fā)了一些開發(fā)者的不滿和質(zhì)疑。他們認(rèn)為,如果阿里巴巴真的想要推動(dòng)EMO技術(shù)的發(fā)展和應(yīng)用,應(yīng)該積極開源項(xiàng)目,讓更多的開發(fā)者參與到項(xiàng)目的優(yōu)化和改進(jìn)中來。而當(dāng)前的“空倉”狀態(tài),不僅讓人懷疑阿里巴巴是否真的有意開源EMO,也讓一些對(duì)EMO技術(shù)感興趣的開發(fā)者感到失望。
當(dāng)然,也有一部分開發(fā)者對(duì)EMO是否開源持開放態(tài)度。他們認(rèn)為,即使阿里巴巴不開源EMO項(xiàng)目,只要能夠開放相關(guān)的API接口,讓開發(fā)者能夠調(diào)用和使用EMO的功能,也是一種可行的合作方式。畢竟,開源并不是唯一的合作途徑,通過API接口的合作,同樣可以實(shí)現(xiàn)技術(shù)的共享和應(yīng)用。
綜上所述,關(guān)于阿里EMO是否開源的問題,目前尚無明確的答案。不過,無論最終是否開源,我們都期待EMO技術(shù)能夠在未來得到更廣泛的應(yīng)用和發(fā)展,為音視頻生成領(lǐng)域帶來更多的創(chuàng)新和突破。同時(shí),我們也希望阿里巴巴能夠積極回應(yīng)開發(fā)者的關(guān)切和期待,為技術(shù)的開放與合作創(chuàng)造更多的可能性。