自從OpenAI公布了Sora后,震爆了全世界,但由于其技術(shù)的不成熟和應(yīng)用的局限性,未能大規(guī)模推廣,只有零零散散的幾個(gè)公布出來的一些視頻。昨日,快手成立13周年,可靈(Kling)大模型發(fā)布,體驗(yàn)后不由得感嘆,炸裂,太震撼了,快手可靈,除了那個(gè)沒發(fā)布的Sora之外,基本碾壓所有同行。
官網(wǎng)介紹鏈接:https://kling.kuaishou.com/
現(xiàn)在用戶已經(jīng)可以在快影app里申請(qǐng)免費(fèi)試用,審核通過后即可使用。
話不多說先放圖
核心功能解析
可靈的核心功能主要集中在以下幾個(gè)方面:
1.文生視頻:用戶只需輸入文本描述,即可生成對(duì)應(yīng)的視頻內(nèi)容。根據(jù)官網(wǎng)信息,可靈能夠生成長(zhǎng)達(dá)2分鐘的視頻,盡管目前大多數(shù)案例為5秒鐘的短視頻,但其穩(wěn)定性和逼真度已備受好評(píng)。
2.動(dòng)作捕捉與生成:可靈可以通過上傳圖片生成動(dòng)態(tài)視頻,支持多種風(fēng)格,包括寫實(shí)和卡通。相比其他同類產(chǎn)品,可靈在動(dòng)作的流暢性和自然度上有顯著優(yōu)勢(shì)。
3.多樣化創(chuàng)作:可靈支持多種視頻風(fēng)格和創(chuàng)作形式,用戶可以根據(jù)需求選擇不同的創(chuàng)作模板和效果。
特點(diǎn)
1.大幅度的合理運(yùn)動(dòng)。可靈采用3D時(shí)空聯(lián)合注意力機(jī)制,能夠更好地建模復(fù)雜時(shí)空運(yùn)動(dòng),生成較大幅度運(yùn)動(dòng)的視頻內(nèi)容,同時(shí)能夠符合運(yùn)動(dòng)規(guī)律。
2.長(zhǎng)達(dá)2分鐘的視頻生成。得益于高效的訓(xùn)練基礎(chǔ)設(shè)施、極致的推理優(yōu)化和可擴(kuò)展的基礎(chǔ)架構(gòu),可靈大模型能夠生成長(zhǎng)達(dá)2分鐘的視頻,且?guī)蔬_(dá)到30fps。
3.模擬物理世界特性。基于自研模型架構(gòu)及Scaling Law激發(fā)出的強(qiáng)大建模能力,可靈能夠模擬真實(shí)世界的物理特性,生成符合物理規(guī)律的視頻。
4.強(qiáng)大的概念組合能力?;趯?duì)文本-視頻語(yǔ)義的深刻理解和 Diffusion Transformer 架構(gòu)的強(qiáng)大能力,可靈能夠?qū)⒂脩糌S富的想象力轉(zhuǎn)化為具體的畫面,虛構(gòu)真實(shí)世界中不會(huì)出現(xiàn)的的場(chǎng)景。
5.電影級(jí)的畫面生成。基于自研3D VAE,可靈能夠生成1080p分辨率的電影級(jí)視頻,無論是浩瀚壯闊的宏大場(chǎng)景,還是細(xì)膩入微的特寫鏡頭,都能夠生動(dòng)呈現(xiàn)。
6.支持自由的輸出視頻寬高比。可靈采用了可變分辨率的訓(xùn)練策略,在推理過程中可以做到同樣的內(nèi)容輸出多種多樣的視頻寬高比,滿足更豐富場(chǎng)景中的視頻素材使用需求。
優(yōu)勢(shì)
1.高穩(wěn)定性:可靈在生成視頻時(shí),能夠保持動(dòng)作的連貫性和流暢性,避免了大幅度動(dòng)作導(dǎo)致的變形問題。
2.創(chuàng)新性:可靈通過先進(jìn)的AI算法,實(shí)現(xiàn)了從靜態(tài)圖像到動(dòng)態(tài)視頻的無縫轉(zhuǎn)換,極大地提升了用戶的創(chuàng)作體驗(yàn)。
3.易用性:用戶無需具備專業(yè)的技術(shù)背景,只需簡(jiǎn)單的操作即可完成視頻創(chuàng)作,真正做到了讓AI視頻創(chuàng)作變得觸手可及。
推薦使用NVIDIA RTX 40 顯卡做模型推理,購(gòu)買地址如下:
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/131110.html
隨著大型模型技術(shù)的持續(xù)發(fā)展,視頻生成技術(shù)正逐步走向成熟。以Sora、Gen-3等閉源視頻生成模型為代表的技術(shù),正在重新定義行業(yè)的未來格局。而近幾個(gè)月,國(guó)產(chǎn)的AI視頻生成模型也是層出不窮,像是快手可靈、字節(jié)即夢(mèng)、智譜清影、Vidu、PixVerse V2 等。就在近日,智譜AI秉承以先進(jìn)技術(shù),服務(wù)全球開發(fā)者的理念,宣布將與清影同源的視頻生成模型——CogVideoX開源,以期讓每一位開發(fā)者、每一家企...
近期,快手平臺(tái)又又又成為了焦點(diǎn)。就在OpenAI 當(dāng)家花旦 Sora 的公測(cè)還遙遙無期時(shí),快手就率先祭出了對(duì)標(biāo)的當(dāng)家產(chǎn)品可靈。得益于其逼真、高清和與Sora不相上下的視覺表現(xiàn),它迅速贏得了全球網(wǎng)民的喜愛。據(jù)快手,可靈申請(qǐng)用戶已經(jīng)近70 萬(wàn),已超30 萬(wàn)用戶使用趁著熱,快手地了可靈網(wǎng)頁(yè)版實(shí)操:中英拼寫毫無壓力 還可以一鍵生成視頻雖然大模型看上去能說會(huì)道,其實(shí)此前還是個(gè)不會(huì)寫字的文盲,無論是漢字還是英...
AI視頻生成賽道風(fēng)起云涌,國(guó)內(nèi)外新穎的文生、圖生視頻產(chǎn)品層出不窮。在各大廠商的內(nèi)卷之下,當(dāng)下的視頻生成模型各方面已經(jīng)接近以假亂真的效果。例如,OpenAI 的 Sora 和國(guó)內(nèi)的 Vidu、可靈等模型,通過利用 Diffusion Transformer 的擴(kuò)展特性,不僅能夠滿足各種分辨率、尺寸和時(shí)長(zhǎng)的預(yù)測(cè)要求,同時(shí)生成的視頻更符合物理世界的表現(xiàn)。但與此同時(shí),大部分視頻生成模型的準(zhǔn)確程度、遵循指令...
前幾個(gè)月OpenAI大名鼎鼎的Sora 一經(jīng)發(fā)布,似乎象征著視頻領(lǐng)域已經(jīng)進(jìn)入了生成式 AI 時(shí)代。不過直到今天,我們?nèi)匀粵]有用上OpenAI 的官方視頻生成工具,等不及的人們已經(jīng)開始尋找其他的方法。其中不乏一些國(guó)內(nèi)的廠商如快手的可靈等等。而在近日,一款全新的開源視頻編輯工具 Clapper 引發(fā)了人們的關(guān)注。與其他的文生視頻或者文生視頻工具不同,這款工具的設(shè)計(jì)目的并非取代傳統(tǒng)視頻編輯器,或使用 3...
摘要:第一剪映剪映,來自抖音旗下的自媒體視頻剪輯和后期軟件??偨Y(jié),老蔣個(gè)人建議和平臺(tái)小技巧,如果我們制作某個(gè)平臺(tái)的視頻創(chuàng)作,建議使用這個(gè)平臺(tái)的配合的剪輯軟件,一來使用方便,二來根據(jù)算法來說,容易獲得推薦機(jī)會(huì)。隨著網(wǎng)絡(luò)的發(fā)展和5G時(shí)代的普及,我們傳統(tǒng)的文字、圖文閱讀模式逐漸被視頻化取代。目前抖音、快手、視頻號(hào)等視頻平臺(tái)的崛起,我們很多個(gè)人也從原來的文字創(chuàng)作轉(zhuǎn)型視頻創(chuàng)作。視頻主播、直播帶貨、拍攝生活自...
閱讀 11110·2025-03-21 11:44
閱讀 546·2025-02-19 18:27
閱讀 618·2025-02-19 18:21
閱讀 589·2025-02-19 13:50
閱讀 1725·2025-02-13 22:35
閱讀 1264·2025-02-08 10:20
閱讀 5951·2025-01-02 11:25
閱讀 1289·2024-12-10 11:51