項(xiàng)目簡介
Funclip 是阿里巴巴通義實(shí)驗(yàn)室開源的一款視頻剪輯工具,專門用于精準(zhǔn)、便捷的視頻切片。它能夠自動識別視頻中的中文語音并允許用戶根據(jù)語音內(nèi)容來裁剪視頻。該工具使用了阿里巴巴語音識別模型FunASR Paraformer-Large確保了剪輯的精準(zhǔn)性。你可以根據(jù)識別結(jié)果選擇文本片段或說話人進(jìn)行視頻裁剪。使得視頻剪輯變得非常方便。Funclip不僅支持中文,未來還將支持英文視頻剪輯,是視頻內(nèi)容創(chuàng)作者和編輯者的理想選擇。
主要功能
1.高精度語音識別
利用阿里巴巴開源的 Paraformer-Large模型進(jìn)行視頻中的中文語音識別,該模型是當(dāng)前市場上識別效果最佳的開源中文ASR模型之一。
支持熱詞定制化功能,可以在語音識別過程中定制特定的實(shí)體詞、人名等,以提高識別的準(zhǔn)確度。
2.視頻裁剪與剪輯
用戶可以基于語音識別結(jié)果選擇特定的文本片段或者說話人,進(jìn)行視頻的精確裁
集成 CAM++說說話人識別模型,使得用戶可以根據(jù)自動識別出的說話人ID來選擇裁剪的視頻段落。
3.用戶界面與交互
通過 Gradio 界面提供的交互式平臺,用戶可以方便地上傳視頻、設(shè)置參數(shù)并進(jìn)行剪輯。
界面友好,安裝簡單,使用戶即使沒有編程背最也能輕松使用。
4.功能擴(kuò)展性
支持多段視頻的自由剪輯,并能自動生成全視頻及目標(biāo)段落的SRT字幕,便于后續(xù)處理,
計(jì)劃集成英文視頻剪輯能力和大語言模型,進(jìn)一步拓寬工具的應(yīng)用范圍和功能。
項(xiàng)目地址GitHub:https://github.com/alibaba-damo-academy/FunClip
附高性能NVIDIA RTX 40 系列云服務(wù)器購買:
http://systransis.cn/site/active/gpu.html?ytag=seo
https://www.compshare.cn/?ytag=seo
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/131093.html
摘要:老蔣有在這五款免費(fèi)視頻剪輯軟件推薦無需專業(yè)技能也會剪輯文章中有整理到大部分視頻自媒體平臺有為創(chuàng)作者開發(fā)的免費(fèi)視頻編輯軟件,不過大部分都是有支持手機(jī)移動端的。隨著網(wǎng)絡(luò)當(dāng)前的火熱領(lǐng)域肯定屬于視頻自媒體,我們很多原本可能安逸一方的技術(shù)從業(yè)者、教育行業(yè),甚至我們很多全職媽媽、上班族、甚至學(xué)生也都有加入到視頻創(chuàng)作領(lǐng)域。目前視頻創(chuàng)作平臺除了來自字節(jié)跳動的抖音、頭條,騰訊旗下的視頻號,百度旗下的百家號,阿...
摘要:第一剪映剪映,來自抖音旗下的自媒體視頻剪輯和后期軟件??偨Y(jié),老蔣個人建議和平臺小技巧,如果我們制作某個平臺的視頻創(chuàng)作,建議使用這個平臺的配合的剪輯軟件,一來使用方便,二來根據(jù)算法來說,容易獲得推薦機(jī)會。隨著網(wǎng)絡(luò)的發(fā)展和5G時代的普及,我們傳統(tǒng)的文字、圖文閱讀模式逐漸被視頻化取代。目前抖音、快手、視頻號等視頻平臺的崛起,我們很多個人也從原來的文字創(chuàng)作轉(zhuǎn)型視頻創(chuàng)作。視頻主播、直播帶貨、拍攝生活自...
摘要:在月日深圳云棲大會的人工智能專場中,阿里云視頻服務(wù)技術(shù)專家鄒娟將帶領(lǐng)大家探索熟悉的視頻場景中,技術(shù)如何應(yīng)用落地,解決實(shí)際業(yè)務(wù)場景中的問題。 摘要: 在人工智能時代,AI技術(shù)是如何在各行業(yè)和領(lǐng)域真正的發(fā)揮應(yīng)用和商業(yè)價值,帶來產(chǎn)業(yè)變革才是關(guān)鍵。在3月28日深圳云棲大會的人工智能專場中,阿里云視頻服務(wù)技術(shù)專家鄒娟將帶領(lǐng)大家探索熟悉的視頻場景中,AI技術(shù)如何應(yīng)用落地,解決實(shí)際業(yè)務(wù)場景中的問題。...
摘要:音頻超分辨率旨在重建一個以較低分辨率波形作為輸入的高分辨率音頻波形。由于受到深度學(xué)習(xí)成功應(yīng)用于圖像超分辨率的啟發(fā),我最近致力于使用深層神經(jīng)網(wǎng)絡(luò)來完成原始音頻波形的上采樣。上采樣塊使用子像素卷積,其沿著一個維度重新排列信息以擴(kuò)展其他維度。 音頻超分辨率旨在重建一個以較低分辨率波形作為輸入的高分辨率音頻波形。在諸如流式音頻和音頻恢復(fù)之類的領(lǐng)域中,這種類型的上采樣存在著若干種潛在應(yīng)用。一個傳統(tǒng)的解...
摘要:可預(yù)見的未來激情賽事已經(jīng)過半,阿里云視頻技術(shù)在本次世界杯中也成功落地,而這并不是結(jié)局,這是將視頻應(yīng)用于體育行業(yè)以及更多其他行業(yè)的開端。 本屆世界杯互聯(lián)網(wǎng)直播的順利進(jìn)行,離不開各大云計(jì)算廠商的支持。在這其中,阿里云是當(dāng)之無愧的C位,除了優(yōu)酷外,阿里云還支撐了CNTV、CCTV5客戶端,為全網(wǎng)70%的世界杯直播流量保駕護(hù)航。 對于世界杯這種超大觀看量級、超強(qiáng)影響力的重要體育賽事,阿里云一直...
閱讀 177·2024-11-07 17:59
閱讀 225·2024-09-27 16:59
閱讀 357·2024-09-23 10:37
閱讀 403·2024-09-14 16:58
閱讀 267·2024-09-14 16:58
閱讀 371·2024-08-29 18:47
閱讀 603·2024-08-16 14:40
閱讀 323·2024-08-14 17:54