🌍 한국어 ∙ English ∙ 中文简体 ∙ 中文繁體 ∙ 日本語
Voice-Pro是一款旨在革新多媒體內容處理的尖端AI驅動的Web應用程式。通過提供YouTube視頻下載、語音分離、語音識別、翻譯和文字轉語音等全面功能,為內容創作者、研究者和多語言通信專業人士提供了一站式解決方案。
- 🔊 尖端語音識別 (Whisper, Faster-Whisper, Whisper-Timestamped)
- 🎤 使用F5-TTS和E2-TTS進行零樣本語音克隆
- 🎥 YouTube視頻處理和音頻提取
- 🔇 專業語音分離(UVR5技術)
- 📢 多語言文字轉語音(Edge-TTS)
- 🌍 跨100多種語言的即時翻譯
- 🔥 AI封面製作(RVC技術)
Voice-Pro為ElevenLabs提供了一個現實的替代方案,滿足尋求先進文本轉語音解決方案的內容創作者、播客、研究人員和開發者的需求。
- Voice-Pro已更新至v1.7.x。
- 現在支持最新的yt-dlp和Gradio 5。
- 🔥 新增了AI封面製作功能。
- 請參考以下指導。
- 之前的用戶: 如果您已將Voice-Pro更新至v1.7.x,請運行update.bat。Python虛擬環境將更新至最新版本。
- 首次用戶: 請參考以下安裝步驟。只需運行configure.bat,然後運行start.bat。
Dubbing Studio
tab : Transcription, Translation & Text-to-Speech
voice-pro-demo-v1.6.7-1080p.mp4
Voice-Pro工作室分頁的全面媒體處理工作流程示範:從YouTube視頻下載到基於AI的語音分離、Whisper自動字幕生成、多語言翻譯,再到使用F5-TTS進行專業配音的一站式媒體轉換過程的展示。
F5-TTS-Multi
tab : Podcast Production using F5-TTS
f5-tts-demo-elon-zuckerberg-1115-3.mp4
F5-TTS創新的AI語音克隆技術示範:展示了精確模仿Mark Zuckerberg和Elon Musk真實聲音,從而創建全新內容的先進語音轉換技術。
AI Cover
tab :
321132645-44ee3893-145d-474a-840b-1ff45802dfbf.mp4
Make a Trump version of IU's 'Cupid', Kim Kwang-seok's 'I Miss You', and 'Private's Letter'.
Live Translation
tab : 即時語音辨識和翻譯
voice-pro-demo-v1.5.7-h264-1080p-live.mp4
Voice-Pro即時多語言翻譯功能示範:展示了一個創新的多語言媒體處理過程,通過AI語音識別技術即時捕獲YouTube BBC新聞內容,即時生成字幕,並立即將其翻譯成其他語言。
- YouTube視頻處理:以多種格式下載和提取音頻
- 語音分離:使用MDX-Net和Demucs進行高級降噪
- 多語言支持:
- 支持100多種語言的語音識別
- 具有可自定義選項的字幕創建
- 支持100多種語言的翻譯功能
- 語音轉文字(STT):
- Whisper集成
- Faster-Whisper支持
- Whisper-timestamped功能
- 文字轉語音(TTS):
- 具有400多種語音的Edge-TTS
- 支持零樣本語音克隆的F5-TTS
- 名人語音生成
- 🔥 語音轉語音 (RVC):
- 配備UVR5提供的聲音去除器和RVC引擎。
- 提供聲音調變功能。使用RVC v2。
- 即時語音識別
- 多語言翻譯
- 可配置的音頻輸入源
Dubbing Studio
標籤頁- 提供YouTube下載器、噪音去除、字幕、翻譯和TTS的集成環境
- 支持所有ffmpeg支持的視頻/音頻格式
- 可選擇輸出音頻格式(wav、flac、mp3)
- 支持100種語言的語音識別和字幕創建
- 選擇適合PC性能的字幕創建選項(Whisper模型和計算類型)
- 翻譯成100多種語言並通過TTS生成語音
- 原始視頻的背景音樂和音效在多語言視頻中保持不變
- 支持TTS語音速度、音量和音調調整
-
Whisper Caption
標籤頁- 專用於創建字幕的標籤頁。支持90多種語言
- 顯示與視頻一起創建的字幕
- 提供單詞級高亮功能
- 提供降噪功能(1-Demucs、2-MDXNet)
-
Translate
標籤頁- 專用於翻譯的標籤頁。支持100多種語言
- 支持字幕文件(ass、ssa、srt、mpl2、tmp、vtt、microdvd、json)
- 也可以直接輸入文本
- 自動檢測上傳文件的語言
-
語音
標籤- 支持Edge-TTS、F5-TTS和AI-Cover(RVC)。
- Edge-TTS標籤
- 支持超過100種語言和400多種聲音。
- 可以調整音調、音量和速度。
- F5-TTS標籤
- 支持零樣本聲音克隆。
- 您可以使用名人聲音創建播客。
- 🔥 AI封面 標籤
- 提供聲音去除器。使用MDX-Net和Demucs。
- 提供聲音調變功能。使用RVC v2。
- AI音聲可以從Discord AI Hub (https://discord.com/channels/1159260121998827560/@home)**下載,或在必要時進行**製作請求 ([email protected])。
- 試用版支持的視頻長度限制為60秒。
Live Translation
標籤頁- 支持實時語音識別和翻譯
- 選擇麥克風、揚聲器等音頻輸入源
- 提供保存捕獲的音頻、識別的字幕和翻譯的字幕的功能
Batch
標籤頁- 大量文件的批處理
- 字幕、翻譯、TTS
- 操作系統:Windows 10/11(64位)※不支持Linux和Mac OS。
- GPU:推薦支持CUDA 12.1的NVIDIA顯卡。
- VRAM:4GB或以上。推薦8GB或以上。
- RAM:4GB或以上
- 硬碟:安裝時至少需要20GB的可用空間
- 需要網絡連接(安裝和翻譯工作)
Voice-Pro可以輕鬆地一鍵安裝。只需運行🚀configure.bat和🚀start.bat即可。
git clone https://github.com/abus-aikorea/voice-pro.git
- 🚀 運行
configure.bat
- 在Windows上安裝git、ffmpeg和CUDA(如果使用NVIDIA GPU)。
- 只需要在第一次運行時執行。
- 需要網絡連接,根據系統情況可能需要一個多小時。
- 安裝過程中切勿關閉Windows命令窗口。
- 🚀 運行
start.bat
- 啟動Voice-Pro。網頁界面將自動運行。
- 首次運行時,會先安裝Voice-Pro。
- 需要網絡連接,根據系統情況可能需要一個多小時。
- 安裝過程中切勿關閉Windows命令窗口。
- 如果安裝過程中出現問題,請刪除installer_files文件夾並再次運行start.bat。
- 🚀 运行
update.bat
:- 更新安装在installer_files文件夹中的Python虚拟环境。
- 这比删除installer_files文件夹并重新安装要容易和快速得多。
- 推荐给现有用户。
- 運行
uninstall.bat
:- 刪除installer_files文件夾。
- 刪除安裝在Windows上的ffmpeg、git和CUDA包(如果選擇)。
- Voice-Pro默認為便攜式安裝。要卸載程序,只需刪除安裝文件夾即可。
- 關閉Windows命令窗口並再次運行start.bat。
- 直接運行瀏覽器並在地址欄輸入Windows命令窗口中顯示的地址(例如 **http://127.0.0.1:7892**)。
- 在Windows任務管理器的性能選項卡中檢查GPU內存狀態。
- 將降噪級別設置為0或1。降噪級別2至少需要8GB的GPU內存。
- 將計算類型設置為int類型。float類型質量更好,但需要更多GPU內存。
- 字幕質量通常隨著更大的Whisper模型而提高,但並非總是如此。large > medium > small > base > tiny
- 在計算類型中,float類型性能較好。int類型是通過模型量化減少GPU使用並提高速度的模型。另一方面,性能會下降。
- 如果增加降噪級別,將會去除更多背景聲音,只使用剩餘的聲音進行語音識別。這並不總是保證好的結果。
Windows Defender 可能會發出有關不受信任的應用程式的警告,並禁止進一步執行 Voice-Pro。 如果 SmartScreen 的安全級別設置為「警告」,只需點擊「更多資訊」,然後點擊「仍然要執行」。 如果 SmartScreen 設置為「阻止」級別,則不會有按鈕來運行安裝。在這種情況下,打開 start.bat 文件的屬性,檢查「解除封鎖」,應用更改後再次運行 start.bat。
當Windows Defender錯誤地將批處理文件識別為特洛伊木馬時,這通常被稱為"誤報"。要解決這個問題,您可以按照以下步驟操作:
- 文件例外處理:在Windows Defender中,您可以設置某些文件或進程跳過安全掃描。要做到這一點,請按照以下步驟:
- 點擊"開始"按鈕並進入"設置"。
- 點擊"更新與安全"。
- 選擇"Windows安全中心"並進入"病毒和威脅防護"。
- 點擊"管理病毒和威脅防護設置"。
- 在"病毒和威脅防護設置"中選擇"添加或刪除排除項"。
- 選擇"文件或文件夾",找到相關的批處理文件並將其添加為例外。
- 暫時禁用Windows Defender:這可能是一個臨時解決方案。但是,使用此方法時必須小心,因為它可能會使您的計算機暴露於其他威脅中。
- 向防病毒軟件報告問題:如果您確定該文件不是特洛伊木馬,可以將其作為誤報向Microsoft報告。Microsoft將審查此問題並採取必要的行動。
- 該倉庫提供 Voice-Pro 的免費試用。
- 免費試用有30分鐘的使用限制。這意味著運行後30分鐘後,您將無法再使用Web界面。
- 這並不意味著處理媒體的長度有限制,也不會停止正在進行的任務。您只是無法再點擊操作按鈕。
- 可能會有點不便,但要再次使用,只需關閉程序並重新啟動。
- 先前的工作結果保存在工作空間文件夾中。
- Voice-Pro的官方版本可以通過ABUS官方網站(https://abuskorea.imweb.me)購買。
- 此外,如果您通過Buy Me a Coffee ☕支持我們,我們將作為感謝,為您提供最多一個月的使用憑證。 (#10 (comment))
- 關於購買、商業合作、調整、投資等方面的咨詢,請通過電子郵件([email protected])與我們聯繫。
- 電子郵件:[email protected]
- 主頁(韓語):https://abuskorea.imweb.me
- 亞馬遜(美國):https://www.amazon.com/dp/B0DBR69JPL
- 亞馬遜(日本):https://www.amazon.co.jp/dp/B0DBVRJ542
- 亞馬遜(新加坡):https://www.amazon.sg/dp/B0DCGKL8R4
- 亞馬遜(阿聯酋):https://www.amazon.ae/dp/B0DCGKM7FF
- Naver智能商店(S/W):https://smartstore.naver.com/abus/products/10385660040
- Naver智能商店(解決方案):https://smartstore.naver.com/abus/products/10298346364
- 產品資訊:https://www.youtube.com/watch?v=z8g8LMhoh_o&list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq
- 家庭卡拉OK(流行音樂):https://www.youtube.com/watch?v=MqQP3ewvJUk&list=PLwx5dnMDVC9bVxfGo58U-R-w3fUHqwiD6
- 家庭卡拉OK(K-Pop):https://www.youtube.com/watch?v=v6qjf_ELsLA&list=PLwx5dnMDVC9Z8kB01tQKfzTysaCCxC3C8
- 家庭卡拉OK(J-Pop):https://www.youtube.com/watch?v=KKLzoWHFAxw&list=PLwx5dnMDVC9bd6y3wXs-bOas2cXIi-GAq
- Demucs: https://github.com/facebookresearch/demucs
- yt-dlp: https://github.com/yt-dlp/yt-dlp
- gradio: https://github.com/gradio-app/gradio
- edge-TTS: https://github.com/rany2/edge-tts
- F5-TTS: https://github.com/SWivid/F5-TTS.git
- openai-whisper: https://github.com/openai/whisper
- faster-whisper: https://github.com/SYSTRAN/faster-whisper
- whisper-timestamped: https://github.com/linto-ai/whisper-timestamped
- RVC-Project: https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
- UVR5: https://github.com/Anjok07/ultimatevocalremovergui
by ABUS