Vibe 是阿正老師目前最推薦給一般讀者的語音轉文字工具。它用 Rust + Tauri 開發,安裝檔大小僅約 44MB(Windows 版),完全不需要安裝 Python 或任何額外套件,下載 .exe 安裝就好,非常乾淨。
安裝完成後,第一次開啟時,軟體會引導你從內建清單下載 Whisper 模型(模型大小從 75MB 到 2.9GB 不等,按需選擇),之後就可以完全離線使用,資料完全不離開你的電腦。
Vibe 支援幾乎所有常見音訊與視訊格式:MP3、MP4、WAV、M4A、MKV、MOV、AVI、FLAC、OGG 等等,透過 FFmpeg 整合處理,不用另外轉格式。匯出格式支援 TXT、SRT、VTT 等字幕格式,會議記錄或影片上字幕都很方便。
另外 Vibe 還有一個實用功能是批次轉錄,可以一口氣拖入多個檔案,讓電腦慢慢跑完,省時省力。