
你有沒有這樣的困擾:想做 YouTube 影片,卻不想出聲錄音;想做 Podcast,卻覺得自己聲音不夠好聽;想把一篇長文章變成有聲版,但念完整篇要花好幾個小時?
阿正老師最近深度使用了一款叫 ElevenLabs 的工具,說真的,第一次聽到它生成出來的中文語音時,我還真的以為是真人配音——那個語調、那個停頓、甚至連輕微的情緒起伏都有。它是目前公認 AI 語音品質最高的平台,連好萊塢和 Netflix 都在用。
更棒的是,ElevenLabs 有免費版可以用,每個月可以生成約 10 分鐘的語音,對於想試試看的朋友來說完全夠了。這篇文章阿正老師從零開始帶你認識 ElevenLabs,從功能介紹、操作步驟、繁體中文技巧,到方案比較,一篇搞定!
文章目錄
一、ElevenLabs 是什麼?
| 官方網站 | https://elevenlabs.io |
| 開發公司 | ElevenLabs Inc.(美國,2022 年成立) |
| 主要功能 | 文字轉語音、聲音複製、AI 配音翻譯、音效生成 |
| 支援語言 | 70+ 種語言,含繁體中文、簡體中文、英文、日文、韓文等 |
| 支援平台 | 網頁版、iOS App、Android App |
| 費用 | 免費版(每月約 10 分鐘)/ Starter $5/月 / Creator $22/月 / Pro $99/月 |
| 繁體中文介面 | ❌(英文介面,但支援繁體中文語音輸出) |
| 軟體下載 | [本站下載點](網址待補) |
ElevenLabs 是目前全球公認 AI 語音品質最高的文字轉語音平台,2022 年由前 Google 與 Palantir 工程師創立,短短幾年估值已超過 30 億美元。它最厲害的地方,就是生成出來的語音幾乎無法和真人配音區分——有自然的語調起伏、語速節奏,甚至能表達情緒。

ElevenLabs 支援超過 70 種語言、擁有上萬種 AI 聲音可以選,還有一個讓阿正老師最感興趣的功能:聲音複製(Voice Cloning)——只需要上傳幾分鐘的錄音樣本,AI 就能克隆出你的聲音,之後用文字就能讓「你的聲音」說任何話。
主要應用場景包括:YouTube 影片旁白、Podcast 配音、有聲書製作、影片多語言配音翻譯,以及需要大量語音內容的行銷團隊。
———————————————-
ElevenLabs 文字轉語音介面截圖(顯示主要的 Text to Speech 操作介面,有聲波視覺化效果)
———————————————-
二、免費註冊帳號(3 分鐘完成)
ElevenLabs 免費版不需要信用卡,用 Google 帳號就能馬上開始使用。以下是完整的註冊步驟:
步驟一:前往官網
打開瀏覽器,前往 elevenlabs.io,點選右上角的「Sign Up」。
步驟二:用 Google 帳號一鍵登入
選擇「Continue with Google」,直接用 Google 帳號授權登入,整個過程不到 30 秒,也不需要填任何表單。

最後可以輸入你的名字(選擇性)及語言(目前中文只提供簡體中文,選擇後會從英文界面自動切換成簡體中文界面)。

步驟三:進入主介面
登入後你會看到左側選單,主要會用到的功能包括:

- Text to Speech(文本轉語音)——文字轉語音的主要操作頁面
- Voices(音色)——瀏覽、試聽、新增 AI 聲音
- Studio(工作室)——製作長篇語音內容或有聲書用
- Dubbing(配音)——上傳影片,AI 自動翻譯並重新配音
三、文字轉語音(Text to Speech)基本操作
這是 ElevenLabs 最核心的功能,操作非常直覺。以下是完整步驟:
步驟一:進入 Text to Speech 頁面
點選左側選單的「Text to Speech」(文本轉語音),就會進入主要操作介面。
步驟二:選擇語音(Voice)
點選上方的聲音選擇區,可以瀏覽數百種 AI 聲音,包括男聲、女聲、不同年齡、不同口音。每種聲音都可以點「Preview」先試聽。找好之後選取即可。如果要找台灣口音的語音,可以在上方直接搜尋「Taiwan」就會列出,目前已經有二十多種。

步驟三:選擇 AI 模型
ElevenLabs 有3個主要 TTS 模型:
- Eleven (十一號) v3:品質最高,支援70多種語言。
- Eleven Multilingual(十一多語言) v2:品質中等,支援 29 種以上語言,適合最終輸出版本使用,但速度較慢
- Eleven Flash (十一閃電俠)v2.5:速度極快(延遲約 75ms),字元消耗只有一般模型的一半,適合快速打稿或測試用

阿正老師建議平常測試的時候用 Flash 省點數,確認文字沒問題後,最後輸出才換成 Multilingual v2或v3,這樣可以讓免費額度用得更久。
步驟四:輸入文字
在下方的大型文字框中,輸入或貼入你要轉成語音的文字。免費版單次最多可以輸入約 2,500 個字元。如果文字很長,建議分段處理。
步驟五:按下 Generate,下載語音
確認設定無誤後,點選「Generate」按鈕,幾秒後就會出現語音播放器。試聽沒問題,點下載圖示就可以下載 MP3 格式的語音檔案。

四、語音參數調整:讓聲音更自然
ElevenLabs 讓你調整四個關鍵參數,可以讓生成的語音更符合你的需求:
Stability(穩定性)
數值越高,聲音越平穩一致,適合新聞播報、教學說明等需要清晰一致的場合。數值越低,聲音會有更多起伏變化,聽起來更像真人說話,但有時候可能會偏離原本聲音的特色。阿正老師建議一般用途設定在 50–70% 之間。
Similarity(相似性)
這個參數主要在使用聲音複製功能時比較重要。數值越高,生成的語音越接近原始聲音樣本,但如果樣本本身有背景雜音,也可能一起被放大。建議設定在 70–80% 左右。
另外還有一個 Style Exaggeration(風格誇張),可以讓聲音的說話風格更鮮明,但太高容易失真,建議保持在 30% 以下。

五、聲音複製(Voice Cloning)教學
這是 ElevenLabs 最讓人印象深刻的功能——只需要上傳你的聲音樣本,AI 就能克隆出一個聽起來像你的虛擬聲音,之後輸入任何文字,它都能用「你的聲音」說出來。ElevenLabs 提供兩種聲音複製方式:
即時語音克隆Instant Voice Cloning,IVC)
所需方案:Starter($5/月)以上
只需上傳 1 分鐘以上的清晰錄音(建議 5–10 分鐘效果更好),大約 30 秒就能完成克隆。適合 YouTuber、Podcast 主等一般創作者,日常旁白用途已非常夠用。
專業語音克隆(Professional Voice Cloning,PVC)
所需方案:Creator($22/月)以上
需要錄製 30 分鐘以上的腳本音訊並上傳,ElevenLabs 會進行深度訓練,等待 24–48 小時後完成。複製出來的品質明顯更高,適合廣告配音、有聲書、或是以聲音為主要個人品牌的創作者。
即時聲音複製操作步驟:
步驟一:進入左側選單的「音色(Voices)」旁的+號按鈕,再選「即時語音克隆(Instant Voice Cloning)」。

步驟二:替你的聲音取一個名稱,然後上傳音訊檔案(支援 MP3、WAV、M4A 等格式)。要注意的是,音訊需要是乾淨的單人語音,沒有背景音樂、沒有雜音效果最好。
步驟三:勾選同意條款(聲明音訊是你本人的聲音,且你授權 ElevenLabs 用於克隆),點「Add Voice」。大約等 30 秒,你的聲音就會出現在聲音庫中,之後在 Text to Speech 頁面選它就能使用。

六、Voice Design:自訂全新 AI 聲音
如果你不想用現有聲音庫,也不想複製真實聲音,ElevenLabs 還有一個很酷的功能叫 Voice Design——用文字描述你想要的聲音特質,AI 就會幫你從零創造一個全新的聲音。
舉幾個描述範例:
- 「A 35-year-old Taiwanese woman, warm and friendly tone, clear Mandarin pronunciation」(溫和親切的台灣女性聲音)
- 「A confident middle-aged male news anchor, professional and authoritative」(穩重的男性新聞播報音調)
- 「A cheerful young woman for educational YouTube videos, energetic and engaging」(活潑的教學 YouTube 聲音)

按下「生成音色(Generate)」後,系統會生成幾個符合描述的聲音供你試聽,挑選喜歡的加入聲音庫就可以在 Text to Speech 中使用了。這個功能特別適合品牌想建立專屬 AI 品牌聲音的企業,完全原創、不涉及任何版權問題。
七、繁體中文語音實戰技巧
ElevenLabs 支援繁體中文,但要讓中文語音效果夠好,有幾個技巧值得注意,阿正老師親測後整理如下:
技巧一:選擇中文專屬聲音
在 Voices 聲音庫中搜尋「Taiwan」、「Chinese」或「Mandarin」,篩選出專門為中文訓練的聲音。不要用英文聲音來讀中文文字,效果差很多,發音也容易不準。
技巧二:使用 Multilingual v2/v3 模型
中文語音建議一律使用 Multilingual v2/v3 模型,而不是 Flash 模型。Flash 模型對中文的語調處理比較弱,重要的最終輸出要選品質優先的 Multilingual v2/v3。
技巧三:標點符號幫助斷句
ElevenLabs 會根據標點符號來決定停頓位置,所以繁體中文文字一定要有適當的標點(逗號、句號、問號)。如果有一段很長的句子卻沒有標點,AI 可能會一口氣唸完,聽起來很趕。
技巧四:數字和英文混排要多注意
如果文字裡有數字或英文夾雜,建議把數字改成國字(例如「3」改成「三」),英文縮寫加上讀音提示(例如「AI(人工智慧)」),這樣 AI 唸出來的方式會比較自然。
技巧五:情緒標記讓語音更有感情
ElevenLabs 支援在文字中加入情緒提示,例如在特定句子前加上 [excited](興奮)、[sad](悲傷)、[whisper](輕語)、[laughs](笑)、[sighs](嘆氣),語音生成時就會對應調整語調。這個技巧特別適合用在故事旁白或需要感情表達的內容。

八、方案比較:哪個方案最適合你?
| 功能 | 免費版 | Starter $5/月 |
Creator $22/月 |
Pro $99/月 |
|---|---|---|---|---|
| 每月字元配額 | 10,000 (約 10 分鐘) |
30,000 (約 30 分鐘) |
100,000 (約 100 分鐘) |
500,000 (約 500 分鐘) |
| 商業授權 | ❌ | ✅ | ✅ | ✅ |
| 即時聲音複製(IVC) | ❌ | ✅ | ✅ | ✅ |
| 專業聲音複製(PVC) | ❌ | ❌ | ✅ | ✅ |
| 音訊下載格式 | MP3 | MP3 | MP3 / WAV | MP3 / WAV 44.1kHz PCM |
| 可建立的自訂聲音數 | 最多 3 個 | 最多 10 個 | 最多 30 個 | 最多 160 個 |
| 影片 AI 配音翻譯(Dubbing) | ✅(有限制) | ✅ | ✅ | ✅ |
| 未使用點數是否保留 | ❌(每月重置) | ✅(保留最多 2 個月) | ✅(保留最多 2 個月) | ✅(保留最多 2 個月) |
| 年繳折扣後月費 | 免費 | 約 $4/月 | 約 $18/月 | 約 $82/月 |
阿正老師的建議選法:
- 偶爾做影片、不需要商業授權:免費版夠用,每月 10 分鐘對輕量使用者來說通常足夠
- 有 YouTube 頻道或 Podcast 需要商業授權:Starter($5/月,約 NT$160)是最划算的入門選擇
- 每週固定產出內容、需要聲音複製功能:Creator($22/月)最適合,有 PVC 功能且 100 分鐘的額度很夠用
- 企業或專業製作團隊:Pro($99/月)起,有高品質 PCM 音訊和大量配額
九、優缺點總整理
✅ 優點
- 語音品質是目前市場最高水準,接近真人配音
- 免費版可用,每月約 10 分鐘語音不需信用卡
- 支援繁體中文及 70+ 種語言
- 有聲音複製(Voice Cloning)功能
- 可調整情緒語調,不像傳統 TTS 那樣機械
- Voice Design 可從零創造全新 AI 聲音
- 支援影片 AI 配音翻譯(Dubbing)
- 有 iOS / Android App,手機也能操作
- 付費版未用完點數可保留最多 2 個月
⚠️ 缺點
- 介面只有英文,沒有繁體中文版
- 免費版不可商用,需付費才能商業授權
- 免費版每月只有 10 分鐘,用量較大者不夠
- 聲音複製功能需要付費方案(最低 $5/月)
- 數字和英文夾雜的中文文字唸法有時不準
- 以字元計費方式對不熟悉的用戶來說容易搞混
- Pro 以上方案月費對個人用戶偏高
十、阿正老師的總結
偶爾需要語音旁白、純個人娛樂用途
→ ElevenLabs 免費版就夠了。每月 10 分鐘、不需信用卡,要試試 AI 語音的感覺完全可以。
YouTube 頻道、Podcast,需要商業授權的創作者
→ Starter 方案($5/月,約 NT$160)。最便宜的商業授權起點,有即時聲音複製,每月 30 分鐘對輕量創作者夠用。
每週固定產出、想用自己的聲音做旁白的創作者
→ Creator 方案($22/月,約 NT$705)。有專業聲音複製(PVC)、每月 100 分鐘額度,是大多數認真創作者的最佳選擇。
行銷團隊、需要大量語音內容的企業
→ Pro 方案以上($99/月)。高品質音訊輸出、500 分鐘配額,取代傳統錄音外包絕對划算。
AI 語音技術已經成熟到讓人分不清真假
ElevenLabs 對阿正老師來說是目前最值得推薦的 AI 語音工具,沒有之一。光是免費版的品質,就已經秒殺市面上大多數付費的 TTS 軟體。如果你是內容創作者、YouTuber、Podcast 主,或是常常需要讓文字「說話」的人,強烈建議去 elevenlabs.io 試試看免費版,聽聽那個語音的質感,相信你會和阿正老師一樣,覺得「這哪是 AI 啊?!」
想了解更多 AI 創作工具,也可以參考阿正老師的 Suno AI 免費音樂生成教學,和 2026 免費 AI 工具懶人包!
你有沒有用過 ElevenLabs?覺得哪種聲音最好聽?歡迎在下面留言跟阿正老師分享!










