Web Speech API 只暴露操作系统已安装的语音。macOS 自带数十种高质量语音(Samantha、Daniel 等),Windows 10/11 自带较少且可下载更多扩展,ChromeOS 通过网络使用 Google 语音,Linux 因发行版而异。工具会先排序与你当前区域匹配的语音,让选择更轻松。
可以把音频导出为 MP3 或 WAV 文件吗?
目前不行 — Web Speech API 只通过扬声器提供合成播放,并未以所有浏览器都允许录制的方式暴露底层音频缓冲。如需可导出文件,请使用专门的 TTS 服务(ElevenLabs、Google Cloud TTS 等),或使用屏幕录制软件捕获系统声音。