Python使用谷歌gTTS生成音频并播放

1、简介

gTTS（Google Text-to-Speech）是一个用于将文本转换为音频的Python库。它使用Google的语音合成引擎，将文本转换为音频文件。gTTS支持多种语言，包括英语、中文、日语、韩语等。

2、安装

使用gTTS（Google Text-to-Speech）生成并播放音频，你需要先安装gTTS库，然后可以使用playsound库来播放生成的音频文件;
安装gTTS库可以使用pip命令：

1	`pip install gTTS`

安装playsound库可以使用pip命令：

1	`pip install playsound`

3、使用

以下是一个简单的示例，演示如何使用gTTS生成并播放音频：

from gtts import gTTS
import os
import playsound

tts = gTTS('你好，我是小冰', lang='zh-cn') # 生成中文语音, lang='en' 生成英文语音
tts.save('hello.mp3') # 保存为mp3文件

# os.system("mpg123 mmcs.mp3")  # 在 mac 系统上使用ffmpeg播放生成的音频
# os.system("start mmcs.mp3")  # 在 Windows 系统上自动播放生成的音频

playsound.playsound('hello.mp3') # 播放

4、注意事项

1、使用gTTS需要联网，因为它需要访问Google的语音合成引擎。

2、mac下使用playsound 1.2.2版本，否则会报错：

1	`pip install playsound==1.2.2`

确保你的Mac上已安装了 ffmpeg，因为gTTS在某些情况下需要它来处理音频文件的转换。通常通过gTTS安装会自动处理这些依赖关系。
如果遇到问题，你可以手动安装ffmpeg：

1	`brew install ffmpeg`

Python

#Python #gTTS #音频 #语音合成

Python使用谷歌gTTS生成音频并播放

https://river106.cn/posts/c37d8205.html

作者

river106

发布于

2025年2月12日

许可协议

表达式引擎Mvel 下一篇