Python使用谷歌gTTS生成音频并播放

1、简介

gTTS(Google Text-to-Speech)是一个用于将文本转换为音频的Python库。它使用Google的语音合成引擎,将文本转换为音频文件。gTTS支持多种语言,包括英语、中文、日语、韩语等。

2、安装

使用gTTS(Google Text-to-Speech)生成并播放音频,你需要先安装gTTS库,然后可以使用playsound库来播放生成的音频文件;
安装gTTS库可以使用pip命令:

1
pip install gTTS

安装playsound库可以使用pip命令:

1
pip install playsound

3、使用

以下是一个简单的示例,演示如何使用gTTS生成并播放音频:

1
2
3
4
5
6
7
8
9
10
11
from gtts import gTTS
import os
import playsound

tts = gTTS('你好,我是小冰', lang='zh-cn') # 生成中文语音, lang='en' 生成英文语音
tts.save('hello.mp3') # 保存为mp3文件

# os.system("mpg123 mmcs.mp3") # 在 mac 系统上使用ffmpeg播放生成的音频
# os.system("start mmcs.mp3") # 在 Windows 系统上自动播放生成的音频

playsound.playsound('hello.mp3') # 播放

4、注意事项

1、使用gTTS需要联网,因为它需要访问Google的语音合成引擎。

2、mac下使用playsound 1.2.2版本,否则会报错:

1
pip install playsound==1.2.2

确保你的Mac上已安装了 ffmpeg,因为gTTS在某些情况下需要它来处理音频文件的转换。通常通过gTTS安装会自动处理这些依赖关系。
如果遇到问题,你可以手动安装ffmpeg:

1
brew install ffmpeg

Python使用谷歌gTTS生成音频并播放
https://river106.cn/posts/c37d8205.html
作者
river106
发布于
2025年2月12日
许可协议