Roder's Blog
首页
分类
归档
Java
SpringBoot
关于
友链
工具
it-tools
JSON格式化
Markdown转PDF
Mermaid预览
Roder
累计撰写
82
篇文章
累计创建
21
个分类
累计创建
161
个标签
导航
首页
分类
归档
Java
SpringBoot
关于
友链
工具
it-tools
JSON格式化
Markdown转PDF
Mermaid预览
目录
标签
Python
Python语音识别实战:FastAPI + Whisper ASR开发指南
2025-12-06 14:37
18
0
0
25.8℃
Python
Python语音识别实战:FastAPI + Whisper ASR开发指南 1. 简介 本文介绍如何使用 FastAPI 框架结合 Whisper ASR(自动语音识别)技术构建一个完整的语音识别系统。该系统可以接收音频文件并将其转换为文本,支持多种音频格式和语言识别。 相关技术栈 FastAPI
Python文本转语音实战:FastAPI + Edge-TTS开发指南
2025-11-30 15:54
32
0
0
27.2℃
Python
1. 简介 文本转语音(Text-to-Speech, TTS)技术可以将文本转换为自然流畅的语音输出。本指南将介绍如何使用FastAPI框架结合不同的TTS引擎构建Web服务,实现文本到语音的转换功能。 我们将主要介绍一种主流的TTS实现方案: Edge-TTS - 基于微软Edge浏览器的在线T
Python使用谷歌gTTS生成音频并播放
2025-02-12 17:28
658
0
215
519.8℃
Python
1、简介 gTTS(Google Text-to-Speech)是一个用于将文本转换为音频的Python库。它使用Google的语音合成引擎,将文本转换为音频文件。gTTS支持多种语言,包括英语、中文、日语、韩语等。 2、安装 使用gTTS(Google Text-to-Speech)生成并播放音频
弹