QuickPiperAudiobook
综合介绍
QuickPiperAudiobook 是一个通过单条命令即可将多种格式的文本文档转换为自然语音有声读物的工具。 它支持离线工作,能确保转换过程的完全私密性。该程序的核心是调用 Piper 模型进行文本到语音的转换,因此它能支持多种语言和声音。用户可以转换包括 PDF、EPUB、MOBI、TXT、DOCX 和 HTML 在内的多种文件格式。 使用这个工具前,用户需要在电脑中预先安装 Calibre 软件套件中的 ebook-convert
工具,如果需要输出 MP3 格式或为 EPUB 文件生成章节,还需要安装 ffmpeg
。 QuickPiperAudiobook 本身是一个命令行程序,通过简单的命令和参数,用户就可以指定输入文件、选择不同语言的模型、以及设定输出格式,将个人电子书库轻松变为有声读物库。
功能列表
- 支持多种格式:能够处理包括
PDF
、epub
、txt
、mobi
、djvu
、HTML
和docx
在内的多种电子书和文档格式。 - 完全离线运行:所有的转换工作都在本地计算机上完成,不需要连接互联网,保障了内容的隐私性。
- 高质量语音合成:使用 Piper TTS 模型库,提供听起来自然的语音。 Piper 是一个高效的本地神经文本转语音系统。
- 多语言支持:通过下载并指定不同的 Piper 语音模型,可以为不同语言的文本生成音频。
- 生成 MP3 文件:如果电脑中安装了
ffmpeg
,可以将生成的音频输出为MP3
格式。 - 支持章节划分:在转换
EPUB
格式的电子书时,如果安装了ffmpeg
,可以根据源文件的章节信息生成对应的音频章节。 - 跨平台使用:程序本身主要在 Linux 上测试,但在上游的 Piper 修复一个已知问题后,也能在 macOS 上运行。
- 高度可配置:用户可以通过命令行参数或配置文件(
~/.config/QuickPiperAudiobook/config.yaml
)来自定义默认行为,例如默认输出目录、默认语音模型等。
使用帮助
QuickPiperAudiobook 是一个命令行工具,这意味着你需要在终端或命令提示符窗口中使用它。整个过程包括安装依赖、下载程序和执行转换命令。
第一步:安装依赖组件
在开始使用之前,你需要先安装两个必要的辅助工具:ebook-convert
和 ffmpeg
。
- 安装
ebook-convert
- 这个工具是著名的电子书管理软件 Calibre 的一部分。
- 你需要访问 Calibre 的官方网站下载并安装完整的 Calibre 软件。
- 安装完成后,必须确保
ebook-convert
工具所在的路径已经被添加到了系统的环境变量PATH
中。这样,QuickPiperAudiobook 才能在任何目录下调用它。 - 你可以在终端输入
ebook-convert --version
来检查是否安装成功并配置好环境变量。如果能看到版本号输出,则说明配置正确。
- 安装
ffmpeg
(可选)ffmpeg
是一个功能强大的音视频处理工具。对于 QuickPiperAudiobook 来说,如果你希望将有声读物输出为MP3
格式,或者在转换EPUB
电子书时自动生成章节,就必须安装它。- 你可以从
ffmpeg
的官方网站找到适合你操作系统的安装包或安装指南。 - 安装后,同样需要确保
ffmpeg
的路径也添加到了系统的环境变量PATH
中。 - 你可以在终端输入
ffmpeg -version
来验证安装。
第二步:下载 QuickPiperAudiobook
你有两种方式获取主程序:
- 使用预编译版本 (推荐)
- 访问 QuickPiperAudiobook 的 GitHub Releases 页面。
- 根据你的操作系统(比如 Linux)下载最新发布的二进制文件。
- 下载后,将它解压并放置在你喜欢的位置,例如放在一个名为
Tools
的文件夹里。为了方便使用,建议将该文件的路径也添加到系统环境变量中,或者在运行时使用完整路径。
- 从源代码构建 (适合开发者)
- 你需要先安装 Go 语言环境。
- 然后通过
git clone
将项目克隆到本地,进入项目目录后执行go mod tidy && go build
命令进行编译。
第三步:运行与操作
所有准备工作就绪后,就可以开始转换了。
- 基本转换
- 打开你的终端或命令提示符。
- 输入命令
./QuickPiperAudiobook <你的文件名>
,例如:./QuickPiperAudiobook my-novel.txt
- 程序会自动处理文件,并在同一目录下生成一个
.wav
格式的音频文件。你也可以输入一个带扩展名的 URL 地址来进行转换。
- 输出为 MP3 并生成章节
- 如果你想转换一本
EPUB
电子书,并希望得到带章节的MP3
文件,可以使用--mp3
和--chapters
参数:./QuickPiperAudiobook --mp3 --chapters my-book.epub
- 这会生成一个
MP3
文件,并且在支持的播放器里会显示章节信息,方便你跳转。
- 如果你想转换一本
- 使用非英语语言
- QuickPiperAudiobook 默认使用一个标准的英语女声模型。如果你需要转换其他语言的文本,比如中文或波兰语,需要执行以下步骤:
- 下载模型:访问 Piper Models 页面 找到你需要的语言模型。每个模型包含两个文件:一个
.onnx
文件和一个.onnx.json
文件。 - 放置模型:将下载好的两个文件(确保它们的文件名主体一致)放入程序的配置文件夹中。在 Linux 和 macOS 上,这个路径是
~/.config/QuickPiperAudiobook/
。 - 执行命令:在转换时,使用
--model
参数指定模型文件名,并使用--speak-utf-8
参数确保正确处理非 ASCII 字符。例如,转换一个使用波兰语模型的 PDF 文件:./QuickPiperAudiobook --speak-utf-8 --model=pl_PL-gosia-medium.onnx MaszynaTuringa_Wikipedia.pdf
- 使用配置文件
- 如果你经常使用相同的设置,比如总是使用中文模型和输出到固定的文件夹,可以创建一个配置文件来简化操作。
- 在
~/.config/QuickPiperAudiobook/
路径下创建一个名为config.yaml
的文件。 - 在文件中写入你的偏好设置,例如:
# 指定默认的有声读物输出文件夹 output: ~/Audiobooks # 指定默认使用的语音模型 model: "zh_CN-huayan-medium.onnx" # 默认输出为 mp3 mp3: true
- 保存文件后,下次运行
QuickPiperAudiobook
时就会自动使用这些设置,无需再通过命令行参数指定。
应用场景
- 个人有声书库创建如果你拥有大量的
EPUB
、MOBI
或PDF
格式的电子书,可以使用这个工具将它们批量转换为有声读物,方便在通勤、运动或做家务时收听,实现“阅读”自由。 - 辅助阅读障碍者对于有视力障碍或阅读困难的用户,这个工具可以将网络文章、学习资料(如
PDF
或DOCX
文档)转换为音频,让他们通过听的方式来获取信息和学习知识。 - 语言学习辅助学习外语的用户可以下载对应语言的语音模型,将外语文章或书籍转换为音频,通过反复收听来锻炼听力、熟悉单词发音和语调。
- 内容创作者素材准备播客主或视频创作者可以快速将文稿转换为音频草稿,用于预览内容的节奏和时长,而无需自己花费时间朗读。
QA
- 这个工具是免费的吗?是的,QuickPiperAudiobook 是一个开源项目,基于 AGPL-3.0 许可证发布,你可以免费下载和使用。
- 什么是 Piper?我需要单独安装它吗?Piper 是一个快速、可在本地运行的文本转语音系统。 你不需要单独安装 Piper,QuickPiperAudiobook 程序已经内置了管理和调用 Piper 的功能。
- 转换一个长篇小说需要多长时间?转换时间取决于你的电脑性能和书籍的长度。因为所有计算都在本地进行,所以处理一本很长的书可能会花费较长时间,期间程序不会显示实时进度条。
- 为什么我转换 EPUB 文件时没有生成 MP3 或章节?这通常是因为你没有安装
ffmpeg
,或者ffmpeg
的路径没有被正确添加到系统的环境变量PATH
中。MP3
输出和章节功能都依赖于这个工具。 - 我可以更换不同的声音吗?可以。你需要从 Piper 的模型库中下载你喜欢的语音模型(
.onnx
和.json
文件),将它们放到~/.config/QuickPiperAudiobook/
文件夹下,然后在运行时通过--model
参数指定新的模型文件名。