一个可以将文字转换为视频并保存到本地的工具。其初衷是为了实现小说的可视化阅读功能。主要实现原理包括:
- 将文本分段,通过标点符号如句号划分成句子。
- 将句子转换为图片和声音,采用稳定扩散模型(stable-diffusion)生成图片,使用 edge-tts 进行文本转语音。
- 利用 OpenCV 将图片合并为视频,生成 mp4 格式视频,句子作为字幕显示在视频内容底部区域。
- 音频控制画面播放时长,最终通过 FFmpeg 合并音频和视频。
使用场景
这个工具适用于以下场景:
- 将文本内容可视化呈现,如将小说段落转换为视频形式。
- 制作简易且有字幕和声音的视频,适合用于创作一些短视频内容或教育视频。
- 为文字内容增添动态视觉效果,提升观赏性和吸引力。
如何使用
-
本地开发准备:
- 在 macOS 环境下安装 Python 3.10.12。
- 使用以下命令安装所需依赖:
pip install -r requirements.txt
。
-
生成 API Key Token:
- 从 Hugging Face 网站(https://huggingface.co/settings/tokens)申请 API Key Token,这用于调用开源文生图模型。
- 将 Token 写入到
.env
文件中。
-
安装 FFMPEG:
- 为了视频合成声音,需要安装 FFmpeg。
-
启动应用:
- 运行
python3.10 app.py
启动应用。 - 访问 http://127.0.0.1:5000/ 进行使用。
- 运行
通过以上步骤,你可以使用这个工具将文字转换为视频,并获得可视化的呈现效果。
相关导航
暂无评论...