手把手搭一个 AI 短视频流水线:就用 MoneyPrinterTurbo
做自媒体的朋友应该都懂一个痛:短视频太特么费人了。
选题要刷半天热点,脚本要憋半天文案,配音要录到嗓子冒烟,剪辑要坐到屁股长茧——一条 60 秒的视频,背后是 3-4 个小时的劳动。如果你是个程序员,你一定会在某个深夜拍着桌子喊:「这玩意儿能不能自动化?」
能。而且开源社区已经帮你做好了。
今天的主角是 MoneyPrinterTurbo,GitHub 上 34.5K Stars 的一键短视频生成工具。它利用 AI 大模型,从选题到成片,全自动完成。辉哥今天带你从零搭建一套完整的 AI 短视频流水线。
先看看它能干啥
MoneyPrinterTurbo 的工作流是这样的:
输入一个主题 → AI 生成脚本 → AI 配音 → 自动搜索素材 → 字幕合成 → 导出 MP4整个过程你只需要提供一个「主题词」,剩下的全自动。来看实际效果:
# 用命令行模式生成一条关于「Rust 语言」的短视频moneyprinter generate \ --topic "为什么 2026 年每个后端开发者都应该学 Rust" \ --style tech \ --duration 60 \ --voice zh-CN-XiaoxiaoNeural \ --language zh \ --subtitles auto这个命令执行后,MoneyPrinterTurbo 会:
- 调用 LLM(支持 GPT、Gemini、Moonshot)生成视频脚本
- 使用 TTS 引擎(Azure/Edge TTS)生成配音
- 按脚本关键词搜索免版权视频素材和图片
- 合成视频 + 自动添加中文字幕
- 输出一条完整的 MP4 文件
整个过程大概 2-5 分钟,取决于视频长度和网络速度。
本地部署:Docker 一键启动
官方提供了 Docker 镜像,部署极其简单:
# 第一步:拉取镜像并启动docker run -d \ --name money-printer \ -p 8501:8501 \ -v $(pwd)/data:/app/data \ -v $(pwd)/output:/app/output \ -e OPENAI_API_KEY=sk-xxx \ -e TTS_ENGINE=azure \ -e AZURE_SPEECH_KEY=xxx \ -e AZURE_SPEECH_REGION=eastasia \ --restart unless-stopped \ harry0703/moneyprinter-turbo:latest
# 查看启动日志docker logs -f money-printer
# 打开浏览器访问 http://localhost:8501 就看到 Web UI 了如果你不想用 Docker,也可以用 pip 本地安装:
# 克隆项目git clone https://github.com/harry0703/MoneyPrinterTurbo.gitcd MoneyPrinterTurbo
# 安装依赖pip install -r requirements.txt
# 启动 Web UIstreamlit run app.py --server.port 8501Web UI 使用指南
启动后打开浏览器,你会看到一个简洁的界面。核心配置区域如下:
# 这是 MoneyPrinterTurbo 配置文件的简化版# config.toml,你可以调整这些参数来定制生成效果
[llm]provider = "openai" # 也支持 gemini, moonshot, ollamamodel = "gpt-5.5-turbo" # 模型选择temperature = 0.7 # 创意度,越高越放飞max_tokens = 2048 # 最大生成长度
[video]resolution = "1920x1080" # 分辨率fps = 30 # 帧率transition = "fade" # 转场效果:fade, slide, zoomsubtitle_position = "bottom" # 字幕位置subtitle_font = "SimHei" # 字体
[voice]engine = "azure" # TTS 引擎:azure, edge, openaivoice = "zh-CN-XiaoxiaoNeural" # 声音角色speed = 1.0 # 语速pitch = 0 # 音调
[assets]max_images = 10 # 每个视频最大素材数量search_engine = "pexels" # 素材来源:pexels, pixabay, unsplashresolution_filter = "hd" # 素材画质这里有个小窍门:如果你用中文内容,TTS 引擎强烈推荐 Azure。它的中文配音质量远超 Edge TTS,特别是「zh-CN-XiaoxiaoNeural」这个声音,自然度堪比真人。OpenAI 的 TTS 中文表现其实也不错,但 Azure 在中文语调的细腻程度上更胜一筹。
进阶玩法:批量生成 + 定时发布
单条视频生成只是开胃菜,真正的生产力在于批量生产。我们可以写一个简单的 Python 脚本,实现「每晚自动生成 5 条视频,存入文件夹等待发布」:
#!/usr/bin/env python3"""批量短视频生成调度器"""
import subprocessimport jsonimport osfrom datetime import datetime
# 今日选题列表(可以从 Tavily API 自动抓取热点)TOPICS = [ "Python 3.13 新特性速览", "Docker Compose vs Kubernetes:小团队该怎么选", "2026 年最值得学习的 5 个前端框架", "用 VS Code 写代码的 10 个效率技巧", "从零搭建个人博客:Astro + Cloudflare Pages"]
OUTPUT_DIR = f"./output/{datetime.now().strftime('%Y-%m-%d')}"
os.makedirs(OUTPUT_DIR, exist_ok=True)
for i, topic in enumerate(TOPICS, 1): print(f"[{i}/{len(TOPICS)}] 正在生成: {topic}")
result = subprocess.run([ "moneyprinter", "generate", "--topic", topic, "--style", "tech", "--duration", "60", "--language", "zh", "--output", f"{OUTPUT_DIR}/video_{i:02d}.mp4" ], capture_output=True, text=True)
if result.returncode == 0: print(f" ✅ 生成成功: video_{i:02d}.mp4") else: print(f" ❌ 生成失败: {result.stderr}")
print(f"\n🎉 全部完成!共生成 {len(TOPICS)} 条视频")print(f"📁 输出目录: {OUTPUT_DIR}")这个脚本每天晚上跑一次,第二天早上你就有一批新鲜出炉的短视频素材了。配合定时任务(cron job),基本实现「睡觉时间也在生产内容」。
注意事项与避坑指南
用了几个月,总结几个实际遇到的坑:
- 素材搜索需要科学上网:Pexels/Pixabay API 在国内访问不稳定,建议在海外服务器部署或者配置代理
- 中文脚本质量取决于 LLM:如果用 GPT-3.5 生成中文脚本,内容会比较生硬。建议用 Qwen 或者 GPT-5.5
- 视频长度别超过 90 秒:超过 90 秒后,素材拼接的生硬感会明显增加。60 秒是最佳长度
- 字幕字体渲染问题:在 Docker 容器里如果没有中文字体,字幕会显示方框。需要手动安装中文字体包
# Docker 容器内安装中文字体apt-get update && apt-get install -y fonts-wqy-zenhei fonts-wqy-microhei
# 或者挂载宿主机的字体目录docker run -v /usr/share/fonts:/usr/share/fonts:ro ...结语
MoneyPrinterTurbo 这种工具的出现,本质上是在做一件事:把内容创作从「手艺活」变成「流水线作业」。它不会取代创作者的创意和视角,但它能把重复的、耗时的制作环节自动化。
对于技术博主来说,这意味着你可以把更多精力花在选题策划和深度内容上,而不是跟剪辑软件死磕。用 AI 把「产量」跑起来,用你的专业能力把「质量」做上去——这才是 2026 年技术创作者的生存之道。