持续更新 · 2026年3月

开源视频工具
全景地图

AI视频生成模型、在线编辑器、短视频自动化 Pipeline、视频理解分析工具。
GitHub Stars + 技术栈 + 部署难度 + 适用场景,一页看完。

🎬 共收录 35+ 项目 · 9 大分类
🤖 AI生成模型 ✂️ 在线编辑器 🚀 短视频Pipeline 🔍 视频分析/高光 ⚙️ 基础处理工具 🎭 数字人 🎭 短剧/漫剧 🎯 选型指南
35+收录项目
8工具分类
100k+总 GitHub Stars
2024~26覆盖年份
全免费均可商用
🤖 一、AI 视频生成模型
Text / Image → Video,本地可部署,无需调用商业 API
1
HunyuanVideo 1.5 腾讯出品 🔥 当前最强
Tencent-Hunyuan / HunyuanVideo-1.5
GitHub →
8.3B 参数,质量对标 Sora / Veo,消费级 GPU(RTX 4090)可运行。 支持文生视频、图生视频,最高 1080p 输出,是当前开源视频生成模型的顶尖之作。 1.5 版本在轻量化上做了显著优化,显存需求大幅降低。
⭐ 20k+ 部署难度:高(需 GPU) 文生视频 图生视频 ComfyUI 支持 Python
2
Wan2.1(万象) 阿里巴巴 🔥 中文最友好
Wan-AI / Wan2.1
GitHub →
阿里巴巴出品,中文场景最友好,对话自然语言生成效果极好。 质量与 HunyuanVideo 同级别,支持 T2V / I2V / Video Editing。 中国大陆网络可访问权重,下载不受限。
⭐ 15k+ 部署难度:高 文生视频 中文优化 Python
3
CogVideoX 清华大学
THUDM / CogVideo
GitHub →
清华出品,5B 参数,RTX 4090 可跑,支持 LoRA 微调。 ComfyUI 生态最完整,社区活跃,有大量预训练 LoRA 权重可直接使用。 适合需要风格定制化的场景。
⭐ 12.5k 部署难度:中 文生视频 LoRA微调 ComfyUI Python
4
LTX-Video 速度最快
Lightricks / LTX-Video
GitHub →
Lightricks(专业视频公司)出品,生成速度最快,接近实时。 16GB 显存即可运行,适合快速出图的工作流。质量略低于 HunyuanVideo,但速度优势明显。 ComfyUI 节点完善。
⭐ 9.4k 部署难度:中 速度最快 16GB可跑 ComfyUI
5
Open-Sora 2.0
hpcaitech / Open-Sora
GitHub →
11B 参数,含完整视频处理 Pipeline(数据清洗→训练→生成)。 支持 2s~15s、144p~720p、任意宽高比。对标 HunyuanVideo 和 Step-Video。 适合需要端到端训练自己模型的团队。
⭐ 23k 部署难度:高 文生视频 完整Pipeline Python
6
Mochi 1 Apache 2.0
genmoai / mochi
GitHub →
完全 Apache 2.0 开源,可商用无限制。物理运动感最真实,流体、布料、自然场景表现出色。 来自 Genmo AI,生态和社区在快速成长。
⭐ 5k+ 部署难度:高 Apache 2.0 物理最真实
7
Stable Video Diffusion
Stability-AI / stable-video-diffusion
GitHub →
图生视频领域的鼻祖,生态最成熟,插件/教程最多。 虽然质量被后来者超越,但社区资源极其丰富,ComfyUI / A1111 生态完善。 入门学习首选。
⭐ 26k 部署难度:中 图生视频 生态最丰富
✂️ 二、在线视频编辑器
纯浏览器端运行,无需安装,无需上传,WebCodecs / WebGPU 驱动
🥇
OpenCut 🔥 最成熟
OpenCut-app / OpenCut
GitHub →
定位:开源 CapCut 替代品。React + TypeScript + WebCodecs + FFmpeg.wasm。 多轨时间线、实时预览、本地渲染(OPFS 存储)。隐私优先,数据不离开设备。 社区最活跃,文档完善。在线体验:opencut.app
部署难度:低 React WebCodecs FFmpeg.wasm 多轨时间线
🥈
OpenReel Video 功能最强
Augani / openreel-video
GitHub →
React + TypeScript + WebCodecs + WebGPU。功能堪比 DaVinci Resolve: AI 字幕(本地 Whisper)、专业调色面板(Lift/Gamma/Gain + RGB 曲线)、3D 变换。 MIT 开源,无水印。在线体验:openreel.video
部署难度:低 React WebGPU AI字幕 专业调色 3D变换
🥉 OpenVideo
openvideodev / openvideo
React + PixiJS(WebGL),CapCut / Canva 克隆,客户端渲染。
GitHub → ReactWebGL
Twick SDK
ncounterspecialist / twick
React 组件库/SDK,AI字幕 + Canvas + 无服务器 MP4 导出,最适合嵌入产品。
GitHub → SDK嵌入AI字幕
Omniclip 2.0
omni-media / omniclip
最轻量的浏览器编辑器,WebCodecs 底层,2.0 开发中,适合二次开发。
GitHub → 轻量2.0 WIP
Vue Video Editor
openvideodev / vue-video-editor
Vue 3 + 多轨时间线,支持视频/音频/图片/文字多图层,Vue 技术栈首选。
GitHub → Vue 3多轨
桌面端经典: Kdenlive(KDE出品,功能最全)· Shotcut(FFmpeg驱动,跨平台)· OpenShot(最易上手)
🚀 三、短视频自动化 Pipeline
输入文本/主题,自动生成配音+字幕+素材+合成的完整短视频
MoneyPrinterTurbo 🔥 中文首选
harry0703 / MoneyPrinterTurbo
GitHub →
输入主题 → 全自动生成短视频:LLM写脚本 → 素材下载(Pexels/Pixabay)→ TTS配音 → 字幕烧录 → BGM合成 → MP4输出。 中文生态最好,Streamlit Web UI,一键运行。 支持 GPT、Claude、本地 Ollama 多种 LLM。
⭐ 18k+ 部署难度:低 Streamlit UI TTS集成 全自动 Python
CineOverview 本项目定制开发
kris / cineoverview
私有项目
文章/链接/文本 → AI 插画(Flux Schnell)+ Fish Audio TTS + 竖屏短视频。 5 种视觉主题(cosmic_mystical / papercraft_tech / nature_fresh / warm_healing / corporate_pro)。 Video Essay 模式,Hook-first 短视频结构,8-12 场景,70s 目标时长。 FastAPI + Celery + React 前端全栈。
部署难度:中 AI插画 Fish Audio TTS 竖屏9:16 Video Essay FastAPI+React
2
Bilive B站专属
timerring / bilive
GitHub →
B站直播 → 自动录制 → 切片 → 弹幕渲染 + 字幕 → 自动投稿。 集成多模态大模型(MLLM)做内容理解,兼容低配机器,速度极快。 国内 B 站生态最完整的自动化工具。
部署难度:低 B站 自动投稿 弹幕渲染 Python
3
AutoClipper YouTube/Twitch
VadlapatiKarthik / autoclipper
GitHub →
高光检测 → 自动裁剪 → Whisper 字幕 → 上传。 基于观众留存数据 + 弹幕高峰 + 评论时间戳识别精彩片段。 FastAPI + Celery + React + Tailwind 架构,和 CineOverview 几乎相同,可直接借鉴。
部署难度:中 YouTube Twitch Whisper字幕 FastAPI
4
ViMax 港大 · Agentic
HKUDS / ViMax
GitHub →
Idea → 完整视频的 Agentic 流程:导演 + 编剧 + 制片 + 生成一体。 港大出品,LLM 驱动分镜设计,对接 Veo/Sora/Runway 等视频生成 API。 架构和 CineOverview 未来方向高度重合,值得参考。
部署难度:中 Agentic LLM驱动 Python
🔍 四、视频分析 · 高光检测
自动识别精彩片段,基于 AI 模型或观众行为数据
Lighthouse LINE出品学术顶会
line / lighthouse
GitHub →
LINE 公司出品,EMNLP 2024 / ICASSP 2025 / 2026 顶会论文。 视频高光检测 + 时刻检索,支持文本查询("找最搞笑的部分")。 也支持音频时刻检索,是当前学术界最前沿的开源高光检测库。
部署难度:中 EMNLP2024 文本查询 音频检索 Python
HL-CLIP CVPR2024
dhk1349 / HL-CLIP
用 CLIP 做视频高光检测,零样本(Zero-shot),无需标注数据。
GitHub → CVPR2024零样本
UVCOM CVPR2024
EasonXiao-888 / UVCOM
统一框架:时刻检索 + 高光检测 SOTA,QVHighlights / TVSum 数据集最佳。
GitHub → CVPR2024SOTA
VideoCutterAI
Crezy-haker / videocutterAI
轻量 Web 工具,上传视频 → AI 自动找高光 → 生成短片,最易部署
GitHub → Web工具易部署
pyannote-video
pyannote / pyannote-video
人脸检测 + 追踪 + 聚类,说话人识别 + 自动重构画面,音视频分析利器。
GitHub → 人脸追踪Python
⚙️ 五、视频基础处理工具
所有视频 Pipeline 的底层基础设施
FFmpeg 万物基础
FFmpeg / FFmpeg
转码/裁剪/合并/滤镜/字幕,一切视频工具的底层。世界上最重要的开源软件之一。
GitHub → ⭐ 44k 难度:低 C语言
Remotion React写视频
remotion-dev / remotion
用 React 组件编写视频,程序化生成,适合动态数据驱动视频。CineOverview 计划采用。
GitHub → ⭐ 21k 难度:中 React
MoviePy
Zulko / moviepy
Python 视频编辑库,脚本化处理首选,适合快速原型。底层用 FFmpeg。
GitHub → ⭐ 12k 难度:低 Python
Whisper 最强ASR
openai / whisper · SYSTRAN / faster-whisper
OpenAI 开源语音识别,中文极准。faster-whisper 版本速度快 4-8x,推荐用后者。
GitHub → faster → ⭐ 73k 难度:低 Python
AutoFlip Google出品
google / mediapipe
智能视频重构,横屏自动转竖屏,追踪主体(人脸/物体),构图自动优化。
GitHub → 难度:中 MediaPipe 横转竖
react-timeline-editor
xzdarcy / react-timeline-editor
纯时间线 UI 组件,搭建自定义视频编辑器的时间轴交互层首选。
GitHub → 难度:低 React组件
🎭 六、数字人 · 口型同步
音频驱动口型同步、AI 虚拟主播、说话人视频生成
MuseTalk 🔥 实时口型
TMElyralab / MuseTalk
GitHub →
腾讯音乐出品,音频驱动口型实时同步,完全离线本地运行。 给任何人像照片或视频添加口型,质量接近商业 HeyGen。 支持中文口型,适合做 AI 主播/数字人讲解。
⭐ 12.2k 部署难度:中 口型同步 本地离线 中文支持
SadTalker
OpenTalker / SadTalker
单张照片 + 音频 → 说话视频,头部运动自然,入门首选。
GitHub → ⭐ 14k 难度:低 图片驱动
Wav2Lip
Rudrabha / Wav2Lip
经典口型同步模型,任意视频 + 任意音频 → 对应口型视频。社区生态极丰富。
GitHub → ⭐ 9k 难度:低 Python
🎭 七、AI 短剧 · 漫剧生成
小说/剧本 → 分镜 → AI生图 → 视频成片,角色一致性是核心难题
三大核心难点: 🔴 角色一致性 — 同一角色跨场景保持外貌一致  ·  🟡 场景连续性 — 上下集场景衔接自然  ·  🟢 批量生产效率 — 流水线化,支持百集连续生产
1
BigBanana AI Director 🔥 工业级最强 角色一致性
shuyu-labs / BigBanana-AI-Director
GitHub →
工业级一站式 AI 短剧 / 漫剧 / AI 导演平台。彻底抛弃"抽卡式"生成,采用 Script → Asset → Keyframe 工业化工作流。 一句话生成完整短剧,从剧本到成片全自动化,同时精准控制角色一致性、场景连续性与镜头运动。 支持 AI 真人剧 + AI 漫剧两种模式,知乎/V2EX 评价最高。
部署难度:中 角色一致性 真人剧 漫剧 全自动Pipeline Python
2
Toonflow 🆕 最新 批量生产
HBAI-Ltd / Toonflow-app
GitHub →
小说 → 剧本 → 分镜图 → 视频全流程,角色一致性保持是核心卖点。 对接 SD / Runway 接口,适合"100集小说推文号"的流水线批量作业。 2026年2月刚开源,B站教程出炉不到一天,势头很猛。
部署难度:低 角色一致性 批量流水线 SD/Runway Python
3
LocalMiniDrama 完全本地 数据不出本机
xuanyustudio / LocalMiniDrama
GitHub →
故事 → 分镜 → 视频,完全本地部署,数据不出本机。 同时支持 AI 真人剧 + AI 漫剧,短剧工作流管理平台,灵活度高。 隐私敏感 / 企业内网场景首选,纳米流水线架构。
部署难度:中 完全离线 真人剧 漫剧 Python
ai_story
xhongc / ai_story
AI视频 + AI动漫 + AI短剧 + AI漫剧四合一自动化生成工具,覆盖面最广。
GitHub → 四合一Python
story-flicks
alecm20 / story-flicks
⭐1.4k,一键生成高清故事短视频,LLM写脚本 → AI图 → 字幕 → 视频,最轻量。
GitHub → ⭐ 1.4k轻量
ai-shotlive
sorker / ai-shotlive
整合 BigBanana + CutOS + CineGen-AI + Toonflow 四项目精华,全流程:小说→剧本→分镜→关键帧→视频→剪辑。
GitHub → 整合版前后端分离
Komiko 漫画
Story-Engine-Inc / Komiko
AI 漫画/韩漫/日漫/Webtoon 生成,多风格分格漫画页面,AI Comic Factory 增强版。
GitHub → 韩漫日漫Webtoon

📱 短剧播放/分发平台(可运营)
MettShort 国内
helloqyg / MettShort
微信小程序+抖音小程序+APP+公众号,付费解锁、虚拟支付、分销、SAAS多开,完整短剧运营系统。
GitHub → 小程序可运营
MettShortOverseas 出海
helloqyg / MettShortOverseas
H5+Android+iOS,支持 PayPal / Stripe,Facebook/Google 登录,多语言,专做海外短剧分发。
GitHub → PayPal多语言出海
🎯 七、选型指南
按需求场景快速找到最合适的工具
要生成视频
质量最高 → HunyuanVideo 1.5 / Wan2.1 | 速度最快 → LTX-Video | 可商用 → Mochi 1(Apache 2.0)

在线剪辑
完整产品 → OpenCut(最成熟)| 专业功能 → OpenReel(调色+AI字幕)| 嵌入产品 → Twick SDK

短视频自动化
中文通用 → MoneyPrinterTurbo | B站专用 → Bilive | YouTube高光 → AutoClipper | 高端定制 → CineOverview

高光检测
学术最强 → Lighthouse(LINE出品,文本查询)| 最易用 → VideoCutterAI | B站弹幕驱动 → Bilive

数字人
实时口型同步 → MuseTalk | 图片→说话 → SadTalker | 任意视频换口型 → Wav2Lip

视频处理底层
一切基础 → FFmpeg | Python脚本 → MoviePy | React程序化生成 → Remotion | 字幕识别 → faster-whisper

部署难度对比
低:FFmpeg / MoviePy / Whisper / MoneyPrinterTurbo / 浏览器编辑器
中:CogVideoX / LTX-Video / Remotion / MuseTalk / AutoClipper
高:HunyuanVideo / Wan2.1 / Open-Sora(需要大显存GPU)
短剧·漫剧
工业级全链路 → BigBanana AI Director(Script→Asset→Keyframe)| 批量生产 → Toonflow| 本地私有 → LocalMiniDrama| 海外分发 → MettShort海外版
对 CineOverview 下一步最有价值:
LTX-Video — 替换静态 Flux Schnell 插图,生成动态 B-roll 视频片段
MuseTalk — 加数字人讲解模式,大幅提升视频质感
Remotion — 替换 Playwright+FFmpeg 渲染层,更稳定更灵活(已在计划)
Lighthouse — 加"从长视频提取高光"输入源,做差异化功能
BigBanana Script→Asset→Keyframe — 参考其角色一致性方案,升级 CineOverview 的场景连续性