开源视频工具全景图 2026

35+收录项目

8工具分类

100k+总 GitHub Stars

2024~26覆盖年份

全免费均可商用

🤖 一、AI 视频生成模型

Text / Image → Video，本地可部署，无需调用商业 API

1

HunyuanVideo 1.5 腾讯出品 🔥 当前最强

Tencent-Hunyuan / HunyuanVideo-1.5

GitHub →

8.3B 参数，质量对标 Sora / Veo，消费级 GPU（RTX 4090）可运行。支持文生视频、图生视频，最高 1080p 输出，是当前开源视频生成模型的顶尖之作。 1.5 版本在轻量化上做了显著优化，显存需求大幅降低。

⭐ 20k+ 部署难度：高（需 GPU）文生视频图生视频 ComfyUI 支持 Python

2

Wan2.1（万象）阿里巴巴 🔥 中文最友好

Wan-AI / Wan2.1

GitHub →

阿里巴巴出品，中文场景最友好，对话自然语言生成效果极好。质量与 HunyuanVideo 同级别，支持 T2V / I2V / Video Editing。中国大陆网络可访问权重，下载不受限。

⭐ 15k+ 部署难度：高文生视频中文优化 Python

3

CogVideoX 清华大学

THUDM / CogVideo

GitHub →

清华出品，5B 参数，RTX 4090 可跑，支持 LoRA 微调。 ComfyUI 生态最完整，社区活跃，有大量预训练 LoRA 权重可直接使用。适合需要风格定制化的场景。

⭐ 12.5k 部署难度：中文生视频 LoRA微调 ComfyUI Python

4

LTX-Video 速度最快

Lightricks / LTX-Video

GitHub →

Lightricks（专业视频公司）出品，生成速度最快，接近实时。 16GB 显存即可运行，适合快速出图的工作流。质量略低于 HunyuanVideo，但速度优势明显。 ComfyUI 节点完善。

⭐ 9.4k 部署难度：中速度最快 16GB可跑 ComfyUI

5

Open-Sora 2.0

hpcaitech / Open-Sora

GitHub →

11B 参数，含完整视频处理 Pipeline（数据清洗→训练→生成）。支持 2s~15s、144p~720p、任意宽高比。对标 HunyuanVideo 和 Step-Video。适合需要端到端训练自己模型的团队。

⭐ 23k 部署难度：高文生视频完整Pipeline Python

6

Mochi 1 Apache 2.0

genmoai / mochi

GitHub →

完全 Apache 2.0 开源，可商用无限制。物理运动感最真实，流体、布料、自然场景表现出色。来自 Genmo AI，生态和社区在快速成长。

⭐ 5k+ 部署难度：高 Apache 2.0 物理最真实

7

Stable Video Diffusion

Stability-AI / stable-video-diffusion

GitHub →

图生视频领域的鼻祖，生态最成熟，插件/教程最多。虽然质量被后来者超越，但社区资源极其丰富，ComfyUI / A1111 生态完善。入门学习首选。

⭐ 26k 部署难度：中图生视频生态最丰富

✂️ 二、在线视频编辑器

纯浏览器端运行，无需安装，无需上传，WebCodecs / WebGPU 驱动

🥇

OpenCut 🔥 最成熟

OpenCut-app / OpenCut

GitHub →

定位：开源 CapCut 替代品。React + TypeScript + WebCodecs + FFmpeg.wasm。多轨时间线、实时预览、本地渲染（OPFS 存储）。隐私优先，数据不离开设备。社区最活跃，文档完善。在线体验：opencut.app

部署难度：低 React WebCodecs FFmpeg.wasm 多轨时间线

🥈

OpenReel Video 功能最强

Augani / openreel-video

GitHub →

React + TypeScript + WebCodecs + WebGPU。功能堪比 DaVinci Resolve： AI 字幕（本地 Whisper）、专业调色面板（Lift/Gamma/Gain + RGB 曲线）、3D 变换。 MIT 开源，无水印。在线体验：openreel.video

部署难度：低 React WebGPU AI字幕专业调色 3D变换

🥉 OpenVideo

openvideodev / openvideo

React + PixiJS（WebGL），CapCut / Canva 克隆，客户端渲染。

GitHub → ReactWebGL

Twick SDK

ncounterspecialist / twick

React 组件库/SDK，AI字幕 + Canvas + 无服务器 MP4 导出，最适合嵌入产品。

GitHub → SDK嵌入AI字幕

Omniclip 2.0

omni-media / omniclip

最轻量的浏览器编辑器，WebCodecs 底层，2.0 开发中，适合二次开发。

GitHub → 轻量2.0 WIP

Vue Video Editor

openvideodev / vue-video-editor

Vue 3 + 多轨时间线，支持视频/音频/图片/文字多图层，Vue 技术栈首选。

GitHub → Vue 3多轨

桌面端经典： Kdenlive（KDE出品，功能最全）· Shotcut（FFmpeg驱动，跨平台）· OpenShot（最易上手）

🚀 三、短视频自动化 Pipeline

输入文本/主题，自动生成配音+字幕+素材+合成的完整短视频

⭐

MoneyPrinterTurbo 🔥 中文首选

harry0703 / MoneyPrinterTurbo

GitHub →

输入主题 → 全自动生成短视频：LLM写脚本 → 素材下载（Pexels/Pixabay）→ TTS配音 → 字幕烧录 → BGM合成 → MP4输出。中文生态最好，Streamlit Web UI，一键运行。支持 GPT、Claude、本地 Ollama 多种 LLM。

⭐ 18k+ 部署难度：低 Streamlit UI TTS集成全自动 Python

⭐

CineOverview 本项目定制开发

kris / cineoverview

私有项目

文章/链接/文本 → AI 插画（Flux Schnell）+ Fish Audio TTS + 竖屏短视频。 5 种视觉主题（cosmic_mystical / papercraft_tech / nature_fresh / warm_healing / corporate_pro）。 Video Essay 模式，Hook-first 短视频结构，8-12 场景，70s 目标时长。 FastAPI + Celery + React 前端全栈。

部署难度：中 AI插画 Fish Audio TTS 竖屏9:16 Video Essay FastAPI+React

2

Bilive B站专属

timerring / bilive

GitHub →

B站直播 → 自动录制 → 切片 → 弹幕渲染 + 字幕 → 自动投稿。集成多模态大模型（MLLM）做内容理解，兼容低配机器，速度极快。国内 B 站生态最完整的自动化工具。

部署难度：低 B站自动投稿弹幕渲染 Python

3

AutoClipper YouTube/Twitch

VadlapatiKarthik / autoclipper

GitHub →

高光检测 → 自动裁剪 → Whisper 字幕 → 上传。基于观众留存数据 + 弹幕高峰 + 评论时间戳识别精彩片段。 FastAPI + Celery + React + Tailwind 架构，和 CineOverview 几乎相同，可直接借鉴。

部署难度：中 YouTube Twitch Whisper字幕 FastAPI

4

ViMax 港大 · Agentic

HKUDS / ViMax

GitHub →

Idea → 完整视频的 Agentic 流程：导演 + 编剧 + 制片 + 生成一体。港大出品，LLM 驱动分镜设计，对接 Veo/Sora/Runway 等视频生成 API。架构和 CineOverview 未来方向高度重合，值得参考。

部署难度：中 Agentic LLM驱动 Python

🔍 四、视频分析 · 高光检测

自动识别精彩片段，基于 AI 模型或观众行为数据

★

Lighthouse LINE出品学术顶会

line / lighthouse

GitHub →

LINE 公司出品，EMNLP 2024 / ICASSP 2025 / 2026 顶会论文。视频高光检测 + 时刻检索，支持文本查询（"找最搞笑的部分"）。也支持音频时刻检索，是当前学术界最前沿的开源高光检测库。

部署难度：中 EMNLP2024 文本查询音频检索 Python

HL-CLIP CVPR2024

dhk1349 / HL-CLIP

用 CLIP 做视频高光检测，零样本（Zero-shot），无需标注数据。

GitHub → CVPR2024零样本

UVCOM CVPR2024

EasonXiao-888 / UVCOM

统一框架：时刻检索 + 高光检测 SOTA，QVHighlights / TVSum 数据集最佳。

GitHub → CVPR2024SOTA

VideoCutterAI

Crezy-haker / videocutterAI

轻量 Web 工具，上传视频 → AI 自动找高光 → 生成短片，最易部署。

GitHub → Web工具易部署

pyannote-video

pyannote / pyannote-video

人脸检测 + 追踪 + 聚类，说话人识别 + 自动重构画面，音视频分析利器。

GitHub → 人脸追踪Python

⚙️ 五、视频基础处理工具

所有视频 Pipeline 的底层基础设施

FFmpeg 万物基础

FFmpeg / FFmpeg

转码/裁剪/合并/滤镜/字幕，一切视频工具的底层。世界上最重要的开源软件之一。

GitHub → ⭐ 44k 难度：低 C语言

Remotion React写视频

remotion-dev / remotion

用 React 组件编写视频，程序化生成，适合动态数据驱动视频。CineOverview 计划采用。

GitHub → ⭐ 21k 难度：中 React

MoviePy

Zulko / moviepy

Python 视频编辑库，脚本化处理首选，适合快速原型。底层用 FFmpeg。

GitHub → ⭐ 12k 难度：低 Python

Whisper 最强ASR

openai / whisper · SYSTRAN / faster-whisper

OpenAI 开源语音识别，中文极准。faster-whisper 版本速度快 4-8x，推荐用后者。

GitHub → faster → ⭐ 73k 难度：低 Python

AutoFlip Google出品

google / mediapipe

智能视频重构，横屏自动转竖屏，追踪主体（人脸/物体），构图自动优化。

GitHub → 难度：中 MediaPipe 横转竖

react-timeline-editor

xzdarcy / react-timeline-editor

纯时间线 UI 组件，搭建自定义视频编辑器的时间轴交互层首选。

GitHub → 难度：低 React组件

🎭 六、数字人 · 口型同步

音频驱动口型同步、AI 虚拟主播、说话人视频生成

★

MuseTalk 🔥 实时口型

TMElyralab / MuseTalk

GitHub →

腾讯音乐出品，音频驱动口型实时同步，完全离线本地运行。给任何人像照片或视频添加口型，质量接近商业 HeyGen。支持中文口型，适合做 AI 主播/数字人讲解。

⭐ 12.2k 部署难度：中口型同步本地离线中文支持

SadTalker

OpenTalker / SadTalker

单张照片 + 音频 → 说话视频，头部运动自然，入门首选。

GitHub → ⭐ 14k 难度：低图片驱动

Wav2Lip

Rudrabha / Wav2Lip

经典口型同步模型，任意视频 + 任意音频 → 对应口型视频。社区生态极丰富。

GitHub → ⭐ 9k 难度：低 Python

🎭 七、AI 短剧 · 漫剧生成

小说/剧本 → 分镜 → AI生图 → 视频成片，角色一致性是核心难题

      三大核心难点：
      🔴 角色一致性 — 同一角色跨场景保持外貌一致  · 
      🟡 场景连续性 — 上下集场景衔接自然  · 
      🟢 批量生产效率 — 流水线化，支持百集连续生产
    

1

BigBanana AI Director 🔥 工业级最强角色一致性

shuyu-labs / BigBanana-AI-Director

GitHub →

工业级一站式 AI 短剧 / 漫剧 / AI 导演平台。彻底抛弃"抽卡式"生成，采用 Script → Asset → Keyframe 工业化工作流。一句话生成完整短剧，从剧本到成片全自动化，同时精准控制角色一致性、场景连续性与镜头运动。支持 AI 真人剧 + AI 漫剧两种模式，知乎/V2EX 评价最高。

部署难度：中角色一致性真人剧漫剧全自动Pipeline Python

2

Toonflow 🆕 最新批量生产

HBAI-Ltd / Toonflow-app

GitHub →

小说 → 剧本 → 分镜图 → 视频全流程，角色一致性保持是核心卖点。对接 SD / Runway 接口，适合"100集小说推文号"的流水线批量作业。 2026年2月刚开源，B站教程出炉不到一天，势头很猛。

部署难度：低角色一致性批量流水线 SD/Runway Python

3

LocalMiniDrama 完全本地数据不出本机

xuanyustudio / LocalMiniDrama

GitHub →

故事 → 分镜 → 视频，完全本地部署，数据不出本机。同时支持 AI 真人剧 + AI 漫剧，短剧工作流管理平台，灵活度高。隐私敏感 / 企业内网场景首选，纳米流水线架构。

部署难度：中完全离线真人剧漫剧 Python

ai_story

xhongc / ai_story

AI视频 + AI动漫 + AI短剧 + AI漫剧四合一自动化生成工具，覆盖面最广。

GitHub → 四合一Python

story-flicks

alecm20 / story-flicks

⭐1.4k，一键生成高清故事短视频，LLM写脚本 → AI图 → 字幕 → 视频，最轻量。

GitHub → ⭐ 1.4k轻量

ai-shotlive

sorker / ai-shotlive

整合 BigBanana + CutOS + CineGen-AI + Toonflow 四项目精华，全流程：小说→剧本→分镜→关键帧→视频→剪辑。

GitHub → 整合版前后端分离

Komiko 漫画

Story-Engine-Inc / Komiko

AI 漫画/韩漫/日漫/Webtoon 生成，多风格分格漫画页面，AI Comic Factory 增强版。

GitHub → 韩漫日漫Webtoon

📱 短剧播放/分发平台（可运营）

MettShort 国内

helloqyg / MettShort

微信小程序+抖音小程序+APP+公众号，付费解锁、虚拟支付、分销、SAAS多开，完整短剧运营系统。

GitHub → 小程序可运营

MettShortOverseas 出海

helloqyg / MettShortOverseas

H5+Android+iOS，支持 PayPal / Stripe，Facebook/Google 登录，多语言，专做海外短剧分发。

GitHub → PayPal多语言出海

🎯 七、选型指南

按需求场景快速找到最合适的工具

要生成视频

质量最高 → HunyuanVideo 1.5 / Wan2.1 ｜速度最快 → LTX-Video ｜可商用 → Mochi 1（Apache 2.0）

在线剪辑

完整产品 → OpenCut（最成熟）｜专业功能 → OpenReel（调色+AI字幕）｜嵌入产品 → Twick SDK

短视频自动化

中文通用 → MoneyPrinterTurbo ｜ B站专用 → Bilive ｜ YouTube高光 → AutoClipper ｜高端定制 → CineOverview

高光检测

学术最强 → Lighthouse（LINE出品，文本查询）｜最易用 → VideoCutterAI ｜ B站弹幕驱动 → Bilive

数字人

实时口型同步 → MuseTalk ｜图片→说话 → SadTalker ｜任意视频换口型 → Wav2Lip

视频处理底层

一切基础 → FFmpeg ｜ Python脚本 → MoviePy ｜ React程序化生成 → Remotion ｜字幕识别 → faster-whisper

部署难度对比

低：FFmpeg / MoviePy / Whisper / MoneyPrinterTurbo / 浏览器编辑器
中：CogVideoX / LTX-Video / Remotion / MuseTalk / AutoClipper
高：HunyuanVideo / Wan2.1 / Open-Sora（需要大显存GPU）

短剧·漫剧

工业级全链路 → BigBanana AI Director（Script→Asset→Keyframe）｜批量生产 → Toonflow｜本地私有 → LocalMiniDrama｜海外分发 → MettShort海外版

      对 CineOverview 下一步最有价值：

      → LTX-Video — 替换静态 Flux Schnell 插图，生成动态 B-roll 视频片段

      → MuseTalk — 加数字人讲解模式，大幅提升视频质感

      → Remotion — 替换 Playwright+FFmpeg 渲染层，更稳定更灵活（已在计划）

      → Lighthouse — 加"从长视频提取高光"输入源，做差异化功能

      → BigBanana Script→Asset→Keyframe — 参考其角色一致性方案，升级 CineOverview 的场景连续性

开源视频工具全景地图

开源视频工具
全景地图