一个去除视频字幕不会损伤视频画质的开源工具

AI智能摘要
看着硬盘里那些画质精美却焊死硬字幕的素材,你是否只能忍受马赛克般的涂抹痕迹?市面上大多数工具要么收费高昂,要么直接用模糊像素粗暴覆盖,彻底毁了原片分辨率。但这个开源项目反其道而行,它利用 STTN 和 LAMA 等进阶 AI 算法,能像“手术刀”一样精准识别并重构背景,让去除后的画面几乎看不出任何修补痕迹。更关键的是,它完全本地运行,无需联网调用昂贵 API 就能批量处理。当别人还在为去水印花冤枉钱时,你真的愿意继续忍受那些毁画质的笨办法吗?
— AI 生成的文章内容摘要

项目介绍

一个本地跑的开源神器,专门帮你把视频里焊死的硬字幕、图片上的文字水印给”擦掉”,而且不会糊成马赛克,处理完还是原片分辨率,最关键的是——不用花钱调任何第三方API,下载就能在自己电脑上跑。

图片[1]-一个去除视频字幕不会损伤视频画质的开源工具-知遇博客

功能介绍

说实话现在网上很多去字幕工具,要么收费贵得离谱,要么处理完画面糊成一坨。这个项目用的是正经AI算法,不是那种简单粗暴拿周围像素糊上去的笨办法。

核心本事有这么几块:

去硬字幕不伤画质 —— 像那种嵌在视频画面里的字幕,不是单独轨道能关掉的那种,它能识别出来然后AI填充背景,处理完你看不出原来有过字。支持指定区域去除,也可以让AI自动扫全片里的所有文字。

多种AI算法换着用 —— STTN算法适合真人视频,速度最快还能跳过检测直接干;LAMA对图片和动画效果最好;ProPainter对付那种运动特别剧烈的画面更稳,就是吃显存。你自己在配置里切就行。

顺便把字幕给你提出来 —— 去字幕的同时还能把原片字幕提取出来,配合他家另一个项目video-subtitle-extractor用,翻译做字幕一条龙。

批量处理图片水印 —— 不只是视频,一堆带文字水印的图片扔进去也能批量搞定。

使用方法

作者挺贴心的,给了好几条路,看你自己情况选。

最省事的:直接下预编译包

Release页面有打包好的,Windows用户找对应自己显卡的版本:

  • 没独显或者懒得折腾 → vsr-windows-cpu.7z
  • AMD/Intel显卡 → vsr-windows-directml.7z
  • NVIDIA显卡看CUDA版本,10/20/30系选CUDA 11.8,40系选12.6,50系选12.8

解压就能跑,不用配环境。

喜欢自己折腾的:源码部署

需要Python 3.12+,建议建个虚拟环境隔离一下。然后根据你的硬件装对应的依赖:

N卡用户装CUDA 11.8 + cuDNN 8.6,然后paddlepaddle-gputorch的GPU版本走一波;AMD/Intel用户走DirectML路线;啥卡没有的纯CPU也能跑,就是慢点;Mac用户注意,Apple Silicon能跑,Intel Mac建议别碰GPU加速,反而更慢。

装完依赖,python gui.py出图形界面,python ./backend/main.py跑命令行。命令行支持指定字幕坐标区域、选算法模式,批量处理方便。

Docker党看这里

几条命令搞定,N卡10/20/30系用1.4.0-cuda11.8,40系1.4.0-cuda12.6,50系1.4.0-cuda12.8,A/I卡或者集显用1.4.0-directml,纯CPU用1.4.0-cpu。跑完docker cp把处理好的视频捞出来就行。

使用技巧

觉得慢或者效果不好,去backend/config.py里调参。STTN算法把STTN_NEIGHBOR_STRIDESTTN_REFERENCE_LENGTH拉大效果会变好,但显存吃得更狠;STTN_SKIP_DETECTION设成True能飞快速度,但可能漏掉该去的字幕或者误伤画面。

Mac报错”bad CPU type in executable”的话,终端跑一下softwareupdate --install-rosetta装Rosetta转译层就解决。

项目地址

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容