- 博客
- 时间线
- 帮助
- 关于

【翻译工具】FasterWhisperGUI：本地声音转写文字工具！

MagicNue

发布于：2024年12月20日

0 介绍

和N46Whisper一样，是基于Whisper模型的声音识别工具；区别在于N46是一套现成、调用谷歌算力的在线方案，而FasterWhisperGUI则是可以用本地算力识别的方案！

至于运行效率，参考我的个人情况：R5 5600 + RTX 2070（8G显存）在模型为Systran/faster-whisper-large-v3，模型参数为勾选v3模型、计算精度float16、线程数8、并发数1的情况下，执行转写一首时长4分40秒的mp3日语asmr音声需要约12分40秒钟，也就是大概每处理一分钟音频需要等待3分钟的情况呢。

1效果

如果所示：在【执行转写】选项卡可以把音频转写为带有时间轴的字幕文件。

识别完成后，可以在【WhisperX】后处理选项卡，进行简单的时间轴修正。

参考

更新于：2024年12月30日

记录通过 SSH 与 Github 建立连接的流程

00在将资料提交到Github的Repo或者上传博客文件到Github Pages时，需要将本机的id_rsa.pub文件上传到github上来实现安全验证。 01首先用ssh-keygen -...

Docker 创建 Node 、Hexo 和 Vitepress 容器

想着回顾一下以前是如何安装博客的，就重新部署了一次，一边记录了操作步骤。 00 首先流程就是部署一个node容器，然后在里面添加好Github信任和Hexo框架，之后博客页面的部署、生成和上传都...

评论