Comments (5)
确实,我也是刚碰到到这种问题
from n46whisper.
从实用角度讲,这个功能最后实际输出希望以什么形式呢?ass/srt每一句都标注“speaker01”,“speaker02”这样?
from n46whisper.
翻了一下AEG,里面有个地方是这样的:
对应的代码是这么一句:
Dialogue: 0,0:03:08.99,0:03:09.91,VTB样式,難燃か(?)おめえ,0,0,0,,你还好吧
在“样式名”和“0,0,0”(不知道ASS里这个是什么含义OTZ)之间这个部分标注上speaker的话,后续就可以按照这个批量替换掉前面的样式了吧?(想了一下在语音转文字之前就设定好【声音-样式】的映射感觉不好实现,所以只要能识别出N个声音并标注在这个地方,然后手动把前面的样式替换成想要的样式,这个流程大概比较简单……)
所以如果能加在这个部分里的话,应该比较好处理一些?
(srt文件格式更不熟了……我再去翻一下OTZ)
from n46whisper.
从实用角度讲,这个功能最后实际输出希望以什么形式呢?ass/srt每一句都标注“speaker01”,“speaker02”这样?
看了一下srt文件的格式,好像srt文件没有能标注的部分?
所以可能还是只能写入ASS文件……
(另外想问一下本地化还会做吗OTZ在线跑AI翻译对Colab pro的消耗忒大了……试着下载这个项目然后本地运行Jupyter Notebook,但是被各种依赖问题卡死了)
from n46whisper.
从实用角度讲,这个功能最后实际输出希望以什么形式呢?ass/srt每一句都标注“speaker01”,“speaker02”这样?
看了一下srt文件的格式,好像srt文件没有能标注的部分? 所以可能还是只能写入ASS文件……
(另外想问一下本地化还会做吗OTZ在线跑AI翻译对Colab pro的消耗忒大了……试着下载这个项目然后本地运行Jupyter Notebook,但是被各种依赖问题卡死了)
開 docker 直接跑 colab 本地端啊
from n46whisper.
Related Issues (20)
- 低识别率然后字幕中会提示“adjust_required” HOT 3
- 不知能否添加在视频里自动略过其他语言的功能
- 使用Google Gemini AI文本翻译出现未知错误 HOT 2
- 能不能再做一个从谷歌网盘选择文件夹的功能呢?
- 在语音识别库配置完毕,将开始转换这一步出错 HOT 1
- 一直显示 加载模型 Loading model... HOT 3
- 第一步,登陆google账户后就网页卡住,试了好几次都这样,不知道为什么。 HOT 1
- HF_TOKEN这个是 什么意思 不走了 之前都是好的 HOT 20
- 建议加个能导出纯文本txt的选项 HOT 2
- 加载模型错误 HOT 1
- 请求添加whisper的prompt选项
- GPT翻译能否增加一个网址选项,旨在使用其他网站的API
- 关于谷歌网盘文件类型的修改建议
- 建议选择谷歌文件时能够提示已选择的文件信息,和删除已选择的文件的选项 HOT 2
- [建议] 提高机翻双语字幕准确性的辅助工具 HOT 1
- only 2 file on google drive can be proces HOT 2
- 为什么会出现明明有对话 但是却丢了一大段字幕呢? HOT 2
- 我做了一个本地llm翻译、总结的版本,12G显存即可食用,欢迎来玩儿~ HOT 7
- 有概率谷歌云盘挂载无法选择文件 HOT 1
- 推荐一个日文语音识别的工具,ReazonSpeech HOT 2
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from n46whisper.