Comments (2)
感谢,这个功能比较实际。然后我想了一下,按空格分割可能还有若干种情况需要考虑,以避免无效分割:
- 有英文的情况,如
Birthday Liveについて話そうかなと思います
这里若仅以空格分割就反而多余。实际上应避免分割。
- 短句或单词的情况, 如
じゃあ行きまーす せーの ふふ はい はい あー全然ダメでした
这里有较为多的语气词,单字或短句,如果每个元素都分割可能没有必要,反而增加了调轴的工作量。
我的想法是这里可以提供用户自定义的阈值(或直接设定),如提供分句强度的选项。例如,强分割时每个元素都分割,弱分割时只有空格后的词长度大于5才进行分割(暂时选了一个5,我觉得可能这个长度能过滤大部分日语短词的长度)
那么以上例句就被分割为
じゃあ行きまーす せーの ふふ はい はい(adjust_required)
あー全然ダメでした(adjust_required)
这样应该会更实际一点
这几种情况我大概有实现方法的思路。我觉得你看是不是可以提交PR先把分割功能加进来,然后我再去打补丁。
也看你还有没有别的想法。
from n46whisper.
分句强度这个想法非常好!
现在我做的只是单纯把有空格的地方给替换掉换行,没考虑到切得太细碎的问题以及英文的情况。
那我过两天先提交一个PR吧。
from n46whisper.
Related Issues (20)
- 低识别率然后字幕中会提示“adjust_required” HOT 3
- 不知能否添加在视频里自动略过其他语言的功能
- 使用Google Gemini AI文本翻译出现未知错误 HOT 2
- 能不能再做一个从谷歌网盘选择文件夹的功能呢?
- 在语音识别库配置完毕,将开始转换这一步出错 HOT 1
- 一直显示 加载模型 Loading model... HOT 3
- 第一步,登陆google账户后就网页卡住,试了好几次都这样,不知道为什么。 HOT 1
- HF_TOKEN这个是 什么意思 不走了 之前都是好的 HOT 20
- 建议加个能导出纯文本txt的选项 HOT 2
- 加载模型错误 HOT 1
- 请求添加whisper的prompt选项
- GPT翻译能否增加一个网址选项,旨在使用其他网站的API
- 关于谷歌网盘文件类型的修改建议
- 建议选择谷歌文件时能够提示已选择的文件信息,和删除已选择的文件的选项 HOT 2
- [建议] 提高机翻双语字幕准确性的辅助工具 HOT 1
- only 2 file on google drive can be proces HOT 2
- 为什么会出现明明有对话 但是却丢了一大段字幕呢? HOT 2
- 我做了一个本地llm翻译、总结的版本,12G显存即可食用,欢迎来玩儿~ HOT 7
- 有概率谷歌云盘挂载无法选择文件 HOT 1
- 推荐一个日文语音识别的工具,ReazonSpeech HOT 2
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from n46whisper.