Comments (8)
调用api的方式好像变了,我得抽空看看文档做相应的改动
from n46whisper.
调用api的方式好像变了,我得抽空看看文档做相应的改动
好 爱你 我得指着用你这玩意吃饭的(捂脸) 先提前感谢聚聚
from n46whisper.
有这么夸张吗?这翻译功能只是个半成品哎....
如果你有兴趣分享一下你的使用场景也许能提供更多的帮助,可以发邮件给我
from n46whisper.
有这么夸张吗?这翻译功能只是个半成品哎.... 如果你有兴趣分享一下你的使用场景也许能提供更多的帮助,可以发邮件给我
不管是不是半成品 你这个都是目前最好用的啦
我的使用场景就是单纯的做字幕 一些比较廉价的低要求大量字幕翻译工作 所以就目前的功能能用就是完美啦
非要说的话 虽然我也不懂 而且也不知道实现可能是不是成本太高的一点
我有看到你的默认promote是写了请结合上下文进行翻译这一项的,但实际上翻译出来的东西,上下文是被连贯李姐后被翻译出来了的感觉很弱,
不过总之我也看不懂代码,我也看不出来到底是:
整文本内容提交的(所以是GPT3.5太菜——我自己有改到GPT4尝试跑过一下,瞬间放弃了,30倍的价格实在牛比)
还是单行单行的提交的(那这个就是可能我觉得最做梦都想要的,能改成整文本内容就好了的一点)
粽子现在这样也算很好啦 已经是目前能找到最好用的了
from n46whisper.
有这么夸张吗?这翻译功能只是个半成品哎.... 如果你有兴趣分享一下你的使用场景也许能提供更多的帮助,可以发邮件给我
倒不如说 因为所有工具 包括VAD 断句 之类的 所有功能都已经整合在了这里
对于我这种不懂代码的人来说 要是自己整的话估计根本没戏不知道多费事(走到了部署好faster whisper跑出来了结果这一步为止,死活自己折腾不明白怎么导出srt字幕
然后
我有查了一下,白嫖的COLAB的T4这张显卡,除了用到LARGE模型所需的12G显存满足得比较 相对大众自己买显卡 要轻松很多之外,实际CUDA性能之类的在只用到这样的精度的情况下根本就已经被市面上很多便宜的显卡吊打了吧……虽然还是说回来考虑到LARGE模型的12G需求,可能起步都要从类似3060或者一些老titan之类的卡考虑……
额 就是每次文件量一大 上传到谷歌云盘要超久的
然后文件数量多的话 COLAB白嫖的T4的处理速度就要花好长时间
那 能不能 专门出一个本地运行版本的呢 文件可以直接从本地挑
whisper可以直接调用本地GPU
之前自己尝试了一次 发现COLAB连接到本机运行好像基本上只是需要把那行链接代码输入确认一下就好的简单程度的事
但是这样连接到本地运行后 由于原本的代码是基于上传谷歌云盘以及这个逻辑下之后的一系列操作来写的代码
强行连接到本地好像也没意义
比如说提供一个从本机直接选取本地文件 并且直接调用本地GPU(当然提前准备好够跑的硬件是各自自己需要做好的——既然都自己点到本地运行这里来了——的事情)的页面放在这个github串的介绍里 或者在当前页面里提供相关选项(这个感觉会混淆不是那么明白这些事情的人的视听搞得初次用起来的时候更费解)
from n46whisper.
有这么夸张吗?这翻译功能只是个半成品哎.... 如果你有兴趣分享一下你的使用场景也许能提供更多的帮助,可以发邮件给我
碎碎念有点太啰嗦废话打扰到聚聚的休息时间了主动给聚聚道个歉
这些就当只是闲聊也好啦 能够用到聚聚目前做好给大家用的这样的一整个工具已经非常非常非常心怀感谢了
from n46whisper.
更新了API调用,现在应该能用了
翻译功能有非常大的优化空间,你说的这些想法也都是可做甚至本来已经打算做的,然而很遗憾,归根结底三个字:没时间
from n46whisper.
更新了API调用,现在应该能用了 翻译功能有非常大的优化空间,你说的这些想法也都是可做甚至本来已经打算做的,然而很遗憾,归根结底三个字:没时间
爱你
from n46whisper.
Related Issues (20)
- 低识别率然后字幕中会提示“adjust_required” HOT 3
- 不知能否添加在视频里自动略过其他语言的功能
- 使用Google Gemini AI文本翻译出现未知错误 HOT 2
- 能不能再做一个从谷歌网盘选择文件夹的功能呢?
- 在语音识别库配置完毕,将开始转换这一步出错 HOT 1
- 一直显示 加载模型 Loading model... HOT 3
- 第一步,登陆google账户后就网页卡住,试了好几次都这样,不知道为什么。 HOT 1
- HF_TOKEN这个是 什么意思 不走了 之前都是好的 HOT 20
- 建议加个能导出纯文本txt的选项 HOT 2
- 加载模型错误 HOT 1
- 请求添加whisper的prompt选项
- GPT翻译能否增加一个网址选项,旨在使用其他网站的API
- 关于谷歌网盘文件类型的修改建议
- 建议选择谷歌文件时能够提示已选择的文件信息,和删除已选择的文件的选项 HOT 2
- [建议] 提高机翻双语字幕准确性的辅助工具 HOT 1
- only 2 file on google drive can be proces HOT 2
- 为什么会出现明明有对话 但是却丢了一大段字幕呢? HOT 2
- 我做了一个本地llm翻译、总结的版本,12G显存即可食用,欢迎来玩儿~ HOT 7
- 有概率谷歌云盘挂载无法选择文件 HOT 1
- 推荐一个日文语音识别的工具,ReazonSpeech HOT 2
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from n46whisper.