duxins / alog Goto Github PK
View Code? Open in Web Editor NEWAI-Powered Audio Diary
License: GNU General Public License v2.0
AI-Powered Audio Diary
License: GNU General Public License v2.0
已经购买!觉得这个样子的日记可能可以跟随我很久
有点想法
1,作为碎碎念的日记可能会提到很多特定名词,比如人名,地名,甚至外号,识别不准每次要调文字,是不是能做进某些特定提示引导语音识别软件不要认错这些常用词? 当然如果能调动本地wisper直接在我ios上识别的话可能这个比较容易做到
2,日记可能总结不出什么有价值的,可能周记,月记的总结才有意义,甚至总结一下特定项目,比如过去6个月的日记中总结所有学到的菜谱,这才是每天碎碎念记录的意义,这个怎么实现?
3, 日记重要价值是回头查,如果每天录音碎碎念很快就会找不到自己想要翻找的东西了,如何快速找到特定信息?比如我记得日记里面有记录过哪天去医院看过病,怎么找到这特定日期,找到当时记录下来医生的叮嘱?
4, 基于日记的总结,其实可以很强大,比如按日记记录排出我的未来日程表?按日记记录帮我算出每月收支盈余?
5, 我觉得把上述几条实现,已经是一个基于日记的强大的私人助理了,前景广阔
使用自定义服务器的时候,选择的whisper会是用自定义服务器的token吗?
发现token消耗很快,所以问一下谢谢
安装了很久,最近两天才正式开始用,发现非常好用!
不过有一点好奇的问题是录音文件是一直保存的吗?虽然现在还看不出来,但是有点担心积攒的录音占用的体积。
之后有计划恢复类似于清理多少天前的录音文件这样的功能吗?
If I recit a message on my Apple Watch and open the app on the iPhone a few days later, the current day date is assigned to the audio message.
Wouldn’t it be better if the recording date of the audio message was used as the date?
希望能实现像JustPressRecord那样的锁屏组件和Apple Watch端 这样输入的话会非常方便
为了获得更好的结果现在用的是GPT4,速度略慢一些。
最近笔记圈还挺热门的 Voicenotes,和 ALog 很相像,但是我对这种工具类产品,主要成本在 AI 模型上的订阅制并不看好,AI 作为数字基建通过调用付费,可以节约大量成本,而不是 ChatGPT、Claude、Notion AI、Raycast AI 全部买一遍。类似 perplexity.ai 的开源产品已经好几个了,语音 AI 笔记估计也会越来越多,实际上我已经体验了好几款。
Alog 完成度再高一点也能出圈!
翻看了 Issue,也留言一下我的期待:
已 start 和付费支持!期待~
RT
这样可以更快的实现语音录入。
是否可以实现类似字幕一样的实时显示语音转文本的功能,这样在回忆记录中效果会更好。谢谢。
不知道能不能引入 https://github.com/huacnlee/autocorrect 类的自动 Formatter 库?
由于各种情况,有时候需要补记前一两天的日记。补记后时间线里当天的内容就会乱掉了,希望能够手动变更时间线里的日期。
今天两条都识别文本报错,如下是其中一条的具体错误信息:
版本:v0.2.2
是出了什么问题吗?
方便添加到其他应用,比如任务工具、笔记工具、日记工具等。
场景:用 ALog 将任务和想法灵感快速记录用 AI 整理后自动导入任务工具或笔记工具。比如 Drafts、NotePlan……
这个软件识别非常准确,非常棒,感谢。
但是毕竟语音识别的软件很多,而且免费的也非常多,而且效果也都不错,包括IOS自带的识别也非常精准。
为了能体现差异,而且开拓更大的市场,建议在这个基础上,增加实时识别,实时翻译的功能,这就更加强大了,而且这个领域目前可能还没有开源免费的产品。
已购买高级版,希望大佬能增加批量导出识别后的文字和总结的文字内容,这样方便以后保存在电脑,然后进一步操作之类的。
导出格式的话希望能支持md格式。
感觉可以作为高级版的一个卖点哈,希望作者考虑下~
这款 App 实在太棒了!我特地升级了 iOS 系统,只为能够用上你开发的 Alog。已激情付费支持~~
有几点小建议,希望未来版本能够提供:
1.提供内置的纯文字日记编写功能——毕竟不是每天都方便记录语音日志,有的时候整天和别人在一起,如果可以提供文字日记的选项就好了。
2.提供本地的 Whisper 模型离线语音识别选项,这样既可以在没网的时候使用,也帮助开发者省下了 Whisper API 的费用嘛。
3.希望能上架 Mac App Store。其实用不着额外做什么适配,直接让我们下载 iOS 版本的应用就好啦,只是方便在电脑上整理、查阅、编辑、导出。
4.内置几段开发者你自己测试后觉得好用的总结提示词,以供用户上手即用,这样用户就用不着自己摸索自定义提示词的效果了。
这款日记 App 真的是革命性的创新,我已经抛弃了沿用近十年的原日记 App,希望你能长长久久经营维护这个项目哟~
Perfectly transcribes speech into text. Great app!
As records grow, finding specific dates becomes tricky - a calendar view would be immensely useful.
Groq whisper Doc https://console.groq.com/docs/speech-text
希望提示词可以拖动排序
比如4o等等,或者能够自定义模型就更好了。voicenotes我也试用了,比这个臃肿了许多,而且界面也用不习惯。这个已经star&购买,再次恳请大佬闲暇时能够更新!
手动导出,再导入,还是有点麻烦,如果支持设置webhook,可以一键将笔记发送到其他笔记app中;无需针对个别笔记app做整合,一个webhook就可以了。
1.录制过程增加暂停按钮,有时候会说着说着卡壳,要思考一下。
2.已经可以自定义服务器,是否可以增加自定义模型。
3.导出功能是否能够再优化,目前导出md文件选notion打开会是乱码。
用手表或者手机录,在iPad mini上整理笔记的场景比较多
因为有可能记录的一些想法并不是连续的,需要汇总起来来进行总结操作,或者是要处理几天的任务将它们汇总输出。
既然支持批量处理了,希望也支持批量选择删除。
現在靜音模式下播放語音也會靜音
在中文识别方面Paraformer做的很不错
支持实时和文件转写, 而且每个月有不少免费额度, 对语音日记型用户很友好
希望能增加支持
API文档
RT。
再次删除后,过段时间还是会出现。我用的第三方中转服务器的服务 (不知道是否跟这个有关,但我一直用的第三方的中转服务,之前从来没有出现过该问题)。
应用版本 v0.2.4,iOS 版本 17.5.1。
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.