Comments (8)
借楼同问,问题差不多就不开新issue了,我的问题是同样的文档同样的问题,本地部署查到的相关文档精度差一些,应该不是LLM的差异问题导致的,但是embed模型和rerank模型在readme写的都是SOTA了,和官网版本应该是一样的吧?
看了下下载的embed模型和rerank模型都在300MB左右,而hf上的模型在1G多,不知道是格式差异还是不是同一个模型。
from qanything.
借楼同问,问题差不多就不开新issue了,我的问题是同样的文档同样的问题,本地部署查到的相关文档精度差一些,应该不是LLM的差异问题导致的,但是embed模型和rerank模型在readme写的都是SOTA了,和官网版本应该是一样的吧? 看了下下载的embed模型和rerank模型都在300MB左右,而hf上的模型在1G多,不知道是格式差异还是不是同一个模型。
最新版更新后本地测试,检索精度果然提升很多,估计是之前版本默认reranking没有使用到。
from qanything.
同问,使用v1.1.1,使用A800的卡,Qwen-7B模型,部署效果与官网有明显差距,请官方给出建议,如何能提升部署后的问答效果
from qanything.
使用最新的V1.1.0全新部署的,ubuntu,显卡4090,内存256G
from qanything.
借楼同问,问题差不多就不开新issue了,我的问题是同样的文档同样的问题,本地部署查到的相关文档精度差一些,应该不是LLM的差异问题导致的,但是embed模型和rerank模型在readme写的都是SOTA了,和官网版本应该是一样的吧? 看了下下载的embed模型和rerank模型都在300MB左右,而hf上的模型在1G多,不知道是格式差异还是不是同一个模型。
最新版更新后本地测试,检索精度果然提升很多,估计是之前版本默认reranking没有使用到。
细说 大兄弟
from qanything.
借楼同问,问题差不多就不开新issue了,我的问题是同样的文档同样的问题,本地部署查到的相关文档精度差一些,应该不是LLM的差异问题导致的,但是embed模型和rerank模型在readme写的都是SOTA了,和官网版本应该是一样的吧? 看了下下载的embed模型和rerank模型都在300MB左右,而hf上的模型在1G多,不知道是格式差异还是不是同一个模型。
最新版更新后本地测试,检索精度果然提升很多,估计是之前版本默认reranking没有使用到。
细说 大兄弟
你直接使用新版的就行了,最近一次更新官方说的“v1.1.1紧急更新1. 将rerank功能默认设置为打开,v1.1.0版本以前的代码是默认关闭的,会影响检索问答效果”
from qanything.
我使用v1.1.1的版本,部署后的问答效果和官网上的网页还是有差距,机器我是A100,只能换模型才能成功部署,是因为换了模型吗
from qanything.
同问,使用v1.1.1,使用A800的卡,Qwen-7B模型,部署效果与官网有明显差距,请官方给出建议,如何能提升部署后的问答效果
请问下,你的A800卡部署有这个错误吗?到这一步就不往下走了
from qanything.
Related Issues (20)
- 纯python环境部署,如何把OpenAI API换成千问14B的,通过url? HOT 1
- [BUG] 获取算力时出错 HOT 4
- mysql.connector.errors.DatabaseError: 1040 (HY000): Too many connections HOT 7
- [BUG] 本地部署出现回复不了,重复回复的问题 HOT 1
- 移除langchain的依赖
- 云端启动为什么会有2个不存在的whl文件 HOT 3
- 文档总结类型的query
- 是否能把前端代码开源出来 HOT 1
- 有支持多模态模型的计划吗?能够上传图片进行回答。
- ImportError: .../miniconda3/envs/qt/lib/python3.10/site-packages/vllm/_C.cpython-310-x86_64-linux-gnu.so: undefined symbol: _ZN2at4_ops15to_dtype_layout4callERKNS_6TensorEN3c108optionalINS5_10ScalarTypeEEENS6_INS5_6LayoutEEENS6_INS5_6DeviceEEENS6_IbEEbbNS6_INS5_12MemoryFormatEEE HOT 6
- 相关性得分是否可以限制在1以下 HOT 1
- [BUG] llama_new_context_with_model: failed to initialize Metal backend HOT 1
- [BUG] 纯python环境安装gpu利用率默认参数为0.61导致rtx3060用不起。(手动修正代码见正文) HOT 1
- [BUG] <elasticsearch.ApiError: ApiError(503, 'search_phase_execution_exception', None)> HOT 1
- [BUG] No Space Left on Device when Docker Save the images into a tar file
- [BUG] docker模式安装在ubuntu环境下启动报404 HOT 1
- 怎么老是下载sanic? HOT 3
- [BUG] <unauthorized: authentication required> HOT 1
- 如何去使用自己的embedding模型在qanything上
- [BUG] <通过mac m1 纯python部署,返回信息错乱>
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from qanything.