同样的知识库，在官网上的网页上回答的很好，在本地部署的却像在胡言乱语，是因为开源的模型太小了么？有啥办法不？

部署后的问答效果和官网上的网页差别太大，原因是啥？ about qanything HOT 8 OPEN

netease-youdao commented on June 25, 2024

部署后的问答效果和官网上的网页差别太大，原因是啥？

from qanything.

Comments (8)

fire717 commented on June 25, 2024 7

借楼同问，问题差不多就不开新issue了，我的问题是同样的文档同样的问题，本地部署查到的相关文档精度差一些，应该不是LLM的差异问题导致的，但是embed模型和rerank模型在readme写的都是SOTA了，和官网版本应该是一样的吧？
看了下下载的embed模型和rerank模型都在300MB左右，而hf上的模型在1G多，不知道是格式差异还是不是同一个模型。

from qanything.

fire717 commented on June 25, 2024 1

借楼同问，问题差不多就不开新issue了，我的问题是同样的文档同样的问题，本地部署查到的相关文档精度差一些，应该不是LLM的差异问题导致的，但是embed模型和rerank模型在readme写的都是SOTA了，和官网版本应该是一样的吧？看了下下载的embed模型和rerank模型都在300MB左右，而hf上的模型在1G多，不知道是格式差异还是不是同一个模型。

最新版更新后本地测试，检索精度果然提升很多，估计是之前版本默认reranking没有使用到。

from qanything.

fredfany commented on June 25, 2024 1

同问，使用v1.1.1，使用A800的卡，Qwen-7B模型，部署效果与官网有明显差距，请官方给出建议，如何能提升部署后的问答效果

from qanything.

shuracwf commented on June 25, 2024

使用最新的V1.1.0全新部署的，ubuntu，显卡4090，内存256G

from qanything.

liuyijiang1994 commented on June 25, 2024

借楼同问，问题差不多就不开新issue了，我的问题是同样的文档同样的问题，本地部署查到的相关文档精度差一些，应该不是LLM的差异问题导致的，但是embed模型和rerank模型在readme写的都是SOTA了，和官网版本应该是一样的吧？看了下下载的embed模型和rerank模型都在300MB左右，而hf上的模型在1G多，不知道是格式差异还是不是同一个模型。

最新版更新后本地测试，检索精度果然提升很多，估计是之前版本默认reranking没有使用到。

细说大兄弟

from qanything.

fire717 commented on June 25, 2024

借楼同问，问题差不多就不开新issue了，我的问题是同样的文档同样的问题，本地部署查到的相关文档精度差一些，应该不是LLM的差异问题导致的，但是embed模型和rerank模型在readme写的都是SOTA了，和官网版本应该是一样的吧？看了下下载的embed模型和rerank模型都在300MB左右，而hf上的模型在1G多，不知道是格式差异还是不是同一个模型。

最新版更新后本地测试，检索精度果然提升很多，估计是之前版本默认reranking没有使用到。

细说大兄弟

你直接使用新版的就行了，最近一次更新官方说的“v1.1.1紧急更新1. 将rerank功能默认设置为打开，v1.1.0版本以前的代码是默认关闭的，会影响检索问答效果”

from qanything.

rookiexiao123 commented on June 25, 2024

我使用v1.1.1的版本，部署后的问答效果和官网上的网页还是有差距，机器我是A100，只能换模型才能成功部署，是因为换了模型吗

from qanything.

yangy996 commented on June 25, 2024

同问，使用v1.1.1，使用A800的卡，Qwen-7B模型，部署效果与官网有明显差距，请官方给出建议，如何能提升部署后的问答效果

请问下，你的A800卡部署有这个错误吗？到这一步就不往下走了

from qanything.

部署后的问答效果和官网上的网页差别太大，原因是啥？ about qanything HOT 8 OPEN

Comments (8)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent