Comments (4)
您好,我在本地测试基于modelscope-agent-7b作为大脑的Agent时,其效果与魔搭创空间上ModelScopeGPT的在线测试差距明显。
比如本地测试时模型并不能处理“写一个20字以内的故事,再念出来”这样需要多步调用工具的单句请求,只有多次请求才能实现;而ModelScopeGPT却可以执行得很好,同时速度也要快很多。
请问ModelScopeGPT所基于的LLM是什么呢?和modelscope-agent-7b同样是在Qwen-7B基础上微调的吗?
如果尚不能透露具体信息,也想了解一下底座模型以及参数规模是什么,期待您的回复!
ModelScopeGPT是基于一个更大规模的底座,目前的modelscope-agent-7b训练时候用的MSAgent-Bench数据集,这个数据集包含了很多通用的工具指令调用。我们预计下周会开放一个modelscope-agent-7b只在魔搭GPT相关的模型工具调用数据集上训练的版本,这样在魔搭相关模型调用上准确率会更高
MSAgent-Bench:https://modelscope.cn/datasets/damo/MSAgent-Bench/summary
from modelscope-agent.
您好,我在本地测试基于modelscope-agent-7b作为大脑的Agent时,其效果与魔搭创空间上ModelScopeGPT的在线测试差距明显。
比如本地测试时模型并不能处理“写一个20字以内的故事,再念出来”这样需要多步调用工具的单句请求,只有多次请求才能实现;而ModelScopeGPT却可以执行得很好,同时速度也要快很多。
请问ModelScopeGPT所基于的LLM是什么呢?和modelscope-agent-7b同样是在Qwen-7B基础上微调的吗?
如果尚不能透露具体信息,也想了解一下底座模型以及参数规模是什么,期待您的回复!ModelScopeGPT是基于一个更大规模的底座,目前的modelscope-agent-7b训练时候用的MSAgent-Bench数据集,这个数据集包含了很多通用的工具指令调用。我们预计下周会开放一个modelscope-agent-7b只在魔搭GPT相关的模型工具调用数据集上训练的版本,这样在魔搭相关模型调用上准确率会更高
MSAgent-Bench:https://modelscope.cn/datasets/damo/MSAgent-Bench/summary
感谢您的回复,我理解了,期待最新开发的版本~
还有一个问题是,我尝试在Swift框架的基础上微调一个Agent模型,阅读源码之后我理解模型的输入为完整的文本内容包括(system、user、assistant),而label为所有assistant内容,这是为什么呢?
输入里为什么依旧存在assistant的内容?如果我去掉这一部分会有什么影响吗?希望能够得到解答!谢谢!
from modelscope-agent.
还有就是Agent模型的微调可以直接用其他框架的SFT脚本吗?还是说在优化任务上是有区别的?
from modelscope-agent.
目前我们在做agent模型的训练,以及测评链路,后续会有文档以及教程,可以关注。到时候会发送到这里。
from modelscope-agent.
Related Issues (20)
- [<Agent component: framework|tool|llm|etc...>]add parameter of image_gen tool
- [RAG] What is the best way to add RAG in Agent? HOT 3
- Tool Nonimplementation Error HOT 2
- [<Agent component: framework|tool|llm|etc...>] HOT 1
- TypeError: Can't instantiate abstract class Vllm with abstract method _chat_no_stream HOT 2
- [framework] Refactor Non-Core Requirements to Runtime/On-Demand Dependencies HOT 1
- qwen1.5和qwen2调用agent方式不一样吗?? HOT 5
- Bad example: With Modelscope-Agent-Server, Qwen2 could be used by OpenAI SDK with tool calling ability, please find detail in doc. HOT 3
- [<Agent component: framework|tool|llm|etc...>] ollama._types.ResponseError: pull model manifest: file does not exist
- llm:调用vllm部署的大模型openai接口时报错 HOT 2
- 无法用dashscope model server使用OpenAI SDK HOT 13
- max_tokens must be at least 1, got -160 HOT 1
- 调用qwen-max模型,还需要消耗显存吗 HOT 2
- MSAgent-Bench的benchmark有没有具体的评估脚本?
- 使用这个 sh scripts/run_assistant_server.sh 部署模型之后,会不会比VLLM速度慢很多 HOT 8
- 参照文档搭建支持function calling的qwen2 openai server时报错openai.BadRequestError: Error code: 400
- MemoryWithRag 方法传了本地的llm模型,但是还是提示AssertionError: DASHSCOPE_API_KEY should be set in environ. HOT 2
- 本地部署之后,AgentFabric上操作就会报错。preview_send_message user_agent = _state['user_agent'] KeyError: 'user_agent' HOT 11
- [Agentfabric]: need stop current round, retry last round HOT 1
- 如何可以使用http://0.0.0.0:7860本地访问,而不是默认的http://127.0.0.1:7860访问 HOT 1
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from modelscope-agent.