您好，请问能否在本地直接加载智析大模型，应该使用哪个库，不用通过knowlm这个框架，应该使用哪个库，因为我想在上面修改一些代码

您好，您可以使用transformers包进行加载和推理，所有的过程和其他的模型加载都一致，您可以参考<a href="https://github.com/zjunlp/

最大上下文长度：这个通常在分词的时候处理，比如tokenizer(max_length=100) 输出文本长度：通过设置m

模型加载 about knowlm HOT 8 CLOSED

HuiGe88 commented on September 27, 2024

模型加载

from knowlm.

Comments (8)

MikeDean2367 commented on September 27, 2024

您好，您可以使用transformers包进行加载和推理，所有的过程和其他的模型加载都一致，您可以参考这个文件。如有问题，请告知我 :)

from knowlm.

HuiGe88 commented on September 27, 2024

from transformers import LlamaForCausalLM,LlamaTokenizer

model = LlamaForCausalLM.from_pretrained("models/knowlm-13b-zhixi",context_length=2048,max_new_tokens=1024)
tokenizer=LlamaTokenizer.from_pretrained("models/knowlm-13b-zhixi") 您好，请问这个代码可以加载吗，我想使用显卡加载运行，还需要设置哪些参数？

from knowlm.

MikeDean2367 commented on September 27, 2024

您好，可以的，如果您要使用gpu，请在from_pretrained方法中传入参数device_map="auto"。建议您阅读transformers包的文档来获取更多详细的说明。

如有问题请告知我 :)

from knowlm.

HuiGe88 commented on September 27, 2024

您好，请问这个调用里，最大上下文长度和输出文本长度如何设置，用的哪个参数？

from knowlm.

MikeDean2367 commented on September 27, 2024

最大上下文长度：
这个通常在分词的时候处理，比如tokenizer(max_length=100)
输出文本长度：
通过设置model.generate(max_new_tokens=500)来进行控制，参考代码

from knowlm.

HuiGe88 commented on September 27, 2024

您好，我在加载智析模型的时候显示显存不足，我的显卡是A6000，这还运行不了吗
OutOfMemoryError: CUDA out of memory. Tried to allocate 100.00 MiB (GPU 0;
47.99 GiB total capacity; 46.87 GiB already allocated; 0 bytes free; 46.87 GiB
reserved in total by PyTorch) If reserved memory is >> allocated memory try
setting max_split_size_mb to avoid fragmentation. See documentation for Memory
Management and PYTORCH_CUDA_ALLOC_CONF

from knowlm.

MikeDean2367 commented on September 27, 2024

建议您使用torch_dtype=torch.bfloat16

from knowlm.

zxlzr commented on September 27, 2024

请问您还有其他问题吗？

from knowlm.

Recommend Projects

模型加载 about knowlm HOT 8 CLOSED

Comments (8)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent