Comments (3)
300000 - достаточный размер, можно попробовать поменять формат или потыкать параметры при обучении и генерации. Я обучаю его отвечать на комментарии(два датасета в 2500 и 25000 комментариев, т.к. иначе обучение занимает целую вечность в колабе) и формат сделал следующий:
[Вопрос] Текст комментария 1
[Ответ] Текст комментария 2 [Конец]
Где текст комментариев в одну строку без переносов. Подаю на вход, например:
[Вопрос] Расскажи анекдот
[Ответ]
и он пытается рассказывать анекдоты, т.е. вполне обучается формату, и если запрашивать достаточно длинную последовательность, то там будет токен [Конец] и мысль не обрывается на середине.
from ru-gpts.
Спасибо за ответ.
... да - игра с параметрами ( max_length=420, repetition_penalty=1.0
) немного могла:
В этом выпуске мы поговорим о том, как мы использовали Microsoft Azure, какие инструменты и технологии использовать для создания облачных сервисов, а также о том, как использовать технологии и инструменты, которые позволяют создавать облачные сервисы, которые могут работать с облачными сервисами, а именно это облачными сервисами, и мобильными сервисами.
[Сущность] Microsoft Azure [Конец] Microsoft Azure.
[Сущность] Microsoft [Конец]
[Предложение]
[Предложение] Microsoft Azure Microsoft Azure [Конец]
В этом выпуске мы поговорим о том, как мы использовали Microsoft Azure и о том, как мы внедрили в наш облачный бизнес PaaS-сервис.
[Сущность] Microsoft [Конец]
[Предложение] В этом выпуске мы поговорим о том, что Microsoft Azure может стать облачным провайдером, как Paaaс, что может стать провайдером и как сервисом и как сервисом Azure.
[Сущность как сервисом Azure как сервисом как сервис Azure как сервис и как сервис Azure что будет Azure что будет в Azure что будет с Azure что Azure будет с ним делать и почему Azure будет, как сервис и что будет Azure и почему Azure что будет Azure будет с Pa как сервис и что это сервис и что будет Azure что Azure что будет Azure что будет Pa Azure что будет Azure и что будет PHub что будет Paaaaaaa Azure как сервис и как сервис как сервис как сервис и как сервис Azure что будет Pa Paaa Azure что будет Paa Paaaaaaa PaaaS-huba-PaaaaS и как сервис как сервис Azure как сервис и что будет Pa-h-h-huba-Paaaa-hubaS как сервис Azure что будет что это и что будет Pa-huba-h-s-h-h-huba-h-huba-hub и как Pa и как Pa-huba-huba-hub-huba-huba-hub-huba-hub-hub как это как Azure и т.
[Сущность Pa-hub и что-hub и что будет Pa-hub как Azure-hub и так и так и что-hub и что
... конечно далеко от того, что надо - много "мусора".
from ru-gpts.
Для задачи NER мы не проверяли наши модели. возможно ваша модель не доучилась + как было сказано, параметры генерации очень решают
from ru-gpts.
Related Issues (20)
- describe carbon emission
- ruGPT3XL_generation.ipynb not working HOT 3
- Новость курс
- AssertionError: model parallel group is not initialized HOT 1
- The model requires `num_beams`, although it is not needed in the example HOT 3
- Ru-gpts for chit-chat bot HOT 2
- Прямая трансляция по apex legends HOT 1
- Games
- Correct data format for fine-tuning RUGPT3 models
- A
- The XL Model and the latest DeepSpeed
- Как настроить на вопрос\ответ? HOT 2
- Apackage missing HOT 2
- Hello
- Are there hardware requirements to execute the script? HOT 17
- Ускорение инференса rugpt3-large HOT 1
- Как embedding'и получить и какой они длины? HOT 1
- Unable to use RuGPT3FinetuneHF.ipynb Colab notebook HOT 1
- Link to code implementation is not available
- No "nvcc" utilite founded during environment installation HOT 3
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from ru-gpts.