LAION и энтузиасты по всему миру разрабатывают Open Assistant — открытый аналог ChatGPT

Автор: 0×22almostEvil. Некоммерческая организация LAION и энтузиасты по всему миру занимаются разработкой Open Assistant — это проект, цель которого в предоставлении всем желающим доступа к продвинутой большой языковой модели, основанной на принципах чат-бота, с конечной целью революции в инновациях в области обработки естественного языка.

Open Assistant ставит перед собой цель не просто повторить ChatGPT, но создать Ассистента будущего. Он будет понимать и решать поставленные задачи, использовать API, динамически исследовать информацию и многое другое.

Мы хотим создать Ассистента, которого каждый сможет настроить и расширить под свои нужды открытым и доступным способом. Одна из ключевых целей — сделать модель одновременно наиболее эффективной и небольшой, чтобы она могла работать на потребительском оборудовании.

Мы находимся в процессе разработки, опираясь на результаты уже проведённых исследований по применению RLHF к большим языковым моделям. В основном — InstructGPT.

В этой статье поговорим о проекте Open Assistant — и как вы можете внести свой вклад.

А кто это?

LAION занимаются развитием открытых инструментов, моделей и датасетов. Более того, раннее они участвовали в крупных проектах, существенно повлиявших на индустрию — датасет LAION-5B лёг в основу моделей Stable Diffusion.

Однако внести вклад может каждый — даже если вы не имеете никакого отношения к разработке или к машинному обучению: участвуйте в сборе данных для RLHF, общаясь от лица человека или Ассистента, модерируйте контент, переводите, рассказывайте друзьям и публике!

Но… Ведь есть аналоги!

Да, есть, вот их список:

  • ChatGPT, GPT-4, Bing Search от OpenAI & Mircosoft – закрытый исходный код; закрытый датасет; проприетарная лицензия
  • Bard от Google – закрытый исходный код; закрытый датасет; проприетарная лицензия
  • YaLM от Yandex – открытый исходный код; закрытый датасет; Apache 2.0
  • LLaMa от Meta* – открытый исходный код; открытый датасет; GPLv3.0
  • Alpaca от Stanford – открытый исходный код; открытый датасет; MIT
  • BLOOMZ от BigScience – открытый исходный код; открытый датасет; RAIL 1.0
  • Dolly от Databricks Labs – открытый исходный код; открытый датасет; Apache 2.0

Однако давайте подробнее разберём достоинства и недостатки каждой из этих моделей и причину, по которой всё же нужно нечто новое.

Подробнее
Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 4.5 (4 votes)
Источник(и):

Хабр