Нейросеть, способную создавать связанные тематические тексты и не только, выложила в открытый доступ группа разработчиков Яндекс. Как сообщили в пресс-центре компании, YaLM 100B, по оценкам специалистов, на сегодня является самой глобальной моделью в формате GPT. Система двуязычна, может обрабатывать и выдавать информацию как на русском, так и на международном — английском языке.
Условно, нейросеть можно охарактеризовать как цифровой продукт, способный обрабатывать алгоритмы второй сигнальной системы в виде различных языков для использования его семантики. Особенность направления GPT в нейросетях связаны с желанием обучить систему составлять тексты, неотличимые от человеческих. Аббревиатура формата с английской кальки расшифровывается как «предварительно обученный трансформенный генератор».
По данным создателей нейронки, в ней заключено около 100 миллиардов параметров. В работе на русском языке — это единственный экземпляр, обладающий такой широтой концепта. Благодаря такому охвату условий, система полифункциональна: может составить рекламный текст для предоставления товарной карточки, создать рекламный слоган для продвижения, написать ритмический текст на заданную тему или выступить в роли копирайтера. Сеть умеет различать особенности языковых стилей и пользоваться этим при необходимости.
Сейчас работники Яндекс пользуются своим детищем вместе с голосовой помощницей Алисой и поисковиком более, чем в 20 проектах. Искусственный интеллект проходил обучение на суперкомпьютерах компании. За период подготовки в него было загружено около 2 ТБ текстового контента из материалов открытого доступа. Разработка располагается на сервисе GitHab.