Мегатрон Тюрінга: Nvidia і Microsoft створили найпотужніший мовний ШІ

1 хв. читання

13 жовтня 2021

· 2 · 0

Microsoft і Nvidia кажуть, що розробили найпотужнішу мовну модель штучного інтелекту. Вона називається Модель генерування природної мови Мегатрон Тюрінга (або MT-NLG, Megatron-Turing Natural Language Generation model).

За словами Microsoft та Nvidia, модель досягає «неперевершеної точності» у взаємодії з природною мовою, зокрема вміє розуміти прочитане, формувати логічні твердження, робити висновки щодо базових математичних операцій. Вона використовує 530 мільярдів параметрів (тоді як, скажімо, GPT-3 компанії OpenAI має 175 мільярдів параметрів).

Model-Size-Chart

MT-NLG тренували на 15 наборах даних, із яких взяли 270 мільярдів токенів, або лексем. Наймасивнішим серед них був набір даних The Pile, в якому 825 ГБ текстів англійською мовою, зібраних з відкритих джерел.

Водночас під час навчання модель успадкувала стереотипи та упередження з отриманих даних, зазначають дослідники. Microsoft та Nvidia сказали, що працюватимуть над виправленням цієї проблеми.

Це не нове явище для моделей ШІ, які перебирають упередження з отриманих даних, адже дослідники не можуть фільтрувати усю інформацію з мережі. Показовим прикладом цього став ШІ-бот Тей, створений Microsoft у 2016 році, який за кілька годин взаємодії з інтернетом перетворився на антисеміта, який підтримував нацистів.

Помітили помилку? Повідомте автору, для цього достатньо виділити текст з помилкою та натиснути Ctrl+Enter