OpenAI навчили GPT-2 доповнювати і генерувати зображення

1 хв. читання

22 червня 2020

· 46 · 0

Дослідники з OpenAI навчили GPT-2 модель доповнювати та генерувати зображення. Навчена iGPT обходить state-of-the-art підходи у задачі класифікації зображень. Всупереч більшій швидкості, у порівнянні зі згортковими моделями, навчання iGPT більш ресурсомістке. При цьому модель не вимагає змін в архітектурі для використання в інших завданнях.

Transfer learning для задач комп'ютерного зору

Навчання без вчителя і self-supervised навчання — це одне з відкритих завдань в машинному навчанні. Останні дослідження показували успіх моделей, заснованих на Transformer, для задач обробки природної мови. Такі моделі, як BERT, GPT-2, RoBERTa, T5, і їх варіації є state-of-the-art в більшості завдань NLP. Однак поки Transformer архітектурі не вдавалося вдало застосувати для задач обробки зображень.

Transformer моделі, як BERT і GPT-2, не залежать від області задачі. Це означає, що моделі можна використовувати для розв'язання широкого спектра задач без значних архітектурних змін. Спочатку моделі обробляли одномірні послідовності.

GPT-2, навчена на послідовностях пікселях, здатна розуміти такі характеристики двовимірного зображення, як наявність об'єкта та його категорія. Ваги моделі дозволяють досягти state-of-the-art результатів на задачі класифікації зображень. Дослідники тестували iGPT на CIFAR-10, STL-10 і ImageNet. Архітектура iGPT при цьому повністю збігається з GPT-2.

Результати iGPT в порівнянні з попередніми state-of-the-art підходами

Помітили помилку? Повідомте автору, для цього достатньо виділити текст з помилкою та натиснути Ctrl+Enter

Підписатись

Alex 2.1K

Адмін сайту

Коментарі (0)

Ще немає коментарів

Щоб залишити коментар необхідно авторизуватися.

Вхід / Реєстрація

Схожі статті

Що зараз відбувається з генераторами текстів на базі GPT-3

Ви, ймовірно, чули про GPT-3 — технологію для автоматичного створення тексту, як...
Знайомимось з Angular 2, створюючи додаток для пошуку зображень на Giphy

Для тих, хто прийшов зі світу Angular 1, я буду проводити порівняння. Тим не мен...
OpenAI представила Triton — відкриту мову програмування для нейромереж

OpenAI опублікувала Triton 1.0 — мову програмування, що дозволяє писати високоеф...
Перехід до Webpack 2

Webpack знаходиться буквально на межі випуску своєї останньої версії, і це, як о...
React vs. Angular 2

Це стаття-огляд двох популярних інструментів для front-end веб-розробки – React...
Composer 2: Що нового?

Composer, менеджер залежностей для PHP, був випущений близько 8 років тому, а сь...
Основи Webpack 2

Що таке Webpack? Якщо просто, то це пакувальник модулів для вашого JavaScript. А...
Основи Webpack: Частина 2

У першій частині туторіалу ми дізналися, як створити Webpack проект, а також як...