Датасеты (13)

BREAK: дані, щоб навчити нейромережа розуміти суть питання

BREAK — це датасет для вирішення завдання розуміння суті питання нейромережею. Він призначений для того, щоб моделі вычленяли з комплексних питань сутності, які допоможуть при гене...

Alex в Датасеты 06 лютого 2020

Google опублікували 25 мільйонів відкритих датасетов

Google запустили пошуковий сервіс датасетов для машинного навчання. Google Dataset Search дозволяє шукати дані з 25 мільйонів відкритих датасетов. Пошукова система відрізняється ві...

Alex в Датасеты 31 січня 2020

Google AI опублікували найбільшу карту нейронних зв'язків у мозку

Google AI спільно з дослідницькою командою FlyEM опублікували коннектом мозку мухи. Коннектом — це опис структури в нервовій системі організму. Коннектом отримали з допомогою 3D з...

Alex в Датасеты 31 січня 2020

AraNet: інструмент для аналізу даних із соціальних мереж на арабській

AraNet — це набір предобученных NLP моделей для роботи з даними на арабській мові. У AraNet доступні датасеты з соціальних мереж арабською, щоб навчати двосторонні енкодери передб...

Alex в Датасеты 19 січня 2020

Agriculture-Vision: змагання по застосуванню комп'ютерного зору для сільського господарства

Agriculture-Vision — це датасет для семантичної сегментації з фотографіями фермерських полів. Зображення були зняті з повітря. Всього в датасете близько 95 тисяч фотографій у висо...

Alex в Датасеты 16 січня 2020

Libri-light: датасет для unsupervised розпізнавання мови від FAIR

FAIR опублікували найбільший датасет для розпізнавання мови. Libri-light містить 60 тисяч годин нерозміченого мовлення англійською мовою. Дані для Libri-light збирали із загально...

Alex в Датасеты 06 січня 2020

SketchTransfer: датасет для навчання нейромереж узагальнення

SketchTransfer — це датасет для навчання нейромереж узагальнення з допомогою transfer learning. Дані складаються з реальних розмічених зображень і не розмічених скетчів. Стандартн...

Alex в Датасеты 02 січня 2020

ObjectNet: датасет з об'єктами, які складно розпізнати нейромережі

ObjectNet — це датасет для задач комп'ютерного зору. У ObjectNet немає поділу на навчальну та тестову вибірки, доступна лише тестова. З допомогою датасета можна перевірити узагаль...

Alex в Датасеты 13 грудня 2019

GitHub Typo Corpus: багатомовний датасет з помилками

GitHub Typo Corpus — це набір даних з помилками і граматичними помилками на різних мовах. Дані помилок збирали з комітів GitHub репозиторіїв. Всього в датасете понад 350 тисяч вип...

Alex в Датасеты 10 грудня 2019

Objects365: датасет для розпізнавання об'єктів

Objects365 — це найбільший розмічений датасет для розпізнавання об'єктів. Дані складаються з 638 тисяч зображень, 365 категорій об'єктів і 10 мільйонів розмічених меж об'єктів. Да...

Alex в Датасеты 10 листопада 2019

JRDB: датасет для навчання нейромереж візуальному сприйняттю

JRDB — це набір даних з 64 хвилинами мультимодальних сенсорних даних. Датасет був зібраний за допомогою робота JackRabbot. Дані містять відео 360 градусів, 3D хмари точок, аудіоси...

Alex в Датасеты 10 листопада 2019

VTAB: завдання для перевірки якості уявлень зображень

Google AI опублікували тестові задачі для оцінки моделей, які генерують представлення зображень. VTAB (The Visual Task Adaptation Benchmark) складається з 19 датасетов. Результати...

Alex в Датасеты 08 листопада 2019