Точні та стійкі методи розпізнавання ківі — це одна з відкритих проблем у створенні роботів для селективного збору врожаю. Системи комп'ютерного зору постають перед такими труднощами, як зміна світлових умов і перекриття об'єктів. Щоб вирішити ці складності, дослідники використовують модель семантичної сегментації та пропонують дві нові техніки для препроцесинга вхідних зображень.
Проблеми минулих підходів
Основними причинами відсутності комерційних проєктів з використанням роботів для збору врожаю є низька точність підходів до розпізнавання фруктів та неефективність методів локалізації.
Архітектура моделі
В якості архітектури моделі дослідники використовують нейромережу FCN-8s. Нейромережу навчали на 63 знімках зі 113 ківі. Навчальна вибірка була розмічена вручну.
Тестування підходу
Ефективність запропонованого підходу оцінювали у 3D моделі фруктового саду. Тестова локація забезпечувала відмінність у світлових умовах: стандартне, перетримане і яскраве. Тільки модель семантичної сегментації видає передбачення з F-мірою 0.82 на наборі зображень зі стандартним освітленням. Однак зображення з ускладненим освітленням метрика падає до 0.13. При додаванні запропонованого методу препроцесинга бал моделі на складних даних підвищується до 0.42. За результатами тестів, підсумкова модель змогла розпізнати 87% не перекритих і 30% перекритих фруктів на знімках для всіх типів освітлення.
Джерело: https://arxiv.org/pdf/2006.11729.pdf
Ще немає коментарів