Дослідницька лабораторія DeepMind опублікувала платформу AndroidEnv. Вона дозволяє агентам машинного навчання з підкріпленням взаємодіяти із системою Android, тобто з усім спектром застосунків та сервісів для цієї ОС. Платформа має відкритий код і опублікована на GitHub.
Галузь машинного навчання з підкріпленням (або reinforcement learning, RL) дозволяє системі вчитися методом спроб і помилок. На платформі AndroidEnv RL-агенти користуються інтерфейсом, як люди: через дотики, свайпи та взаємодію з побаченим на екрані.
У DeepMind кажуть, агенти можуть взаємодіяти з необмеженою кількістю сервісів і програм для ОС Android. Наприклад, агент може користуватись інтернетом, відкривати YouTube, встановлювати будильник або грати в гру (не лише в шашки чи карти, на AndroidEnv планують інтегрувати стратегію The Battle of Polytopia). Тож агенти RL працюватимуть на реальній платформі, якою щодня користуються мільярди людей, а це відкриває нові можливості для досліджень.
Також агентам можна доручити знайти маршрут до парку, забронювати рейс або досягнути максимального рахунку в грі тощо. У DeepMind вважають, що агенти, натреновані в такий спосіб, можуть допомогти у тестуванні пристроїв чи застосунків та покращити інструменти навігації.
Ще немає коментарів