DeepMind запустила платформу AndroidEnv: що це таке

1 хв. читання

31 травня 2021

· 0 · 0

Дослідницька лабораторія DeepMind опублікувала платформу AndroidEnv. Вона дозволяє агентам машинного навчання з підкріпленням взаємодіяти із системою Android, тобто з усім спектром застосунків та сервісів для цієї ОС. Платформа має відкритий код і опублікована на GitHub.

Галузь машинного навчання з підкріпленням (або reinforcement learning, RL) дозволяє системі вчитися методом спроб і помилок. На платформі AndroidEnv RL-агенти користуються інтерфейсом, як люди: через дотики, свайпи та взаємодію з побаченим на екрані.

unnamed

У DeepMind кажуть, агенти можуть взаємодіяти з необмеженою кількістю сервісів і програм для ОС Android. Наприклад, агент може користуватись інтернетом, відкривати YouTube, встановлювати будильник або грати в гру (не лише в шашки чи карти, на AndroidEnv планують інтегрувати стратегію The Battle of Polytopia). Тож агенти RL працюватимуть на реальній платформі, якою щодня користуються мільярди людей, а це відкриває нові можливості для досліджень.

unnamed3 unnamed1 unnamed2 unnamed4

Також агентам можна доручити знайти маршрут до парку, забронювати рейс або досягнути максимального рахунку в грі тощо. У DeepMind вважають, що агенти, натреновані в такий спосіб, можуть допомогти у тестуванні пристроїв чи застосунків та покращити інструменти навігації.

Помітили помилку? Повідомте автору, для цього достатньо виділити текст з помилкою та натиснути Ctrl+Enter