OpenAI опублікувала Triton 1.0 — мову програмування, що дозволяє писати високоефективний GPU-код для робочих навантажень штучного інтелекту. Мова сумісна з Python і має відкритий код, опублікований на GitHub.
Розробники Triton хочуть створити відкрите середовище, де можна було б швидко писати код і отримати кращу продуктивність, ніж у платформи Nvidia CUDA. Водночас автори хочуть досягти більшої гнучкості, ніж мають інші предметно орієнтовані мови програмування і компілятори.
Зазначено, що з Triton можна написати ядра матричного множення FP16, які відповідають продуктивності cuBLAS, усього за 25 рядків коду.
Архітектуру сучасних графічних процесорів можна розбити на три основні компоненти — DRAM, SRAM та ALU. Під час оптимізації коду CUDA є багато нюансів з цими компонентами, які потрібно враховувати й налаштовувати вручну. Натомість Triton спрощує розробку спеціалізованих ядер, які можуть бути значно швидшими, ніж у бібліотеках загального призначення. Компілятор Triton автоматично оптимізує та паралелізує код і готує його для запуску на останніх графічних процесорах Nvidia.
Зараз Triton підтримується для Linux та графічних процесорів NVIDIA, підтримка AMD GPU і CPU зараз у розробці. Інструкції щодо встановлення і використання Triton можна знайти в офіційній документації.
Ще немає коментарів