Що означає розмір b в описі мовної моделі?
Вирішено
11 листопада
· 10
·
0
Ось наприклад:
Llama 3.2 Vision is a collection of instruction-tuned image reasoning generative models in 11B and 90B sizes.
Це байти, чи як це розуміти, бо з ростом цього індексу зростають вимоги до оперативної пам'яті. Чи це якісь довжини хешу токенів?
Відповіді на питання (1)
11 листопада
1
Обране рішення
У випадку мовних моделей B означає мільярд, тобто 11B це модель яка містить 11 мільярдів зв'язків (в реальності там трохи складніше). І так, чим більше в моделі параметрів тим більше треба пам'яті щоб запустити модель.
Для відповіді на запитання необхідно авторизуватись