Запитати

Що означає розмір b в описі мовної моделі?

Вирішено
11 листопада · 10 ·
0

Ось наприклад:

Llama 3.2 Vision is a collection of instruction-tuned image reasoning generative models in 11B and 90B sizes.

Це байти, чи як це розуміти, бо з ростом цього індексу зростають вимоги до оперативної пам'яті. Чи це якісь довжини хешу токенів?

ші ai

Відповіді на питання (1)

11 листопада
1
Обране рішення

У випадку мовних моделей B означає мільярд, тобто 11B це модель яка містить 11 мільярдів зв'язків (в реальності там трохи складніше). І так, чим більше в моделі параметрів тим більше треба пам'яті щоб запустити модель.


Для відповіді на запитання необхідно авторизуватись

Вхід