Аналіз мільярда облікових записів, отриманих у результаті різних витоків баз користувачів

Alex Alex 30 червня 2020
Аналіз мільярда облікових записів, отриманих у результаті різних витоків баз користувачів

Опублікована статистика що сформована на основі аналізу колекції з мільярда облікових записів, отриманих у результаті різних джерел баз даних з параметрами аутентифікації. Підготовлені вибірки з даними про частоту застосування типових паролів і списки з 1 тис., 10 тис., 100 тис., 1 млн і 10 млн найпопулярніших паролів, які можуть використовуватися для прискорення підбору хешей паролів.

Деякі узагальнення і знахідки:

  • З отриманої колекції в мільярд записів 257 млн були відкинуті як пошкоджені дані (хаотичні дані в невірному форматі) чи тестові облікові записи. Після всіх фільтрації з мільярда записів було виділено 169 млн паролів і 293 млн логінов.
  • Найпопулярніший пароль "123456" зустрічається близько 7 млн разів (0.722% з усіх паролів). Далі з помітним відставанням слідують паролі 123456789, password, qwerty, 12345678.
  • Частка тисячі найпопулярніших паролів становить 6.607% від всіх паролів, частка мільйона найпопулярніших паролів - 36.28%, а 10 млн - 54%.
  • Середній розмір пароля - 9.4822 символів.
  • 12.04% паролів містять спецсимволи.
  • 28.79% паролів складаються тільки з букв.
  • 26.16% паролів включають тільки символи в нижньому регістрі.
  • 13.37% паролів складаються тільки з цифр.
  • 34.41% паролів закінчуються цифрами, але тільки 4.522% з усіх паролів починаються з цифри.
  • Унікальними є тільки 8.83% паролів, решта зустрічаються два і більш рази. Середня довжина унікального пароля 9.7965 символів. Тільки частина з цих паролів представляє хаотичний набір знаків, позбавлений сенсу, і тільки 7.082% включають спецсимволи. 20.02% унікальних паролів складаються тільки з букв і 15.02% тільки літери в нижньому регістрі при середній довжині в 9.36 символів.
  • Зафіксований набір з якісних паролів з високою ентропією, які були схожі за стилем (10-символів, випадкова комбінація цифр, великих та малих літер, відсутність спецсимволів, великі літери на початку і наприкінці) і використовувалися повторно. Частота повторного використання була досить низька (деякі з цих паролів повторюються 10 разів), але все-таки вище, ніж очікувалося паролів подібного рівня.

Коментарі (0)

    Ще немає коментарів

Щоб залишити коментар необхідно авторизуватися.