Реверс-інжиніринг домашнього маршрутизатора з допомогою binwalk. Довіряєте софту свого роутера?

Alex Alex 07 лютого 2020
Реверс-інжиніринг домашнього маршрутизатора з допомогою binwalk. Довіряєте софту свого роутера?


Кілька днів тому, я вирішив провести реверс-інжиніринг прошивки свого роутера використовуючи binwalk.


Я купив собі TP-Link Archer C7 home router. Не найкращий роутер, але для моїх потреб цілком вистачає.


Кожен раз коли я купую новий роутер, я встановлюю OpenWRT. Навіщо? Як правило виробники не сильно піклуються про підтримку своїх роутерів і з часом софт застаріває, з'являються уразливості і так далі, у загальному ви зрозуміли. Тому я віддаю перевагу добре підтримувану співтовариством open-source прошивку OpenWRT.


Скачавши собі OpenWRT, я так же скачав останній спосіб прошивки під мій новий Archer C7 з офіційного сайту і вирішив проаналізувати його. Чисто заради фану і розповісти про binwalk.


Що таке binwalk?


Binwalk — це інструмент з відкритим вихідним кодом для аналізу, реверс-інжинірингу та вилучення образів прошивок.


Створений в 2010 році Крейгом Хеффнер, binwalk може сканувати образи прошивок і знаходити файли, ідентифікувати і витягувати образи файлової системи, виконуваний код, стиснені архіви, завантажувачі і ядра, формати файлів, такі як JPEG і PDF, і багато іншого.


Ви можете використовувати binwalk для реверс-інжинірингу прошивки для того, що б зрозуміти як вона влаштована. Шукати в бінарних файлах уразливості, витягувати файли і шукати бекдоры або цифрові сертифікати. Можна так само знайти opcodes для купи різних CPU.


Ви можете розпакувати образи файлової системи для пошуку певних файлів паролів (passwd, shadow і т. д. І спробувати зламати хеші паролів. Ви можете виконати двійковий аналіз між двома або більше файлами. Ви можете виконати аналіз ентропії даних для пошуку стислих даних або закодованих ключів шифрування. Все це без необхідності доступу до вихідного коду.


В загальному все, що необхідно, є :)


Як працює binwalk?


Основною особливістю binwalk є його сигнатурное сканування. Binwalk може сканувати образ прошивки для пошуку вбудованих типів файлів і файлових систем.


Ви знаєте утиліту командного рядка file?


file /bin/bash
/bin/bash: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/l, for GNU/Linux 3.2.0, BuildID[sha1]=12f73d7a8e226c663034529c8dd20efec22dde54, stripped

Команда fileдивиться на заголовок файлу і шукає підпис (магічне число), щоб визначити тип файлу. Наприклад, якщо файл починається з послідовності байтів 0x89 0x50 0x4E 0x47 0x0D 0x0A 0x1A 0x0A, вона знає, що це файл PNG. На Вікіпедії є список поширених підписів файлів.


Binwalk працює так само. Але замість того, щоб шукати підписи тільки на початку файлу, binwalk буде сканувати весь файл. Крім того, binwalk може витягти файли, знайдені в образі.


Інструменти file та binwalk використовують бібліотеку libmagic для ідентифікації підписів файлів. Але binwalk додатково підтримує список користувацьких магічних сигнатур для пошуку стислих / заархівованих файлів заголовків прошивок, ядер Linux, завантажувачів, файлових систем і так далі.


Давайте повеселимося?


Установка binwalk


Binwalk підтримується на декількох платформах, включаючи Linux, OSX, FreeBSD і Windows.


Щоб встановити останню версію binwalk, ви можете завантажити вихідний код і слідувати інструкції установки або короткого керівництва, доступному на веб-сайті проекту.


У Binwalk багато різних параметрів:


$ binwalk

Binwalk v2.2.0
Craig Heffner, ReFirmLabs
https://github.com/ReFirmLabs/binwalk

Usage: binwalk [OPTIONS] [FILE1] [FILE2] [FILE3] ...

Signature Scan Options:
-B, --signature Scan target file(s) for common file signatures
-R, --raw=<str> Scan target file(s) for the specified sequence of bytes
-A, --opcodes Scan target file(s) for common executable opcode signatures
-m, --magic=<file> Specify a custom magic file to use
-b, --dumb Disable smart signature keywords
-I, --invalid Show results marked as invalid
-x, --exclude=<str> Exclude results that match <str>
-y, --include=<str> Only show results that match <str>

Extraction Options:
-e, --extract Automatically extract known file types
-D, --dd=<type:ext:cmd> Extract <type> signatures, give the files an extension of <ext>, and execute <cmd>
-M, --matryoshka Recursively scan files extracted
-d, --depth=<int> Limit matryoshka recursion depth (default: 8 levels deep)
-C, --directory=<str> Extract files/folders to a custom directory (default: current working directory)
-j, --size=<int> Limit the size of each file extracted
-n, --count=<int> Limit the number of files extracted
-r, --rm Delete carved files after extraction
-z, --carve Carve data from files, but don't execute extraction utilities
-V, --subdirs Extract into sub-directories named by the offset

Entropy Options:
-E, --entropy Calculate file entropy
-F, --Use fast faster, but less detailed, entropy analysis
-J, --save Save plot as a PNG
-Q, --nlegend Omit the legend from the entropy plot graph
-N, --nplot Do not generate an entropy plot graph
-H, --high=<float> Set the rising edge entropy trigger threshold (default: 0.95)
-L, --low=<float> Set the falling edge entropy trigger threshold (default: 0.85)

Binary Diffing Options:
-W, --hexdump Perform a hexdump / diff of a file or files
-G, --green Only show lines containing bytes that are the same among all files
-i, --red Only show lines containing bytes that are different among all files
-U, --blue Only show lines containing bytes that are different among some files
-u, --similar Only display lines that are the same between all files
-w, --terse Diff all files, but only display a hex dump of the first file

Raw Compression Options:
-X, --deflate Scan for raw deflate compression streams
-Z, --lzma Scan for raw LZMA compression streams
-P, --partial Perform a superficial, but faster, scan
-S, --stop Stop after the first result

General Options:
-l, --length=<int> Number of bytes to scan
-o, --offset=<int> Start scan at this file offset
-O, --base=<int> Add a base address to all printed offsets
-K, --block=<int> Set file block size
-g, --swap=<int> Reverse every n bytes before scanning
-f, --log=<file> Log results to file
-c, --csv Log results to file in format CSV
-t, --term Format output to fit the terminal window
-q, --quiet Suppress output to stdout
-v, --verbose Enable verbose output
-h, --help Show help output
-a, --finclude=<str> Only scan files whose names match this regex
-p, --fexclude=<str> Do not scan files whose names match this regex
-s, --status=<int> Enable the status server on the specified port

Сканування образів


Почнемо з пошуку сигнатур файлів всередині образу (образ з сайту TP-Link).


Запуск binwalk з параметром --signature:


$ binwalk --signature --term archer-c7.bin

DECIMAL HEXADECIMAL DESCRIPTION
------------------------------------------------------------------------------------------
21876 0x5574 U-Boot version string, "U-Boot 1.1.4-g4480d5f9-dirty (May
20 2019 - 18:45:16)"
21940 0x55B4 CRC32 поліноміальні table, big endian
23232 0x5AC0 uImage header, header size: 64 bytes, header CRC:
0x386C2BD5, created: 2019-05-20 10:45:17, image size:
41162 bytes, Data Address: 0x80010000, Entry Point:
0x80010000, data CRC: 0xC9CD1E38, OS: Linux, CPU: MIPS,
image type: Firmware Image compression type: lzma, image
name: "u-boot image"
23296 0x5B00 LZMA compressed data, properties: 0x5D dictionary size:
8388608 bytes, uncompressed size: 97476 bytes
64968 0xFDC8   XML document, version: "1.0"
78448 0x13270 uImage header, header size: 64 bytes, header CRC:
0x78A267FF, created: 2019-07-26 07:46:14, image size:
1088500 bytes, Data Address: 0x80060000, Entry Point:
0x80060000, data CRC: 0xBB9D4F94, OS: Linux, CPU: MIPS,
image type: Multi-File Image compression type: lzma,
image name: "MIPS OpenWrt Linux-3.3.8"
78520 0x132B8 LZMA compressed data, properties: 0x6D dictionary size:
8388608 bytes, uncompressed size: 3164228 bytes
1167013 0x11CEA5 Squashfs filesystem, little endian, version 4.0,
compression:xz, size: 14388306 bytes, 2541 inodes,
blocksize: 65536 bytes, created: 2019-07-26 07:51:38
15555328 0xED5B00 gzip compressed data from Unix, last modified: 2019-07-26
07:51:41

Тепер у нас багато інформації про цей образ.


Образ використовує U-Boot в якості завантажувача (заголовок образу за адресою 0x5AC0 і стислий образ завантажувача за адресою 0x5B00). Грунтуючись на заголовку uImage за адресою 0x13270, ми знаємо, що архітектура процесора MIPS, а ядро Linux — версія 3.3.8. І на підставі образу, знайденого за адресою 0x11CEA5, ми можемо бачити, що rootfs є файловою системою squashfs.


Давайте тепер распакуем завантажувач (U-Boot) за допомогою команди dd:


$ dd if=archer-c7.bin of=u-boot.bin.lzma bs=1 skip=23296 count=41162
41162+0 records in
41162+0 records out
41162 bytes (41 kB, 40 KiB) copied, 0,0939608 s, 438 kB/s

Оскільки образ стиснутий за допомогою LZMA, нам потрібно розпакувати його:


$ unlzma u-boot.bin.lzma

Тепер у нас є образ U-Boot:


$ ls -l u-boot.bin
-rw-rw-r-- 1 sprado sprado 97476 Fev 5 08:48 u-boot.bin

Як щодо пошуку дефолтного значення для bootargs?


$ strings u-boot.bin | grep bootargs
bootargs
bootargs=console=ttyS0,115200 board=AP152 rootfstype=squashfs init=/etc/preinit mtdparts=spi0.0:128k(factory-uboot),192k(u-boot),64k(ART),1536k(uImage),[email protected](rootfs) mem=128M

Змінна оточення U-Boot bootargs використовується для передачі параметрів ядра Linux. І з вищенаведеного, ми краще розуміємо флеш-пам'ять пристрою.


Як щодо вилучення образу ядра Linux?


$ dd if=archer-c7.bin of=uImage bs=1 skip=78448 count=1088572
1088572+0 records in
1088572+0 records out
1088572 bytes (1,1 MB, 1,0 MiB) copied, 1,68628 s, 646 kB/s

Ми можемо перевірити, що образ був успішно витягнутий з допомогою команди file:


$ file uImage
uImage: u-boot legacy uImage, MIPS OpenWrt Linux-3.3.8, Linux/MIPS, Multi-Image File (lzma), 1088500 bytes, Fri Jul 26 07:46:14 2019, Load Address: 0x80060000, Entry Point: 0x80060000, Header CRC: 0x78A267FF, Data CRC: 0xBB9D4F94

Формат файлу uImage — це в основному образ ядра Linux з додатковим заголовком. Давайте видалимо цей заголовок, щоб отримати остаточний образ ядра Linux:


$ dd if=uImage of=Image.lzma bs=1 skip=72
1088500+0 records in
1088500+0 records out
1088500 bytes (1,1 MB, 1,0 MiB) copied, 1,65603 s, 657 kB/s

Образ стиснутий, тому давайте распакуем його:


$ unlzma Image.lzma

Тепер у нас є образ ядра Linux:


$ ls -la Image
-rw-rw-r-- 1 sprado sprado 3164228 Fev 5 10:51 Image

Що ми можемо зробити з чином ядра? Ми могли б, наприклад, зробити пошук по рядках в образі і знайти версію ядра Linux і дізнатися про довкілля, використовуваної для складання ядра:


$ strings Image | grep "Linux version"
Linux version 3.3.8 ([email protected]) (gcc version 4.6.3 20120201 (prerelease) (Linaro GCC 4.6-2012.02) ) #1 Mon May 20 18:53:02 CST 2019

Незважаючи на те, що прошивка була випущена в минулому році (2019 р.), коли я пишу цю статтю, вона використовує стару версію ядра Linux (3.3.8), випущену в 2012 р., скомпилированную з дуже старою версією GCC (4.6) також з 2012 р.!
(прим. перекл. ще довіряєте своїм роутера в офісі і вдома?)


З опцією --opcodes також ми можемо використовувати binwalk для пошуку машинних інструкцій і визначення архітектури процесора образу:


$ binwalk --opcodes Image
DECIMAL HEXADECIMAL DESCRIPTION
--------------------------------------------------------------------------------
2400 0x960 MIPS instructions, function epilogue
2572 0xA0C MIPS instructions, function epilogue
2828 0xB0C MIPS instructions, function epilogue

Як щодо кореневої файлової системи? Замість того, щоб витягати образ вручну, давайте скористаємося опцією binwalk --extract:


$ binwalk --extract --quiet archer-c7.bin

Повна коренева файлова система буде витягнута в підкаталог:


$ cd _archer-c7.bin.extracted/squashfs-root/

$ ls
bin dev etc lib mnt overlay proc rom root sbin sys tmp usr var www

$ cat etc/banner
MM NM МММММММ M M
$MMMMM MMMMM MMMMMMMMMMM MMM MMM
MMMMMMMM MM MMMMM. MMMMM:MMMMMM: MMMM MMMMM
MMMM= MMMMMM MMM MMMM MMMMM MMMM MMMMMM MMMM MMMMM'
MMMM= MMMMM MMMM MM MMMMM MMMM MMMM MMMMNMMMMM
MMMM= MMMM MMMMM MMMMM MMMM MMMM MMMMMMMM
MMMM= MMMM MMMMMM MMMMM MMMM MMMM MMMMMMMMM
MMMM= MMMM MMMMM, NMMMMMMMM MMMM MMMM MMMMMMMMMMM
MMMM= MMMM MMMMMM MMMMMMMM MMMM MMMM MMMM MMMMMM
MMMM= MMMM MM MMMM MMMM MMMM MMMM MMMM MMMM
MMMM$ ,MMMMM MMMMM MMMM MMM MMMM MMMMM MMMM MMMM
МММММММ: МММММММ M MMMMMMMMMMMM МММММММ MMMMMMM
MMMMMM MMMMN M MMMMMMMMM MMMM MMMM
MMMM M M M MMMMMMM
M
---------------------------------------------------------------
For those about to rock... (%C, %R)
---------------------------------------------------------------

Тепер ми можемо зробити багато різного.


Ми можемо шукати файли конфігурації, хеші паролів, криптографічні ключі та цифрові сертифікати. Ми можемо проаналізувати двійкові файли пошуку помилок і вразливостей.


З допомогою qemu і chroot ми можемо навіть запустити (емулювати) виконуваний файл з образу:


$ ls
bin dev etc lib mnt overlay proc rom root sbin sys tmp usr var www

$ cp /usr/bin/qemu-mips-static .

$ sudo grub . ./qemu-mips-static bin/busybox
BusyBox v1.19.4 (2019-05-20 18:13:49 CST) multi-call binary.
Copyright (C) 1998-2011 Erik Andersen, Rob Landley, Denys Vlasenko
and others. Licensed under GPLv2.
See source for distribution full notice.

Usage: busybox [function] [arguments]...
or: busybox --list [full]
or: function [arguments]...

BusyBox is a multi-call binary that combines many common Unix
utilities into a single executable. Most people will create a
link to busybox for each function they wish to use and BusyBox
will act like whatever it was invoked as.

Currently defined functions:
[, [[, addgroup, adduser, arping, ash, awk, basename, cat, chgrp, chmod, chown, chroot, clear, cmp, cp, crond, crontab, cut, date, dd, delgroup, deluser, dirname, dmesg, echo, egrep, env, expr, false,
fgrep, find, free, fsync, grep, gunzip, gzip, halt, head, hexdump, hostid, id ifconfig, init, insmod, kill, killall, klogd, ln, lock, logger, ls, lsmod, mac_addr, md5sum, mkdir, mkfifo, mknod, mktemp,
mount, mv, nice, passwd, pgrep, pidof, ping, ping6, pivot_root, poweroff, printf, ps, pwd, readlink, reboot, reset, rm, rmdir, rmmod, route, sed, seq, sh, sleep, sort, start-stop-daemon, strings,
switch_root, sync, sysctl, tail, tar, tee, telnet, test, tftp, time, top, touch, tr, traceroute, true, udhcpc, umount, uname, uniq, uptime, vconfig, vi, watchdog, wc, wget, which, xargs, yes, zcat

Здорово! Але зверніть увагу, що версія BusyBox — 1.19.4. Це дуже стара версія BusyBox, випущена в квітні 2012 року.


Таким чином, TP-Link випускає образ прошивки в 2019 році з використанням програмного забезпечення (GCC toolchain, kernel, BusyBox і т. Д.) 2012 року!


Тепер ви розумієте, чому я завжди встановлюю OpenWRT на свої роутери?


Це ще не все


Binwalk також може виконувати ентропійний аналіз, друкувати необроблені энтропийные дані і генерувати энтропийные графіки. Зазвичай більша ентропія спостерігається, коли байти в образі випадкові. Це може означати, що образ містить зашифрований, стиснутий або обфусцированный файл. Хардкорно прописаний ключ шифрування? Чому б і ні.



Ми також можемо використовувати параметр --raw для пошуку користувача послідовності необроблених байтів в образі або параметр --hexdump для виконання шістнадцятирічного дампа, що порівнює два або більше вхідних файлу.


Користувальницькі сигнатури можуть бути додані в binwalk або через файл користувальницьких сигнатур, вказаний в командному рядку за допомогою параметра --magic, або шляхом додавання їх в теку $ HOME / .config / binwalk / magic.


Ви можете знайти більше інформації про binwalk офіційній документації.


Розширення binwalk


Існує API binwalk, реалізований у вигляді модуля Python, який може використовуватися будь-скриптом Python для програмного виконання сканування binwalk, а утиліта командного рядка binwalk може бути майже повністю дублювалася всього двома рядками коду Python!


import binwalk
binwalk.scan()

З допомогою Python API ви також можете створювати плагіни під Python для налаштування і розширення binwalk.


Також існує плагін IDA хмарна версія Binwalk Pro.


Так чому б вам не завантажити образ прошивки з Інтернету і не спробувати binwalk? Обіцяю, вам буде дуже весело :)

Source: habr.com

Коментарі (0)

    Ще немає коментарів

Щоб залишити коментар необхідно авторизуватися.