Що потрібно знати про Ceph, централізованому сховищу з відкритим вихідним кодом, щоб вирішити, чи підходить воно вашій компанії. У статті буде порівняння з альтернативними об'єктними сховищами, а також розглянута оптимізація Ceph.
Сховище Ceph - одне з найпопулярніших об'єктних сховищ. Це уніфіковане сховище з можливістю масштабування та відкритим вихідним кодом також володіє деякими перевагами.
Ceph пропонує функції, які, в принципі, є в інших сховищах для підприємств, але він, ймовірно, буде дешевше, ніж звичайний SAN. Для Ceph з відкритим вихідним кодом не потрібні ліцензійні відрахування, які є у пропрієтарних систем. Також у Ceph немає залежності від дорогого спеціалізованого обладнання, він може бути встановлений на звичайне апаратне забезпечення.
Серед інших переваг - масштабованість і гнучкість. Ceph пропонує кілька інтерфейсів доступу до сховища: об'єктний, блоковий і файловий. Для збільшення місткості системи досить додати більше серверів.
До деяких недоліків при використанні Ceph можна віднести потребу у швидкій, а значить дорожчій мережі. Для будь-якої компанії це також не безкоштовно. Якщо ви використовуєте його для зберігання важливих даних - швидше за все ви використовуєте один з двох комерційних варіантів з підтримкою від RedHat або SUSE. Попри це, Ceph - це дешевша і живучіша альтернатива пропрієтарним SAN.
Яке об'єктне сховище краще: Ceph або Swift?
Ceph і Swift - об'єктні сховища, розподіляють і реплікують дані по кластеру. Вони використовують файлову систему XFS або іншу файлову систему, доступну в Linux. Вони обидва розроблені для масштабування, так що користувачі можуть легко додати вузли сховища.
Але що стосується доступу до даних, то Swift розроблений з прицілом на хмари, використовує RESTful API. Застосунки можуть напряму отримати доступ до Swift, обходячи при цьому операційну систему. Це добре в хмарному оточенні, але ускладнює доступ до сховища Swift.
Ceph - гнучкіше об'єктне сховище з чотирма способами доступу: Amazon S3 RESTful API, CephFS, Rados Block Device і шлюзом iSCSI. Ceph і Swift також відрізняються способом доступу клієнтів. Так у Swift клієнти повинні йти через Swift Gateway, який сам по собі є єдиною точкою відмови. Ceph з іншого боку використовує пристрій об'єктного сховища, доступний на кожному вузлі. Інша частина, яка використовується для доступу до об'єктного сховища, запускається на клієнті. Так що тут Ceph гнучкіший.
Дані, що зберігаються в Ceph, зазвичай цілісні по всьому кластеру. В принципі це справедливо і для даних у Swift, але для синхронізації кластера може знадобитися час. З урахуванням цієї різниці Ceph непогано працює в межах одного дата-центру, працюючи з даними, яким треба високий рівень цілісності, наприклад віртуальні машини та бази даних. Swift краще підходить для великих оточень, які працюють з величезними обсягами даних.
Яка різниця між Ceph і GlusterFS?
GlusterFS і Ceph - системи зберігання даних з відкритим вихідним кодом, відмінно працюють в хмарних середовищах. Обидві можуть легко впроваджувати нові пристрої зберігання в інфраструктуру зберігання що вже існує, використовують реплікацію для відмовостійкості, а також працюють на звичайному обладнанні. В обох системах доступ до метаданих децентралізований, маючи на увазі відсутність єдиної точки відмови.
Попри наявність загальних речей, у них є також ключові відмінності. GlusterFS - файлова система Linux, яку легко впровадити в оточенні Linux, але не можна так само легко впровадити в оточенні Windows.
Ceph з іншого боку надає масштабоване об'єктне, файлове і блокове сховище в єдиній уніфікованій системі. Як і в будь-якому іншому об'єктному сховищі, застосунки пишуть в сховище за допомогою API, минаючи операційну систему. З огляду на це, сховища Ceph впроваджуються однаково легко як в Linux, так і в Windows. Через це, а також з інших причин, Ceph - кращий вибір для різнорідних оточень, де використовуються Linux та інші операційні системи.
Якщо порівнювати за швидкістю роботи, то і Ceph і GlusterFS працюють приблизно однаково. Також GlusterFS здебільшого асоціюється з RedHat, водночас Ceph ширше підтримується спільнотою.
Ceph з відкритим вихідним кодом або комерційна версія Ceph: як їх порівнювати?
Користувачі можуть без будь-яких виплат зробити будь-яку SDS на основі Ceph, поки його вихідний код залишається відкритим. Ceph пропонує керівництва по запуску, в якому описані всі етапи з його збірки в будь-якому дистрибутиві Linux, а також налаштування оточення Ceph.
Це досить складний процес, що вимагає певного досвіду. Тут і з'являються комерційні збірки Ceph, їх простіше зробити, крім збірок також надається і підтримка.
Є два комерційних продуктів: RedHat Ceph Storage і SUSE Enterprise Storage. Є деякі відмінності, так компанія SUSE розробила iSCSI Gateway, що дозволяє користувачам отримати доступ до сховища Ceph. RedHat впровадила Ceph-Ansible, інструмент управління налаштуваннями, з яким Ceph дещо легше встановлювати та налаштовувати.
Які способи поліпшення продуктивності Ceph кращі?
Для гарної продуктивності досить SATA дисків. Алгоритм CRUSH (Controlled Replication Under Scalable Hashing) в Ceph вирішує, де зберігати дані в сховище. Він розроблений для гарантії швидкого доступу до сховища. Однак для оптимальної швидкості Ceph треба 10G мережу, а краще - 40G.
Кілька потужних серверів, на яких встановлено багато дисків, забезпечать найкращу продуктивність, однак диск з журналом повинен бути на окремому пристрої. Використання журналу на SSD забезпечить максимальну швидкість, а файлова система Btrfs дасть оптимальну продуктивність Ceph.
Як ви впроваджуєте Ceph на Windows?
Є два способи впровадження: Ceph Gateway та iSCSI target в SUSE Enterprise Storage. Ceph Gateway забезпечує застосункам доступ за допомогою RESTful API, але це не найкращий спосіб надання доступу для операційної системи.
Ceph може бути налаштований як і будь-яка інша система зберігання даних на основі iSCSI за допомогою iSCSI target в SUSE Enterprise Storage. Це дає доступ до сховища для операційної системи з підтримкою iSCSI initiator, наприклад серверної Windows.
Джерело: searchstorage.techtarget.com
Ще немає коментарів