Cephを利用した初心者向けオープンソースストレージ
by Canonical on 16 September 2022
現代の組織はIT技術に依存しています。そしてインフラにおいて何より重要なのがデータの保存です。トランザクションデータベース、ファイル共有、ビジネス分析用の膨大なデータレイクなど、すべてのデータを保存する必要があります。
従来、ストレージのニーズを満たすのは大手ハードウェアベンダーでしたが、この10年で多くの組織がコモディティハードウェア上で動作するCephのようなオープンソースソリューションに移行しています。この記事ではCephを紹介し、組織がCephを選ぶ理由も解説します。
ストレージソリューションの選択
Canonicalでは、データをどこに保存すべきかとよく尋ねられます。概してその答えを決めるのは、以下のいくつかの要因です。
- パフォーマンスとレイテンシの要件 – 汎用VMブートイメージ、サイズの大きなファイル共有用ストレージ、巨大なデータレイクには、いずれ性能や容量を拡大できるスケールアウト型のシステムが適しています。ただし、特にミリ秒未満のレイテンシ(ビジネスサービスレベル目標 [SLO] による)が求められる、あるいはIO密度(IO/GB)が非常に高いワークロードがある場合は、独自システムのほうが良いかもしれません。
- 予算 – 予算が無制限ならあらゆるニーズを満たすストレージシステムを設計できますが、現実的にそのようなことはありません。パフォーマンスと予算のバランスに応じて、スケールアウト型システムと独自のスケールアップ型システムを比較してどちらかを選択するほうが適切でしょう。
- スケーリング – ストレージシステムを設計する場合、現時点で必要な容量だけでなく、今後6カ月から36カ月の必要量についても考慮すべきです。成長の程度が予想できるデータセットなら比較的簡単であり、スケールアップ型システムが最適です。その他のデータセットの場合は推測に頼るしかありません。拡張の容易なスケールアウト型システムのほうが安全です。
- 設置場所 – プライベートクラウドを構築するならハイパーコンバージドシステムを検討しましょう。ここではストレージとコンピューターが同じノードを共有し、一緒に拡張します。あるいは、コンピューターリソースとは別にストレージを拡張できる専用ストレージノードでも対応できます。1つまたは複数のパブリッククラウドからコンピューティングを使用しているが、クラウド隣接ストレージシステムをコロケーション施設内に構築することによってデータストレージのコストを制御したい場合も当てはまります。
最後に現実的に考えて、運用寿命が(技術的にも経済的にも)十分に残っている既存システムがあればプライベートクラウドに統合します。
最新のソリューションとは?
今日の企業のダイナミックなニーズを考慮し、Canonicalは多くの場合、オープンソースのスケールアウト型ストレージソリューションであるCephをお勧めします。Cephは、単一の統合クラスターからのブロック、ファイル、オブジェクトのストレージニーズに対処できるように設計されています。Cephは、プライベートクラウドインフラストラクチャ(ハイパーコンバージドでもディスアグリゲーテッドでも)、ビッグデータ分析、リッチメディア、あるいはパブリッククラウドストレージの代替としても広く使用されています。
Cephの拡張性の高いアーキテクチャは、高成長のブロックストレージ、オブジェクトストア、データレイクに広く採用されています。物理ハードウェアはコモディティのように扱われ、データを拡張および保護するすべてのインテリジェンスは完全にソフトウェア次第です。このためCephは大容量のデータ保存に効果的に対応でき、クラウド、Openstack、Kubernetes、その他のマイクロサービスやコンテナベースのワークロードに最適です。
Cephの仕組み
Cephの主な利点は、単一クラスター内に複数のストレージタイプ用のインターフェイスを提供し、複数のストレージソリューションや特殊なハードウェアの必要性を除去して管理コストを削減できることです。一般的なクラスターは、標準サーバーと2つのイーサネットネットワーク(1つはクライアントアクセス用で、もう1つはクラスターへの内部用)で構築されています。
Cephストレージクラスターを構成するコンポーネント
- クラスターモニター(ceph-mon)は、クラスターのマップとその状態の管理、アクティブなノードとエラー状態のノード、構成、データ配置に関する情報の追跡、認証の管理を行います。
- マネージャー(ceph-mgr)は、クラスターランタイムメトリクスの収集、ダッシュボード機能の有効化、外部監視システムへのインターフェイスの提供を行います。
- オブジェクトストレージデーモン(ceph-osd)は、Cephクラスターにデータを格納し、複製、イレージャーコーディング、リカバリ、およびリバランスを処理します。概念としては、オブジェクトストレージデーモンは、CPU/RAMとベースであるSSDまたはHDDのスライスと考えることができます。
- Radosゲートウェイ(ceph-rgw)は、http/httpsを介してオブジェクトストレージAPI(S3およびswift)を提供します。
- メタデータサーバー(ceph-mds)は、Cephファイルシステムのメタデータを格納し、ファイルシステムのファイル名とディレクトリをRADOSオブジェクトにマッピングし、POSIXセマンティクスを使用してファイルにアクセスできるようにします。
- iSCSIゲートウェイ(ceph-iscsi)は、VMwareやWindows Serverなどの従来型のブロックストレージワークロードにiSCSIターゲットを提供します。
Cephでは、データを論理ストレージプール内にオブジェクトとして格納します。Cephクラスターには複数のプールを保有でき、それぞれのプールは異なるパフォーマンスや容量の用途に合わせて調整されています。リバランスやリカバリを効率的にスケーリングして処理するために、Cephではプールをプレイスメントグループ(PG)にシャーディングします。CRUSHアルゴリズムは、オブジェクトを格納するためのプレイスメントグループを定義し、その後に、どのCephオブジェクトストレージデーモンがプレイスメントグループを格納するかを計算します。
初めて使用する方へ
Cephは簡単に使用できます。少数のノード(またはテスト専用のVM)を持つ小さなクラスターを作り、試してみましょう。詳細はインストールガイドをご覧ください。
結論
Cephはスケールアウト型オープンソースストレージを実現するソフトウェアであり、プライベートクラウドやパブリッククラウド、メディアコンテンツ保存、データレイクなどの変化するビジネスニーズに対応します。マルチプロトコルのため、複数のストレージシステムを別々に設置しなくても、すべてのブロック、ファイル、オブジェクトのストレージ要件に対応します。Cephクラスターは、あらゆるワークロードや予算に合わせて設計でき、何よりもダウンタイムなしで簡単にアップグレードや拡張が可能です。
このブログシリーズでは、今後もMAAS、Juju、Charmed Cephを使ってCephを簡単に運用する方法を解説します。
参考情報
ニュースレターのサインアップ
関連記事
SBI BITSとCanonical:OpenStack 導入と6年間の進化の物語
SBI BITSとCanonicalのパートナーシップは、SBIグループのITインフラを進化させ、事業継続性を確保しながら顧客満足度を向上させる成功事例として注目されています。本記事では、2018年のOpenStack/Ceph導入から6年にわたる協力の軌跡をたどります。 第1フェーズ:OpenStackの採用と初期導入 (2018年) 2018年、SBI BITSは従来の仮想化技術からOpenStack/Cephへの移行を決定しました。SBIグループ全体にITインフラを提供するSBI BITSは、リソースを迅速かつ効率的に配分する能力が求められていました。その解決策として選ばれたのが、CanonicalのOpenStack/Cephです。 この選択の理由は、以下の点にあ […]
HPE Discover More AI 東京 2025に出展します
Canonicalは、1月28日にザ・プリンスパークタワー東京で開催される日本最大級のITイベント「HPE Discover More AI 東京 2025」に参加します。今回のテーマは「Ubuntu Pro & MicroCloud LTSで安心の長期運用」です。現地にて、展示テーマやソリューションについて専門家にご相談いただけます。 イベント情報 出展テーマ・ソリューション Ubuntu Pro Ubuntu Proは、ビジネスにおけるセキュリティー支援とコンプライアンスのニーズを満たすエンタープライズサービスです。Python、OpenJDK、MySQL、PostgreSQL、OpenSSLを含む25,000以上のパッケージに、最長で10年間の脆弱性対応を提供し、開 […]
Canonical、Azure IoT運用を革新
Canonical、Microsoft Azure IoT Operationsに最適なプラットフォームを提供 CanonicalはMicrosoftの早期導入パートナーとして、Ubuntu CoreとKubernetes上でMicrosoft Azure IoT Operationsのテストを行ってきました。この協力が実を結び、本日Microsoftは、ノードデータのキャプチャ、エッジベースのテレメトリ処理、クラウドイングレスを大幅に改良した統合データプレーン、Azure IoT Operationsをリリースしました。Azure IoT OperationsはAzureのアダプティブクラウドに必須の要素であり、ハイブリッド、マルチクラウド、エッジ、IoTの環境を統合し […]