Cephを利用した初心者向けオープンソースストレージ
by Canonical on 16 September 2022
現代の組織はIT技術に依存しています。そしてインフラにおいて何より重要なのがデータの保存です。トランザクションデータベース、ファイル共有、ビジネス分析用の膨大なデータレイクなど、すべてのデータを保存する必要があります。
従来、ストレージのニーズを満たすのは大手ハードウェアベンダーでしたが、この10年で多くの組織がコモディティハードウェア上で動作するCephのようなオープンソースソリューションに移行しています。この記事ではCephを紹介し、組織がCephを選ぶ理由も解説します。
ストレージソリューションの選択
Canonicalでは、データをどこに保存すべきかとよく尋ねられます。概してその答えを決めるのは、以下のいくつかの要因です。
- パフォーマンスとレイテンシの要件 – 汎用VMブートイメージ、サイズの大きなファイル共有用ストレージ、巨大なデータレイクには、いずれ性能や容量を拡大できるスケールアウト型のシステムが適しています。ただし、特にミリ秒未満のレイテンシ(ビジネスサービスレベル目標 [SLO] による)が求められる、あるいはIO密度(IO/GB)が非常に高いワークロードがある場合は、独自システムのほうが良いかもしれません。
- 予算 – 予算が無制限ならあらゆるニーズを満たすストレージシステムを設計できますが、現実的にそのようなことはありません。パフォーマンスと予算のバランスに応じて、スケールアウト型システムと独自のスケールアップ型システムを比較してどちらかを選択するほうが適切でしょう。
- スケーリング – ストレージシステムを設計する場合、現時点で必要な容量だけでなく、今後6カ月から36カ月の必要量についても考慮すべきです。成長の程度が予想できるデータセットなら比較的簡単であり、スケールアップ型システムが最適です。その他のデータセットの場合は推測に頼るしかありません。拡張の容易なスケールアウト型システムのほうが安全です。
- 設置場所 – プライベートクラウドを構築するならハイパーコンバージドシステムを検討しましょう。ここではストレージとコンピューターが同じノードを共有し、一緒に拡張します。あるいは、コンピューターリソースとは別にストレージを拡張できる専用ストレージノードでも対応できます。1つまたは複数のパブリッククラウドからコンピューティングを使用しているが、クラウド隣接ストレージシステムをコロケーション施設内に構築することによってデータストレージのコストを制御したい場合も当てはまります。
最後に現実的に考えて、運用寿命が(技術的にも経済的にも)十分に残っている既存システムがあればプライベートクラウドに統合します。
最新のソリューションとは?
今日の企業のダイナミックなニーズを考慮し、Canonicalは多くの場合、オープンソースのスケールアウト型ストレージソリューションであるCephをお勧めします。Cephは、単一の統合クラスターからのブロック、ファイル、オブジェクトのストレージニーズに対処できるように設計されています。Cephは、プライベートクラウドインフラストラクチャ(ハイパーコンバージドでもディスアグリゲーテッドでも)、ビッグデータ分析、リッチメディア、あるいはパブリッククラウドストレージの代替としても広く使用されています。
Cephの拡張性の高いアーキテクチャは、高成長のブロックストレージ、オブジェクトストア、データレイクに広く採用されています。物理ハードウェアはコモディティのように扱われ、データを拡張および保護するすべてのインテリジェンスは完全にソフトウェア次第です。このためCephは大容量のデータ保存に効果的に対応でき、クラウド、Openstack、Kubernetes、その他のマイクロサービスやコンテナベースのワークロードに最適です。
Cephの仕組み
Cephの主な利点は、単一クラスター内に複数のストレージタイプ用のインターフェイスを提供し、複数のストレージソリューションや特殊なハードウェアの必要性を除去して管理コストを削減できることです。一般的なクラスターは、標準サーバーと2つのイーサネットネットワーク(1つはクライアントアクセス用で、もう1つはクラスターへの内部用)で構築されています。
Cephストレージクラスターを構成するコンポーネント
- クラスターモニター(ceph-mon)は、クラスターのマップとその状態の管理、アクティブなノードとエラー状態のノード、構成、データ配置に関する情報の追跡、認証の管理を行います。
- マネージャー(ceph-mgr)は、クラスターランタイムメトリクスの収集、ダッシュボード機能の有効化、外部監視システムへのインターフェイスの提供を行います。
- オブジェクトストレージデーモン(ceph-osd)は、Cephクラスターにデータを格納し、複製、イレージャーコーディング、リカバリ、およびリバランスを処理します。概念としては、オブジェクトストレージデーモンは、CPU/RAMとベースであるSSDまたはHDDのスライスと考えることができます。
- Radosゲートウェイ(ceph-rgw)は、http/httpsを介してオブジェクトストレージAPI(S3およびswift)を提供します。
- メタデータサーバー(ceph-mds)は、Cephファイルシステムのメタデータを格納し、ファイルシステムのファイル名とディレクトリをRADOSオブジェクトにマッピングし、POSIXセマンティクスを使用してファイルにアクセスできるようにします。
- iSCSIゲートウェイ(ceph-iscsi)は、VMwareやWindows Serverなどの従来型のブロックストレージワークロードにiSCSIターゲットを提供します。
Cephでは、データを論理ストレージプール内にオブジェクトとして格納します。Cephクラスターには複数のプールを保有でき、それぞれのプールは異なるパフォーマンスや容量の用途に合わせて調整されています。リバランスやリカバリを効率的にスケーリングして処理するために、Cephではプールをプレイスメントグループ(PG)にシャーディングします。CRUSHアルゴリズムは、オブジェクトを格納するためのプレイスメントグループを定義し、その後に、どのCephオブジェクトストレージデーモンがプレイスメントグループを格納するかを計算します。
初めて使用する方へ
Cephは簡単に使用できます。少数のノード(またはテスト専用のVM)を持つ小さなクラスターを作り、試してみましょう。詳細はインストールガイドをご覧ください。
結論
Cephはスケールアウト型オープンソースストレージを実現するソフトウェアであり、プライベートクラウドやパブリッククラウド、メディアコンテンツ保存、データレイクなどの変化するビジネスニーズに対応します。マルチプロトコルのため、複数のストレージシステムを別々に設置しなくても、すべてのブロック、ファイル、オブジェクトのストレージ要件に対応します。Cephクラスターは、あらゆるワークロードや予算に合わせて設計でき、何よりもダウンタイムなしで簡単にアップグレードや拡張が可能です。
このブログシリーズでは、今後もMAAS、Juju、Charmed Cephを使ってCephを簡単に運用する方法を解説します。
参考情報
ニュースレターのサインアップ
関連記事
公共セクターにおけるクラウドストレージのコスト
他の多くの業界と同様、公共セクターでもクラウドコンピューティングの柔軟性が注目されています。最近の問題は予測不能なコストの上昇ですが、この大部分は慎重な計画とオンプレミスのインフラストラクチャによって軽減できます。 政府の指針では、全アプリケーションをクラウドに移行するという一律的な方法ではなく、それぞれの問題に最も適切な解決策を選ぶという戦略への切り替えが推奨されています。 このブログ記事では、公共セクターの組織が直面するいくつかの課題、そしてコスト効果、拡張性、コンプライアンスを確保する方法を検討します。 クラウドストレージ クラウドコンピューティングは、ここ20年間で世界を席巻しました。拡張性、柔軟性、オンデマンドというパブリッククラウドの特性は無敵です。しかしその […]
Firefighting Supportを発表
新しいサービスでCanonicalの専門家が高度なクラウドサポートを提供 Canonicalのマネージドソリューションチームは、自社でインフラストラクチャの管理を行い、トラブルシューティングの必要があるときのみ専門家の対応を求める組織のために、新しいサービス「Firefighting Support」を発表しました。 Firefighting Supportでは、フルマネージドサービスを止めた、または厳しいセキュリティ規制によってサードパーティーに環境へのアクセスを許可できないお客様に対して、マネージドサービスレベルのサポートを提供します。このサービスはノードごとの年間料金で提供され、次のような内容です。 自己管理インフラストラクチャへの移行に理想的 現在の市場では、マネ […]
データを中心としたAIの進化:MAASとNVIDIAスマートNICの組み合わせ
Canonicalは数年前から、製品へのNVIDIAスマートNICのサポートの実装に取り組んでいます。その一環であるCanonicalのMetal-as-a-Service(MAAS)は、ベアメタルサーバー上でスマートNICの管理と制御を可能にするものです。NVIDIAのBlueFieldスマートNICは、データ速度が非常に高く、高度なソフトウェア定義のデータ中心型インフラストラクチャサービスを提供するネットワークインターフェイスカードです。BlueFieldスマートNICは、専用の高性能ネットワークASIC(特定アプリケーション向け集積回路)と強力な汎用CPU、RAMを搭載しています。そしてネットワーク機能の高速化、ハードウェアの負荷軽減、隔離により、革新的なネットワー […]