PostgreSQLをAIに活用
by Canonical on 23 April 2024
AIを扱うことはデータを扱うこと。数値データから動画や画像まで、業界や用途を問わず、AIプロジェクトは何らかの形でデータに依存します。問題は、そのデータをどうやって効率的に保管し、モデルを構築する際に使用するかです。解決策の1つは、実績があり、愛好者の多いデータベースであるPostgreSQLです。近年の開発により、AIをサポートする有力な選択肢になっています。
PostgreSQLを選ぶべき理由
PostgreSQLはオープンソースで高機能のデータベースシステムです。外部キー、サブクエリ、トリガーのほか、さまざまなユーザー定義型や関数をサポートしています。近年はデータベース分野で人気を高め、2023年には年間最優秀データベース管理システム(DBMS)に選出されました。
PostgreSQLは、FinOpsやeコマースなど、あらゆる業界に採用されています。オンライントランザクション処理、分析、地理空間データなど、さまざまなワークロードにも適合します。ソリューションの幅広い採用は、数多くの具体的なユースケースのための新しい拡張機能やライブラリの開発につながっています。機械学習もその1つです。
PostgreSQLをAIに活用
PostgreSQLには1,000種類を超える拡張機能があります。それらの拡張機能は、Postgresコアシステム内の機能上に追加機能を提供するアドオンモジュールです。地理空間データの処理から、ベクトルデータベースへのPostgreSQLの変換まで、さまざまな拡張機能を利用できます。拡張機能は分析や検索などの幅広い機能に対応します。
これらの拡張機能の柔軟性と幅広い機能は、AIプロジェクトの強化に大きな可能性をもたらします。
AIに関連性の高い拡張機能として、以下のようなものがあります。
- Pgvectorは、PostgreSQL用のオープンソースのベクトル類似検索機能です。埋め込みの保存にも使用できます。この機能によって、OpenSearchと同様にデータベースをベクトルデータベースとして使用できます。
- Hydraは、オープンソースのカラム型データベースです。Hydraではコードを修正しなくても数十億行単位で効率的なクエリを即座に実行できます。この機能は、MLプロジェクトで大量のデータ処理が必要な場合に役立ちます。
- PostgresMLは、PostgreSQLの拡張機能で動作する、あらゆる機能を備えたMLOpsプラットフォームです。この機能によって、組織はデータベース内にモデルを構築できます。
MLOpsにおけるPostgreSQLの役割
MLOpsは機械学習向けのDevOpsです。KubeflowなどのMLOpsプラットフォームは、PostgreSQLをはじめとするさまざまなタイプのデータベースからデータを取り込みます。さらに、データベースを使用して、実験、ジョブ、パイプライン実行、単一スカラーメトリックにわたるメタデータなど、アーティファクトの一部を保管します。Kubeflowとデータベースは、信頼性が高い、シームレスに統合されたものである必要があります。これは、Kubeflowとデータベースの可用性が実運用環境でMLプロジェクトを実行する能力に影響を及ぼすためです。
PostgreSQLはKubeflowとの併用に最適したデータベースですが、すべてのシナリオで最良の選択であるとは限りません。実際には、MySQLなどの選択肢も有力です。使用するデータベースを選択する際は、組織にとって最適なソリューションを優先してください。
- 既存のデータベース – MLOpsプラットフォームでMySQLなどの特定のデータベースをすでに使用している場合は、PostgreSQLに変更することによって不要なオーバーヘッドが発生する可能性があります。
- スキルセット – チームのスキルや経験に合わせてデータベースを選択します。PostgreSQLの使用経験がある場合、このユースケースにはPostgreSQLを選択することが理想的です。
MySQLとPostgreSQLに関するその他の考慮事項については、こちらのホワイトペーパーをご覧ください。
Charmed PostgreSQLをAIに活用
Charmed PostgreSQL Operatorは、PostgreSQLデータベース管理システムで設計から運用までの自動化された運用管理を提供します。Charmed PostgreSQL OperatorはJuju上で動作する、オープンソースのエンドツーエンドの実運用環境に対応したデータプラットフォームです。PostgreSQLを物理マシン/仮想マシンとKubernetes上にデプロイして運用するために2つのフレーバーがあります。どちらも、レプリケーション、TLS、パスワードのローテーション、アプリケーションとの使いやすい統合などの機能を提供します。
Charmed PostgreSQL Operatorは、体系化された一貫性のある方法でPostgreSQLをデプロイするニーズに応えます。また、構成の柔軟性をユーザーに提供します。その結果、実運用環境でのPostgreSQLのデプロイ、スケーリング、構成、管理を信頼性の高い方法で大規模に簡素化できます。PostgreSQLはそれ自体がAIプロジェクトに適しています。Charmed OperatorはAIプロジェクトのレベルを引き上げ、データの保管とMLモデルの構築をさらに容易にします。
参考資料
ニュースレターのサインアップ
関連記事
Canonicalとルネサスが提携し、企業向けAIのイノベーションを加速
Ubuntuの発行元であるCanonicalは、半導体ソリューションの世界的リーダーであるルネサス エレクトロニクス株式会社が、エッジコンピューティングとAIアプリケーションの需要増大に対応する最先端のソリューションを提供するため、Canonicalのシリコンパートナープログラムに参加したと発表しました。AIを利用したソリューションが業界に普及するにつれ、効率、拡張性、セキュリティに優れたエッジコンピューティングプラットフォームが強く求められています。このパートナーシップは、組み込み処理におけるルネサスの専門知識とCanonicalの包括的なIoT(モノのインターネット)ソフトウェアスタックを統合するものです。 拡張性の高い実運用グレードのソリューション Canonica […]
Canonical、Ubuntu 25.04 Plucky Puffin
Ubuntuの最新中間リリースでSpringなどの人気フレームワークに対応する「devpack」を導入。幅広いハードウェアでパフォーマンスを強化。 Canonicalは本日、Ubuntu 25.04(コードネーム「Plucky Puffin」)をリリースしました。ubuntu.com/downloadからダウンロードとインストールが可能です。 Ubuntu 25.04は最新のGNOME 48を採用し、トリプルバッファリングに対応するほか、インストールと起動を改善しました。Springに対応した「devpack」により、Ubuntuで利用可能なツールチェーンが充実。Canonicalのパートナー各社によるシリコン対応により、Intel GPUでのAI処理速度が向上し、AMD […]
UbuntuがNVIDIA Jetsonを正式にサポート:AIの未来はエッジにあり
Canonicalは、エッジAIやロボティクスを想定し、NVIDIA® Jetson Orin™対応のUbuntuの一般提供を発表しました。最適化されたパフォーマンス、すぐに使用できる互換性、高性能のAIソリューションへの近道をすべてのAI開発者に提供します。 Ubuntuの発行元であるCanonicalはNVIDIA Jetsonプラットフォームの公式サポートを発表しました。これにより、エッジでのAIイノベーションを加速するNVIDIAとのコラボレーションが大きく前進しました。この一般提供(GA)リリースにより、UbuntuとNVIDIA Jetsonシステムオンモジュールの強力な組み合わせに、エンタープライズグレードの安定性とサポートが加わります。 業界全体でAIイノ […]