金融サービス分野のAI/MLアプリケーションに対応する安全なオープンソースMLOps
by Canonical on 4 April 2023
金融サービスにおけるAI/MLの採用が増加しています。デジタルトランスフォーメーションの一環として堅牢でデータ主導型の意思決定プロセスを推進する企業が増えているためです。McKinseyでは、グローバルバンキングのAIテクノロジーが最大で毎年1兆ドルの付加価値をもたらすと推計しています。しかし、機械学習を大規模に製品化することは困難です。機械学習のライフサイクルは、データの取り込みと準備、モデルトレーニング、チューニング、デプロイ、モニタリングなど、数多くの複雑な要素で構成されています。また、データエンジニアリングからデータサイエンスやMLエンジニアリングまで、チーム間の協力と引継ぎも必要です。当然ながら、これらのすべてのプロセスを同時に進めてシームレスに機能させるためには、綿密な管理が必要です。明確な枠組みなしには達成できません。
機械学習オペレーション(MLOps)は、AI/MLの機能をあらゆる規模の運用環境にデプロイするためのフレームワークです。オープンソースサプライチェーンのセキュリティに対する意識的な取り組みと併用することで、AI/MLを活用したアプリケーションの長期的な安定性に貢献し、AI/ML投資から具体的なビジネス上の利益を引き出します。
金融機関におけるMLOps
MLOpsはデータサイエンティストとIT運用部門との間の協力やコミュニケーションを助ける一連の手順です。これらの手順では品質の向上や管理プロセスの簡素化とともに、大規模な運用環境に機械学習やディープラーニングのモデルを自動的にデプロイできます。
MLOpsには、AI/MLアプリケーションのデプロイとメンテナンスを改善する自動化機能があります。DevOpsと同様、MLOpsも機械学習開発ライフサイクルに対する協力的で合理的なアプローチを採用しています。つまり、人、プロセス、テクノロジーの交わりが、機械学習ワークロードの開発、構築、運用に必要なエンドツーエンドの活動を最適化するのです。MLOpsは、ビジネスニーズや金融サービス部門の規制要件に合わせてモデルを調整するにも役立ちます。
MLOpsを採用すれば、金融機関は、キュレートされたデータセットへのアクセス、優れた信頼性、データとモデルの品質、監査可能性、再現性を持つセルフサービス環境を提供し、生産性を高めることができます。
オープンソースのMLOpsプラットフォーム
金融機関が機械学習に注いだ労力から利益を得るには、MLOpsプラットフォームを使用した繰り返し可能なプロセスでモデルを開発する必要があります。これならデータサイエンティストがエンドツーエンドのMLプロセスを効率的に管理できるためです。
MLOpsプラットフォームのコラボレーション環境では、データサイエンティストとソフトウェアエンジニアが以下を容易に行うことができます。
- 反復的なデータ探索
- 実験追跡のためのリアルタイムのコワーキング機能
- フィーチャーエンジニアリング
- モデルの管理
- 制御モデルの移行、展開、モニタリング
MLOpsプラットフォームは、機械学習ライフサイクルの運用と同期化を自動化します。
Kubeflowは、機械学習(ML)システムの開発とデプロイを目的とした無料のオープンソースMLOpsプラットフォームであり、非常に人気の高いオープンソースMLOpsツールキットです。金融機関のデータサイエンティストはKubeflowを使用してMLパイプラインの構築と実験を行います。一方、MLエンジニアと運用チームはKubeflowを使用してMLシステムをさまざまな環境にデプロイし、開発、テスト、本番運用に活用します。Kubeflowは、探索からトレーニングや展開まで、MLライフサイクルの各段階にコンポーネントを提供します。
オープンソースのMLOpsプラットフォームのセキュリティ
Kubeflowプラットフォームは、Jupyter Notebook、Pipelines、KFServing、Katib、PyTorch Serving、TensorFlow Serving、各種オペレーター、Seldon Core、Istio、Argo、Prometheusなどのさまざまなアプリケーションとスキャフォールディングで構成されています。
金融機関では、オープンソースソフトウェアとそのすべての依存関係を安全に管理することが必須です。このことは、オープンソースのMLOpsプラットフォームにも当てはまります。金融機関は、コンプライアンス、セキュリティ、またはサポートの要件満たしながら、AI/MLを活用したインテリジェントアプリケーションを構築および保守できる、セキュリティの高いオープンソースソフトウェアを必要としています。
オープンソーステクノロジーを活用する金融機関が増加する現在、オープンソースライブラリやAI/MLツールチェーンも長期的なセキュリティメンテナンスとプラットフォームの安定性が保証された信頼できるソースを持つことが重要です。
セキュリティの高いオープンソースMLOpsプラットフォームでAI/MLを大規模に採用しようとしている金融サービス企業向けに、CanonicalはCharmed KubeflowとUbuntu Proを一般提供しています。
オープンソースのMLOpsとCharmed Kubeflow
KubeflowはMLの運用に明らかに有利であるにもかかわらず、Kubeflowの導入、構成、メンテナンスは依然として簡単ではありません。膨大なアプリケーションや状況を考慮すれば、金融機関のすべてのデータサイエンティストに対応するソリューションをKubeflowコミュニティが提供することは困難です。
Canonicalはこの問題に対処するため、各アプリケーションをKubeflow内にパッケージ化し、あらゆるクラウド向けに完全にサポートされたMLOpsプラットフォームであるCharmed Kubeflowを提供しています。
Charmed Kubeflowは、最新バージョンのKubeflowを構成する20種類以上のアプリケーションとサービスをパッケージ化して、ワークステーション、オンプレミス、パブリッククラウド、プライベートクラウド、エッジクラウドなど、あらゆる場所でのデプロイと運用を高速化します。
Charmed Kubeflowは、モデル主導型のアプリケーション管理と次世代のIaC(コードとしてのインフラストラクチャ)を提供する企業向けのオペレーターライフサイクルマネージャー(OLM)であるJujuによって動作しています。Jujuでは、オペレーターとアプリケーションはcharmとしてバンドルされています。charmとは、オペレーターとメタデータを含み、一貫した集約システムへの多くのオペレーターの統合をサポートするパッケージです。
Charmed Kubeflowとは、あらゆるクラウドに対応し、完全にサポートされたエンドツーエンドの企業向けMLOpsプラットフォームです。Charmed Kubeflowは、Kubeflowのアップストリームプロジェクトの公式ディストリビューションの1つです。金融機関のデータサイエンティストや機械学習エンジニアは、Charmed Kubeflowを使用し、シンプルで移植性が高く、セキュリティと拡張可能性を備えたMLをデプロイすることができます。Charmed Kubeflowは、Ubuntu UniverseリポジトリやUbuntu Mainリポジトリに含まれるソフトウェアパッケージに対してCanonicalのUbuntu Proセキュリティメンテナンスも受けることができます。Canonicalは、すべてのクラウド、データセンター、デスクトップで提供されるオープンソースソフトウェアセキュリティの総合的なサブスクリプションを提供しています。
オープンソースのAI/MLツールチェーンの保護
Ubuntu Proのサブスクリプションには、ワークフロー全体が安全になるように、アップストリームコミュニティと協力してKubeflowアプリケーション専用のイメージのCVEパッチが含まれています。
Ubuntu Proは、「critical(危険)」、「high(高い)」、「medium(中間)」のCVE(Common Vulnerabilities and Exposures:一般的な脆弱性と露出)に加え、数多くのアプリケーションやツールチェーンにセキュリティの対象範囲を広げます(Ansible、Apache Tomcat、Apache Zookeeper、Docker、Drupal、Nagios、Node.js、phpMyAdmin、Puppet、PowerDNS、Python 2、Redis、Rust、WordPressなどのオープンソースのMLOpsアプリケーションを含む)。16.04 LTS以降のすべてのUbuntu LTSに対応します。
「AIやディープラーニングなどのイノベーションにより、企業が異常や脅威から保護しなければならないデータが大幅に増大しています。NVIDIAとCanonicalのコラボレーションは、社会に有益なブレークスルーの達成に必要な信頼性と長期的なセキュリティ保証を企業に提供します。」
Justin Boitano氏
NVIDIAのエンタープライズコンピューティング担当バイスプレジデント
MLOpsエコシステムの成長を目指し、Charmed Kubeflowは、Kafka、Spark、MLFlowなど、他のさまざまなAI固有またはデータ固有のプラットフォームを統合しています。Ubuntu Proは、インフラストラクチャからオペレーティングシステム、アプリケーションレイヤーまですべてをカバーしています。
Ubuntu Proは、イノベーションを重視し、継続的なセキュリティメンテナンスや依存性の追跡に自信がある金融機関に最適です。Canonicalはセキュリティ修正を新しいバージョンのアプリケーションからバックポートし、金融機関のデータサイエンティスト、MLエンジニア、運用チームが、強制的なアップグレードなしで長期的にセキュリティを確保する方法を提供します。その結果が10年にわたるオープンソースプラットフォームの安定性です。
Canonicalは、メインのUbuntu OSに対し、約20年にわたって速やかにセキュリティ更新を提供してきた実績を誇ります。重要なCVEには平均24時間以内にパッチが提供されます。パッチは、「critical(危険)」、「high(高い)」、選択した「medium(中間)」のCVEに対して適用され、多くのゼロデイ脆弱性もCVEが公開されればリリース前に修正されます。
「TenableとCanonicalは共同で、高精度で有用な脆弱性アラートをスピーディーに提供しています。Ubuntu Proは、幅広いオープンソースソフトウェアに対してセキュリティパッチを保証します。両社は共通のお客様に対し、信頼性を備えたオープンソースの基盤を提供します。」
Robert Huber氏
Tenableの最高セキュリティ責任者(CSO)
金融サービス向けの安全なオープンソースについては、ホワイトペーパーをご覧ください!
金融機関がオープンソースを活用して低コストでイノベーションを推進するのを助けるCanonicalの取り組みについては、Canonicalの金融サービスのウェブページをご覧ください。
ニュースレターのサインアップ
関連記事
機械学習のセキュリティリスクの概要
データはあらゆる機械学習(ML)プロジェクトの要であり、悪人もそれを知っています。技術者の間でAIが常に話題になるとともに、MLシステムは攻撃の標的としても注目を集めています。Identity Theft Resource Center(ID窃盗リソースセンター)の報告によれば、2023年にはデータ漏えいが72%も増加しており、MLプロジェクトが恰好の攻撃経路とならないよう適切な対策を施すことは極めて重要です。このブログ記事では、機械学習のセキュリティリスクについて説明し、主要な脅威と課題に言及します。しかし、悲観的な話だけでなくベストプラクティスにも目を向け、オープンソースの役割も含め、可能なソリューションを探求します。 機械学習の攻撃対象領域 あらゆるテクノロジーには […]
Linuxにセキュリティパッチを適用する頻度は?
セキュアな環境を維持するには定期的なパッチの適用が不可欠ですが、Linux環境を安全に保つための方法は環境によって異なります。運用の安定性を考えて、どのぐらいの更新頻度が妥当でしょうか? 最も制限が多く、規制が厳しい環境でも、準拠が保証され安全な方法で、セキュリティパッチの適用を自動化できる方針が存在します。セキュリティパッチの適用方針を定義するときは、Canonicalでのソフトウェア更新のリリーススケジュールを理解し、セキュリティパッチの適用の時間枠を知っておくことが不可欠です。私は最近、ライブのウェビナーとセキュリティの質疑応答を主催し、パッチ適用の回数を最小化するとともに、パッチが適用されていない脆弱性が悪用される回数も最小化する方法について解説しました。この記事 […]
データを中心としたAIの進化:MAASとNVIDIAスマートNICの組み合わせ
Canonicalは数年前から、製品へのNVIDIAスマートNICのサポートの実装に取り組んでいます。その一環であるCanonicalのMetal-as-a-Service(MAAS)は、ベアメタルサーバー上でスマートNICの管理と制御を可能にするものです。NVIDIAのBlueFieldスマートNICは、データ速度が非常に高く、高度なソフトウェア定義のデータ中心型インフラストラクチャサービスを提供するネットワークインターフェイスカードです。BlueFieldスマートNICは、専用の高性能ネットワークASIC(特定アプリケーション向け集積回路)と強力な汎用CPU、RAMを搭載しています。そしてネットワーク機能の高速化、ハードウェアの負荷軽減、隔離により、革新的なネットワー […]