Return to page

H2O AI Cloud の主な機能

H2O AI Cloud は複雑なビジネスの問題を解決し、納得し信頼できる結果をもたらす新しいアイデアの発見を促進します。H2O.ai の包括的な自動機械学習 (AutoML) 機能は、AI の開発と利用の方法を変革します。H2O.ai が構築した AI を実行する AI は、より簡単に素早く利用できるだけでなく、専門家レベルの精度と速度、透明性を実現します。

H2O.ai は AI を民主化するというミッションを果たすために、人々が自信を持ってアイデアを影響力に変え、H2O AI Cloud 上で AI による開発、運用、革新を行うことができるようにします。

 

Marketecture Marketecture

AI ソリューションの開発と利用に関する機敏性と透明性は、継続的な学習と革新のサイクルを保証します。チーム間の強化された共同作業によって結果の全般的な質が改善されるだけでなく、進化する状況と新しいインサイトに対応する効率が向上します。

Data Scientists Data Scientists

データサイエンティスト:

データサイエンスのライフサイクル全体をカバーする最新の AutoML 機能は、ワークフローを最適化して、ビジネスの利害関係者に提供されるデータサイエンスプロジェクトの量と質を共に向上させます。機械学習の解釈可能性と運用に対応する堅牢な機能は、説明可能性のパイプライン全体へのシームレスな制御をユーザーに提供するため、より高い精度、透明性の向上、変化する状況へのより速い適応につながります。

Developers Developers

開発者:

Python や R、Java や C++ からデプロイした成果物の自動変換によって、データサイエンスチームと開発者の間でプロジェクトの引継ぎが簡素化され、AI 機能が既存のソリューションにシームレスに統合されます。オープンソースのローコード開発フレームワークは、あらゆる主要なライブラリとフレームワークを使って仕事をする柔軟性を提供し、新しい AI アプリケーションの作成を加速化します。

Machine Learning Engineers Machine Learning Engineers

機械学習エンジニア:

H2O.ai とサードパーティ両方のモデルをサポートするために設計された包括的なモデル監視機能で、デプロイしたモデルが意図した通りに稼働していることを保証します。H2O AI Hybrid Cloud の包括的なモデル管理機能は、ビジュアルインターフェイスまたは API を使用してアクセス可能です。

DevOps and IT Professionals DevOps and IT Professionals

DevOps と IT の専門家:

H2O AI Hybrid Cloud は、 NVIDIA RAPIDS の完全な統合により高性能のコンピューティングを提供します。Ampere ベースの NVIDIA GPU と最新の CUDA ランタイムのコンピューティングとネットワークをかつてないほど加速化する支援によって、簡単にワークロードを調整することができます。また、システム使用状況を監視し、プラットフォームパフォーマンス API を通じてリソース監視のメトリックスとマルチノードクラスターの自動スケールを提供します。

Business Users Business Users

ビジネスユーザー:

AI AppStore を使用すると、ビジネスユーザーは独自の業務ニーズに適合するようカスタム作成された AI アプリケーションを簡単かつ直感的に検索して利用できるようになります。このようなソリューションは信頼性の高い機械学習モデルを使用して、データ主導の意思決定に対応するリアルタイムのインサイトを提供します。

Make.

H2O.ai は AI を実行する AI を構築しました。H2O AI Hybrid Cloud は業界をリードする自動機械学習 (AutoML) を搭載し、AI アプリケーションの開発とデプロイを含む機械学習のライフサイクル全体を通して、より高い精度とスピード、透明性をユーザーに提供します。

特徴量変換:

データを最適なモデル作成データセットに変換する高度な特徴量エンジニアリングで、自動的に可視化を行いデータ品質問題に対応します。

データインテリジェンス:

  • データの可視化:
    データセットの関連する統計的プロパティを視覚的に表示して、異常値、相関、欠落値などの予想外のデータ品質問題を明らかにします。

  • 自動化されたデータインサイト:
    テキストのトピック、相関、異常値など自動的に検出される傾向やインサイトをビジュアル表示やテキスト表示で説明します。

  • 前処理トランスフォーマー:
    カスタムのデータ準備を最終版のデプロイ済み機械学習パイプラインの一環として、自動的に追加します。

  • データセットの分割:
    ランダム分割、時間別、層別、ライブコーディングでの完全カスタマイズなど、さまざまな組み込みの分割手法で時間を削減し検証を向上させます。

  • 欠損値処理:
    機械学習パイプラインのあらゆる部分の欠損値に対応するエンドツーエンドの支援によって、精度の向上と汎化の改善をもたらします。

  • 異常値検出:
    多様な専用アルゴリズムで実現する精度の向上により、データの問題または不規則性を明らかにします。

特徴量エンジニアリング:

  • 自動特徴量エンジニアリング:
    データから重要な統計情報を自動抽出する専用の特徴量エンジニアリングで、精度と ROI を向上させます。

  • 特徴量のエンコーディング:
    機械学習アルゴリズムで使用するために、単一のデータセット内のさまざまなデータ型(数値、カテゴリー、テキスト、画像、日付/時刻など)を変換します。

  • 特徴量変換レシピ:
    ドメイン知識を適用して、完全カスタマイズ可能な Python レシピで自動特徴量エンジニアリングのアウトプットを絞り込みます。

  • 特徴量別の制御:
    データセット内の一定の列について特徴量エンジニアリングと特徴量選択を無効にして、コンプライアンス要件を満たすモデルにそのまま渡すことができます。

  • 自動検証と交差検証:
    数多くの専用検証技術、統計手法、移動ウィンドウによって、精度と堅牢性、汎化を向上させます。

特徴量ストア:

  • データのパイプラインと統合:
    特徴量と特徴量メタデータ用の整合性があり一元化されたストレージによって、データサイエンティストは最新かつ最良の特徴量にアクセスすることができます。

  • 分類と検索:
    利用できる特徴量セットのメタデータによって、ユーザーは各データセットに必要な特徴量を検索することが可能になります。また、プロジェクトとタグの機能で、通常一緒に使用される特徴量を特定してモデルを改善することもできます。

  • ガバナンスとアクセス管理:
    バージョン付きの特徴量は、特徴量の特定の組み合わせでトレーニングしたモデルから常に同じ結果が確実に得られるようにします。

機械学習:

データサイエンスの全ライフサイクルをカバーし、単一のデータセット内のさまざまなデータタイプを処理する最先端の自動機械学習を利用して、精度と信頼性の高いモデルを素早く作成してテストすることができます。

自動機械学習 (AutoML):

AutoML は H2O AI Hybrid Cloud 全体で利用できます。特徴量変換からモデルの選択と監視およびデプロイまですべてを装備している信頼性の高い AutoML 機能は、AI を実行する AI の実現を目指す H2O.ai を支える原動力です。

  • 自動の特徴量選択(次元削減):
    ユーザーのデータセットについて最も予測性の高い特徴量を自動的に選択するさまざまな専用特徴量選択手法を使用して、モデルの複雑性の低減、推論時間の高速化、モデルの解釈可能性を実現します。

  • 自動特徴量エンジニアリング:
    Grandmaster レベルの専用特徴量エンジニアリングで精度と ROI を向上させます。この特徴量エンジニアリングはユーザーのデータから予測統計情報を自動的に抽出するため、非常に高い精度だけでなく、データの因果関係性の実用的なインサイトを得ることができます。

  • ハイパーパラメーターの自動チューニング:
    H2O.ai 専用、遺伝的アルゴリズム、モンテカルロ、粒子群最適化、ベイズ推定などの手法を組み合わせて実行される機械学習のモデル作成パイプラインのあらゆるコンポーネントを最適化することで、精度と ROI を向上して時間を削減します。

  • チャンピオンまたはチャレンジャーのモデル選択:
    特徴量とモデルの最適な組み合わせを検索し、データセットに適合する最適な機械学習モデルを自動選択する AutoMLによりテストと検証を高速化します。
  • モデルのアンサンブル:
    全自動で簡単にカスタマイズできる複数レベルのアンサンブルで、精度と ROI を向上させます。

  • 自動ラベル割り当て:
    クラスごとの確率を返すだけでなく、各評価レコードのクラスを予測する自動ラベル付けで、エラー発生率の低減と時間の削減を実現します。

  • 自動化されたモデルのドキュメント:
    自動的に生成されたドキュメントで機械学習プロセスについてのインサイトを提供します。このドキュメントでは、実験のプロセス、モデルチューニングの結果、変数の重要度、モデルの重要度、そして再現性のための詳細設定について説明します。

  • 機械学習の解釈可能性 (MLI):
    AutoML は、説明、可視化、カスタマイズを含む信頼性の高い MLI ツールキットを強化します。

  • モデルの検証:
    モデルの全体的なビューを取得して新しいデータ上の不具合を回避することで、モデルの堅牢性を評価し本番環境でのリスクを軽減します。
  • 教師なしの自動機械学習:
    自動的にトピックをグループ化するクラスタリング、データの非正則性を特定する異常値検出、モデルのオーバーフィットと複雑性を軽減する次元削減などの教師なしの手法によって、ラベルなしのデータについて新しいインサイトをすぐに取得できます。

  • 広範なデータセット処理:
    GPU の高速化によって、何百万列もあるデータセットを処理することができます。

  • 不均衡データの処理:
    特別な専用アルゴリズムにアクセスして、不均衡なユースケースの精度を向上させます。このアルゴリズムは、他よりも頻度は高くても価値が低いクラスに対して、希少なクラスの精度を強調するものです。

  • モデルのランキング:
    最善の AutoML モデル作成手法を比較する自動ランキングで、モデルの開発、モデルの選択、モデルの検証を高速化します。

時系列予測:

時系列データの処理専用に設計された独自の特徴量エンジニアリングと AutoML 機能で、簡単にモデルをフィットさせ、予測の問題を解決します。

  • 診断:
    多くのカテゴリー(個々の SKUや製品階層など)について予測を立てる機能で、グループ全体でのモデルパフォーマンスと予測が生成された方法を自動的に表示します。
  • 予測ランキング:
    時系列の実験に特定した新しいランキングモードで、最適化された予測モデルを取得して時間を削減することができます。モデルの選択に役立つさまざまな量のペア(トレーニングとテストのギャップ、予測期間など)で、自動的に複数の実験を設計して実行します。
  • 時系列機械学習の解釈可能性:
    時系列モデルは、感度分析、差別的効果分析、部分従属性または 条件付き期待値、ナイーブおよびカーネル・シャプレー、代理モデル、そしてあらゆる特徴量重要度の手法を含むさまざまな MLI の説明手段で使用できます。

自然言語処理 (NLP):

構造化されていないテキストデータからインサイトを抽出し、傾向を発見してより精度の高い関連情報を取得し、カスタマイズした推奨情報を作成します。

  • テキストの前処理:
    ストップワードの除去、ステミングとレンマ化、絵文字抽出などのような前処理手法のパイプラインを作成することによって、テキストからノイズを除去して NLP の下流タスクを改善します。

  • テキストの分類:
    簡単なTF-IDF から最新の BERT トランスフォーマーまでサポートされている広範なアルゴリズムで、類似の用語や概念にタグ付けし分類します。

  • トピックのクラスタリング:
    モデルの精度を向上させるための人間によるフィードバックでクラスターを詳細に設定するオプションを使用して、テキスト内の関係性を自動的に抽出することによって、新たな傾向についてのインサイトと増加している問題の早期検出を達成します。
  • 固有表現認識 (NER):
    用語を人名、地名、組織名、日付、通貨などのように一般的なグループに分類します。

  • 感情分析:
    肯定的、否定的、中立的な意味合いを特定することで、製品やサービスなど特定のトピックに関する視点について傾向を検知します。
  • NLP 機械学習の解釈可能性:
    新たに追加された多項分類のサポートで、トークンの重要度がクラス間でどのように変化するかを把握することができます。LOCO (leave one covariate out) 2.0 とベクトル化+線形モデル (VLM) で結果についてのトークンの影響を理解し、テキストトークンの部分従属性によりテキストトークンが含まれている場合と含まれていない場合でのモデルの平均的結果を計算します。代理モデルのトークンを生成する場合、TF-IDF または新しく追加されたベクトル化+線形モデル (VLM) から選択することができます。

コンピュータービジョン:

追加のデータ型をユーザーの画像データと結合してテキストや表形式、オーディオデータを取り込む機能によって、モデル作成に画像データを使用することができます。

  • 画像処理:
    GPU 加速化トレーニングですぐに使える最新の畳み込みニューラルネットワーク (CNN) を利用して、オブジェクトを画像で認識して高精度で分類します。
  • ビデオ処理:
    入力ビデオは自動的にフレームのセットに変換された後、画像処理機能を使って処理されます。

  • オーディオ処理:
    入力オーディオデータは自動的にメルスペクトログラムに変換された後、画像処理機能を使って処理されます。
  • コンピュータービジョンモデルの説明:
    Grad-CAM などの手法を使用して画像またはビデオのどの部分が特定の予測につながったのかを理解することができます。

説明可能な AI:

モデルによる予測の背景にある「理由」を簡単に把握してより優れたモデルを構築し、グローバルレベル(一連の予測全体)またはローカルレベル(個別の予測)で、モデルのアウトプットについて説明を提供します。

ホワイトボックス型モデル:

  • 一般化線形モデル (GLM):
    GLM は従来の線形モデルの拡張機能です。高度に説明可能なモデルであり、標準的な回帰手法(二項分類に関する線形回帰とロジスティック回帰など)を統合するモデル構造の柔軟性を備えています。

  • 一般化加法モデル (GAM):
    GAM は、線形予測が予測変数と予測変数の滑らかな関数に依存している一般化線形モデル (GLM) です。
  • 2次交互作用を持つ一般化加法モデル (GA2M):
    GA2M は GAM の拡張機能で、特徴量間の最も重要な相互作用を選択して、その特徴量ペアの関数をモデルに含めます。
  • 説明可能なニューラルネットワーク (XNN):
    説明可能なニューラルネットワークは多くのサブネットワークで構成されており、各サブネットワークは元の特徴量の解釈可能な関数を学習します。
  • RuleFit:
    このアルゴリズムは、ツリーアンサンブルをデータに適合させ、各ツリーの走査によりルールアンサンブル法を構築、データのルールを評価してルール特徴量セットを構築、そして元の特徴量セットと結合されたルール特徴量セットにスパース線形モデル(LASSO 回帰)を適合させます。Driverless AI ではデフォルトで利用できます。
  • Skope-Rules:
    このアルゴリズムは分類を実行するための簡単なルールを学習します。

  • 決定木と線形モデルの組み合わせ:
    このモデルは決定木を使ってデータを区分し、各リーフノードのデータに GLM を適合させます。

解釈可能性の手法:

  • 部分従属プロット (PDP):
    列がグローバルレベルでどのように予測に影響するかを表示するプロットで、ユーザーが列を参照してその列が予測に与える影響を調べる機能を備えています。

  • 特徴量の重要度:
    ナイーブベイズと変換された特徴量の両方でどの特徴量がモデルの意思決定に重要であるかを計算します。
  • Shapley の理由コード:
    グローバルレコードと個々のレコードについて非線形モデルのレコードレベルでモデルの説明可能性を提供します。

  • 代理決定木:
    非常に簡単で可視化されたわかりやすい方法で、複雑なモデルの予測に影響を及ぼしている要因を特定します。

  • Leave One Covariate Out (LOCO):
    集計ビューまたは行レベルのビューから、サロゲートランダムフォレスト予測に重要な特徴量を特定します。
  • 条件付き期待値(ICE):
    列が個々のレベルでどのように予測に影響しているかを表示するプロットで、選択した行にドリルダウンして平均的な部分従属と比較対照する機能を備えています。

  • k-LIME 理由コード:
    全データセットに対してレコードレベル、データセットのサブセット、または集計レベルで新しい理由コードを生成します。

バイアス検出:

  • 差別的効果分析: 
    データセット内のグループ間にある差異を表示するダッシュボードを使用して、モデルがさまざまなメトリックスにおいてバイアスを示しているデータの領域を特定します。
  • 感度分析:
    単一行や複数行または全データセット上でトレーニング済みモデルを評価してモデルの新しい結果を元のデータセットの予測結果と比較することができるツールで、それほどのオーバーヘッドなしにモデルの説明を非常に詳細なレベルで提供します。.

サードパーティモデル:

  • 時系列モデルの説明:
    時系列モデルは、感度分析、差別的効果分析、部分従属性または 条件付き期待値、ナイーブならびにカーネル・シャプレー、代理モデル、そして特徴量重要度のあらゆる手法を含むさまざまな MLI の説明法で使用できます。
  • NLP モデルの説明:
    新たに追加された多項分類のサポートで、トークンの重要度がクラス間でどのように変化するかを把握することができます。LOCO (leave one covariate out) 2.0 とベクトル化+線形モデル (VLM) で結果に関するトークンの影響を理解し、テキストトークンの部分従属性により、テキストトークンが含まれている場合と含まれていない場合でのモデルの平均的結果を計算します。代理モデルのトークンを生成する場合、TF-IDF または新しく追加された ベクトル化+線形モデル(VLM) から選択することができます。
  • コンピュータービジョンモデルの説明:
    Grad-CAM のような手法を使用して、画像またはビデオのどの部分が特定の予測につながったのかを理解することができます。

  • 外部モデルの解釈可能性:
    モデルに依存しない説明法と特徴量重要度の計算によって、H2O AI Hybrid Cloud 外で構築されたモデルのインサイトを取得します。

  • 独自のレシピを適用:
    Python であらゆる説明可能性のコンポーネントをカスタマイズする API アクセスによって、説明可能性パイプライン全体のシームレスな制御が可能になります。

ローコードなアプリケーション開発フレームワーク:

バックエンドの機械学習機能とフロントエンドのユーザーエクスペリエンスとのシームレスな統合によって、革新的なソリューションを実現しやすくするローコードのフレームワーク (Python または R) で、AI のプロトタイプとアプリケーションを素早く構築します 。

  • アプリケーション開発:
    ベストプラクティスと複数の業界を網羅するプロトタイプのライブラリへのアクセスでアプリケーションの構築にかかる時間を短縮し、開発しながらリアルタイムで UI の変更を確認する機能でソリューションの管理を簡素化することができます。
  • ローコードなユーザーインターフェイス (UI) の作成:
    統合された UI と AI の開発を支援する Python または R のフレームワークで、利用者本位の対話型アプリケーションを簡単に開発することができます。
  • 機械学習の統合:
    クラス最高のデータサイエンス機能への API アクセスによって、機械学習の機能を新規または既存のソリューションに統合しやすくなります。

Operate.

H2O.ai は機械学習の運用に関する機能の包括的なスイートを提供し、運用環境のモデルのデプロイ、管理、監視において、データサイエンティストと機械学習エンジニアを支援します。さらに、H2O AI Hybrid Cloud は、ユーザー独自のトランスフォーマーとレシピおよびモデルの簡単な統合、分散処理、コンピューティング効率、そして好みの環境でデプロイする機能によって、非常に柔軟なアーキテクチャを提供します。

機械学習の運用:

リアルタイムでモデルを監視し、カスタムしきい値を設定して予測精度とデータドリフトについての通知を受信することで、デプロイ済みのモデルが意図した通りに稼働しているかが保証されます

モデルのレポジトリ:

 

  • モデルの管理:
    すべての実験とその関連する成果物を、組織全体でホストし管理するために集約する場所を設定します。全モデルの一元表示を取得するための自動生成メタデータとカスタムメタデータの両方を含めて、実験をモデルとして登録します。

  • モデルのバージョン管理:
    実験を新しいモデルのバージョンとして登録して、すべてのデプロイ済みバージョンの透明度を維持します。

  • サードパーティモデルのサポート:
    scikit-learn、PyTorch、TensorFlow、XGBoost、LightGBMなどのサードパーティのフレームワーク上でトレーニング済みのモデルを、ネイティブの Driverless AI モデルと同様に管理します。

モデルのデプロイ:

 

  • ターゲットデプロイ:
    すぐに構築してスコアリング環境にデプロイします。

  • デプロイモデル:
    複数変数 (A/B)、チャンピオンまたはチャレンジャー、カナリアなど異なるモードの運用環境でモデルをデプロイします。

  • スコアリング:
    モデルの評価をリアルタイム(ホストされた RESTful エンドポイント)、バッチ(サポートされているソースとターゲットのデータストア)、非同期、またはストリーミングデータで実行することができます。

モデルの監視:

 

  • データと概念のドリフト:
    モデルの監視を継続し、モデルが評価しているデータが対象外のものか、またはトレーニング済みのものかを識別します。

  • 特徴量の重要度:
    スコアリングの結果と共に、予測値への貢献度が最も高いものと最も低いものはどの特徴量であるかについてローカルレベルの説明を受信することができます。

  • ランキング:
    主要評価指数別に実験とモデルを表示して並べ替えします。

  • 警告:

    カスタムしきい値の設定機能で、すべての監視済みメトリックスについて 警告と通知を受信します。

    .

柔軟なアーキテクチャ:

H2O AI Hybrid Cloud はあらゆる環境に対応するため、企業は既存のインフラストラクチャに関わりなく H2O.ai の技術を自社の機械学習パイプラインに取り入れることができます。

拡張可能:

 

  • あらゆるプラットフォームに対応:
    Google Cloud Platform、Amazon Web Services、Microsoft Azure、またはオンプレミスをサポートします。

  • カスタムレシピアーキテクチャ:
    Python、RAPIDS/CUML、PyTorch、TensorFlow、H2O、XGBoost、LightGBM、DataTable、sklearn、Pandas、その他多くのパッケージの最新バージョンからメリットが得られます。また、組み込みのカスタムレシピアーキテクチャで、上記パッケージや他の Python パッケージを完全に制御することができます。

  • 柔軟なモデルの支援:
    H2O.ai またはサードパーティモデルをトレーニングしてデプロイし、Python でカスタマイズします。

  • 複数のプログラミング言語:
    Python、R、Java 用のクライアントで、データサイエンスユーザーベースの大半をカバーします。

分散型:

 

  • 複数ノードのトレーニング:
    スケーラブルな分散型機械学習バックエンドは、複数のワーカーノードにスケールアウトすることであらゆるデータサイズを処理することができます。

  • 複数の CPU/GPU でトレーニング:
    複数の CPU または GPU上で、より高速でモデルのトレーニングを実行します。

  • Kubernetes ベースのデプロイ:
    クラウドリソースの割り当てを自動化することによって、インフラストラクチャのスケーラビリティとメンテナンスを簡素化します。

スケーラブル:

 

  • NVIDIA RAPIDS の統合:
    NVIDIA RAPIDS の完全統合によって高性能コンピューティングを実現します。

  • AmpereベースのGPU:
    最新の CUDA ランタイムを使用してAmpereベースの NVIDIA GPU のコンピューティングとネットワークをかつてないほど加速化する支援によって、簡単にワークロードの調整が可能になります。

  • プラットフォームパフォーマンス API:
    H2O AI Hybrid Cloud マルチノードクラスターのリソース監視と自動スケーリング用のプラットフォームメトリックスを提供する公開 API で、システム使用状況を可視化し管理します。

Innovate.

組織全体で AI を民主化するには、技術力が異なるユーザーが想定できる直感的なエクスペリエンスと強力な機械学習モデルを統合する必要があります。H2O AI Hybrid Cloud は、複雑なソリューションの実現と利用を簡素化するために設計された AI AppStore を提供するため、より多くの人が革新の取り組みに参加できるようになります。

AI AppStore

H2O AI Hybrid Cloud は迅速なプロトタイプの作成とソリューションの開発を支援し、さらには技術チームとビジネスユーザーとの共同作業も促進します。H2O AI AppStore は、包括的な機械学習の機能、信頼性の高い説明可能な AI ツールキット、ローコードなアプリケーション開発フレームワーク、そして統合された機械学習の運用を提供して、ユーザーが大きな構想を目に見える影響に変えるために必要な促進剤となります。

業界共通のデータサイエンスアプリケーション

  • AutoInsights
    自動化されて対話型でわかりやすく実用的なインサイトが、理解しやすい自然言語のナレーションとして要約されます。
  • 新しいデータセットを探索して重要なビジネス上の知見を発見します。

    • コーディングの必要なしで、あるいは異常なデータポイントやテキストデータのトピック、特徴量間の相関関係などの高度な分析経験がなくても、インサイトを発見することができます。

    • 効率的なストーリーテリングのために、インタラクティブな可視化とナレーションを取得できます。
  • モデルの検証:
    機械学習パイプラインの信頼性と安定性を分析して、データやモデルの不具合または脆弱性を明らかにします。
  • ドリフトや敵対的類似性などの手法を使用して、データが経時的に変化しているかを把握します。
    • バックテスト機能を使用して、機械学習モデルが過去のさまざまな時点でどのようなパフォーマンスを示す可能性があったかを理解します。
    • データとモデルの検証を可視化して、ビジネス上の重要な意思決定をするためにそのモデルを信用できるかどうかを把握します。
  • モデルの監視:
    特徴量のドリフトのために実稼働モデルを監視し、モデルが運用環境で安全に使用可能であるかを把握します。
  • H2O MLOps と統合して、デプロイ済みモデルのデータサイエンスインサイトを取得します。

    • SQL データベースでデプロイされたモデルなど、外部モデルのドリフトを把握します。

    • カスタムしきい値を使用して、ドリフトが問題になる場合とそうでない場合についてのビジネス知識を統一します。

金融サービス向けアプリケーション:

  • LIBOR 関連の文章の検出:
    金融の契約やドキュメントを処理するための包括的なソリューションは、自動 NLP パイプラインを使用して LIBOR(ロンドン銀行間取引金利) に言及している対象となる文章、LIBOR の文脈についてのインサイト、BERT ベースの文章のクラスタリングアルゴリズムを特定し、さまざまな文章を異なるカテゴリーに区分します。
  • 説明可能な異常検出:
    きわめて異常なデータ要素と、それが他のデータと異なっている点を特定します。これは不正行為を発見するための新しいルールの作成に役立ちます。
  • クレジットカードのリスク:
    顧客がクレジットカードの支払いを予定通りに行うかどうかを予測するために、ユーザー独自の機械学習モデルとアプリケーションのフロントエンドを構築する方法のプロトタイプを提供します。

医療機関向けアプリケーション:

  • COVID-19 の予測:
    このアプリケーションは最新の COVID-19 データを使用して、1 か月先までの確認感染者数と死亡数の地域別予測を提供します。

  • Covid-19 ワクチンの NLP:
    サブトピックと、ワクチンについてソーシャルメディアに示されている意見の進化するセンチメントを特定する NLP アルゴリズムです。

  • Covid-19 入院予測: 
    病院周辺地域でのCOVID-19 の流行とワクチン接種率の最新情報に基づいて、今後の入院(救急診療、集中治療室、その他の入院患者)について計画します。
  • 診療予約の当日無断キャンセル: 
    AI を利用して患者の治療と診療予定を改善するために、予約の当日無断キャンセルの確率を把握して、患者が予定していた約束を守らない場合に重要な影響を与えている要因についてのインサイトを取得します。

  • 従業員の離反予測:
    従業員離反の予測を可視化して離反率を予測し、従業員のデータに含まれる関連要因を特定するプロトタイプソリューションで従業員の減少を最小限にするための全体計画の一環として、AI は中心的な役割を果たします。
  • 薬剤のレビュー:
    アップロード済みのレビューまたは個別に入力された患者のレビューに基づいて、薬剤の認識された効果を AI と NLP 主導で評価します。

  • 胸部 X 線異常の検出:
    データサイエンティストと臨床医の両方を対象として、X 線画像から異なるタイプの異常を検出して特定するためにコンピュータービジョンのプロトタイプを提供します。

  • プロバイダーの請求に関する不正:
    プロバイダーの信頼性を評価する AI を搭載した支払い者向けソリューションで、評価を促す理由について説明を提供します。

カスタマーサービス向けアプリケーション:

  • 顧客離反のリスク:
    顧客が競合他社に移る可能性があるかを特定するリアルタイムの予測分析のために、ユーザー独自の機械学習モデルとアプリケーションのフロントエンドを構築する方法の例を提供します。顧客離反は、ほぼすべての業界向けの主要なユースケースとして繰り返し選ばれています。どの顧客が離反する可能性が最も高いのか、そしてさらに重要なこととしてその理由は何かを知ることで、サポートスタッフは適切な手段を得て顧客の喪失を削減することができます。

    • 顧客データの調査

    • エンドユーザーはトレーニングデータの数行を参照することができます。

    • サードパーティのプロットライブラリを使用してデータの履歴トレンドを表示します。

    • 利用者の可視化

    • 3 秒ごとにモデルの REST エンドポイントにシミュレート済みの新規データを送信します。

    • エンドユーザーに最新の予測を表示します。

    • 状態別および全体として予測分布を表示します。

    • アプリケーションコードの表示

    • このアプリケーションの作成に使われた Python のコードを参照します。
  • マーケットバスケット分析:
    マーケットバスケットのアルゴリズムを構築して調査し、顧客に向けた製品の推奨情報を作成します。マーケットバスケット分析は、カタログ内のさまざまな製品の関係を理解することと、取引履歴データを利用して推奨情報を生成するのに役立ちます。これは以下のようなシナリオに広く利用されています。

    • エンゲージメントを向上させるために特定の製品と類似した製品を推奨

    • 購入手続き中に追加できるように現在の買い物かごにあるものと関連した製品を推奨

    • アップセリングの提案として、一緒に販売できる製品の組み合わせを推奨

    • 在庫管理のために特定の製品の代替品を推奨
  • 説明可能なホテルの格付け:
    モデルの解釈可能性を利用して、評価の文章について何が肯定的センチメントまたは否定的センチメントを表しているかを理解します。このホテルの評価分析デモは、ビジネスユーザーが機械学習モデルによる満足度予測を参照できるようにします。ユーザーは平均的な予測のキーワードをさまざまなデータのサブセットと比較して、多様なゲストが異なるタイプのホテルをどのように満喫したかを理解することが可能になります。

事業運営向けアプリケーション:

  • 予知保全:
    センサーデータからリアルタイムの情報を取得して、故障する可能性のあるパーツとその時期および原因を把握します。次に起こる第4次産業革命は、現代のスマートテクノロジーを利用して従来の製造と産業の慣行を自動化するものです。これには相互接続性、デジタル化、そして自動化が含まれます。これに関連して、製造業界での故障予測技術と衛生管理(予知保全とも言う)は、インテリジェントで自動化されたプロセスを使用して、産業機器の評価、妥当性判断、診断、衛生管理によって保守費用を最小限にすることを目指します。このアプリケーションはリアルタイムのセンサーデータを使用して産業機器の妥当性判断と診断を提供します。
  • デマンドセンシング:
    従来の需要予測を天候や消費者の購買行動のような外的要因と結合して、サプライチェーンを向上させます。

    • デマンドセンシングは、サプライチェーンの現状に基づいて正確な近未来予測(動的サプライチェーンの状況次第で時間数や日数を問わず)を立てるために新しい数学的手法と最新のリアルタイムの情報を活用する方法であり技術です。

    • デマンドセンシングは予測において根本的に異なるものです。なぜならデマンドセンシングは、サプライチェーンの現在のデータを含むはるかに広範な需要の兆候とさまざまな数学的モデルを使用して、市場の変化、天候の変化、自然災害、消費者の購買行動など実社会での事象に対応する、より精度の高い予測を立てることができるからです。

    • デマンドセンシングは大量のデータと認識されたパターンを使うため、サプライチェーンは実行可能なヒントを得て正確な意思決定をすることができます。また、リアルタイムでビッグデータを合成することで、企業が消費者の行動と変動要素を理解するのに役立ちます。
  • 従業員の離反:
    従業員の離反リスクを予測し、関連する要因を特定します。このアプリケーションは、従業員の減少を最小限にするための全体的な計画の一環として機械学習の利用を実証するものです。ユーザーは従業員の離反予測を見て離反率を予想し、従業員のデータに含まれる関連要素を特定することができます。

Try the H2O AI Cloud Today.