クラウドデプロイメント新機能(2018/9/14)

こんにちは、DataRobot Japanの小幡です。
DataRobot Cloudでは、毎週のように新しい新機能が登場しています。このエントリーでは、クラウドデプロイメントにおける最近の新機能をご紹介します。

多クラス分類機能の拡張:100クラスまでのサポート

  • 今回のクラウドデプロイメントでは、多値分類機能において100クラスまでの分類がサポートされるようになりました
  • また、混同行列も100クラスまでの多値分類で使用可能になっています
    多数のクラスの混同行列をナビゲートするために右下にサムネイルが表示され、これをクリックすると左側に混同行列が表示されます
    スクリーンショット 2018-09-14 17.36.06

 

「特徴量セット」タブによる管理の簡素化

  • プロジェクトに固有の特徴量セットを一つの画面で管理できるようになりました。「データ」ページに新たに「特徴量セット」タブが追加されています。ここではDataRobotが自動作成した、あるいはカスタム作成した特徴量セットがリストされ、特徴量数やモデル数などの概要情報を参照できるほか、カスタム作成のものについては名前の変更や削除といった作業を行うことができます
    FeaturesList
  • このタブからはオートパイロットを再実行することもできます。これは従来から画面右側のパネルにある「Rerun Autopilot」と同じ働きをします。特徴量セットは削除も行えるようになりました (鍵マークがついたものを除く)。詳細はDataRobotドキュメントをご覧ください。

 

冗長な特徴量の検出

  • 冗長な特徴量を検出する機能が追加されました。あるターゲットに対して2つの特徴量が同様のインパクトをもつとき、よりインパクトの少ない方の特徴量は「冗長」と判定されます。
    RedundantFeatures

 

より大きなサンプルサイズを使用したオートパイロット自動再実行

  • 推奨されたモデルに対しては、インパクトが大きく冗長でない特徴量についてサンプルサイズを大きくした上でオートパイロットの再実行が行われます。再実行後、デプロイメント用に推奨されるモデルには「RECOMMENDED  FOR DEPLOYMENT」タグがつけられます。
  • また、非ブレンダーで日時パーティションを用いたモデルのうち最も良いものについては、特徴量を削減した上で自動的に学習が行われます
  • 重要:「RECOMMENDED FOR DEPLOYMENT」タグのついたモデルについては、ホールドアウトがロックされている場合でもホールドアウトスコアは自動的にアンロックされます

予測結果に対するしきい値の設定

  • 二値分類において、しきい値を予測結果に対して反映させることができるようになりました。これにより、あるモデルに対してユーザーが指定したしきい値でポジティブクラス・ネガティブクラスの判定が行えるようになります
    スクリーンショット 2018-09-14 17.44.20