まえがき

2019年も残すところわずかとなってきました。今年もAI/機械学習の技術発展は著しく、またこの技術がビジネスにとどまらず、広く社会に適用されることによる新たな社会問題なども報道されるようになりました。DataRobotにおいても、年次のAI Experienceイベントに過去最高の来場者を記録するなど、引き続きデータ・AI活用へのかつてない注目の高さを実感しています。

DataRobotブログでは、機械学習の技術ティップス産業各界における応用事例AI活用の組織的課題などについて今年も弊社のデータサイエンティストが精力的に執筆してきました。今回は今年一年間の振り返りとして、各メンバーが注目した、今年のニュース総集編企画を行いたいと思います!まずは注目のニュース第一弾です。第二弾は12月27日(金)リリース予定です。こちらも合わせてご覧ください。

 

Blog 執筆者が選ぶAIニュース

ナカヤマハルユキ

自己紹介:DataRobot流通・小売・外食担当データサイエンティスト。DataRobot歴1年。趣味はランニング。

グーグルが「肺がん診断AI」、3D画像認識の威力を知らしめた

個人的に医学やスポーツにおけるAIの活用に興味があり、立体の画像処理技術によりCTスキャンの画像を使った肺がん検出率が放射線技師並になったという記事に注目しました。

1枚のCTスキャンの画像から初期の肺がんを見つけるのは難しいです。血管と見分けがつかないからです。連続する複数の断面の画像を見て、連続性が途切れることを確認して、はじめてがんであると推察することができます。今回、これまで動画の動きの抽出に使われてきた3次元(2次元画像+時間)のConvNetを立体の画像解析に用いることにより、検出率が向上したとのことです。ただ、記事には書かれていませんが、一般のCTのスライス間隔は5mmで、基本的にこれ以上の大きさにならなければ、いくら技術が進化しても、検出するのは難しいです。精密検査時の1mm間隔をデフォルトにするなど、検査の仕方から見直す必要があるかもしれません。いずれにしても、これまで2次元の画像処理ではできなかったことができるようになる期待があります。

 

グザビエフォンテーヌ

自己紹介:DataRobotデータサイエンティスト。小売業界担当。趣味は日本食。

人工知能が「スタークラフト2」で人間に勝利、その闘いから見えた機械学習の次なる課題

DeepMind StarCraft II Demonstration

皆さんは年末年始どのような予定を過ごしますか。実家へ帰省する方、海外で過ごす方、様々いるかと思います。人が一堂に集まるこの時期、皆でゲームを楽しみ素敵な時間を過ごす方もいらっしゃるのではないでしょうか。
今年人工知能が、リアルタイムストラテジーゲーム「スタークラフト2」で世界チャンピオンを打ち負かしたをことをご存知ですか。AIが人間を打ち負かすという話は、ここ数年チェスや囲碁で話題になりましたが、囲碁より複雑なゲームでのAIの勝利は大きな進化といえます。
2019年1月24日、アルファベット傘下のDeepMindが開発した人工知能ボットの功績がYoutubeでリリースされました。これは機械学習の十分なデータ量とコンピューターの処理能力さえあれば、特定の課題がどんなに複雑であっても解決できるという新たな証明になりました。
ただし、新しいスタークラフトマップ、またはスタークラフトの最初のバージョンで、そのAIボットは人間に勝つことは出来ません。なぜなら、そのAIに学習させた過去データと予測に使うデータに含まれているパターンが異なるからです。
自動運転などの他の分野でも同様の問題が見られ、人工知能はまだまだ汎用人工知能(Artificial General Intelligence: 人間レベルの知能の実現を目指したAI)のレベルに達成出来ていないことを示しています。汎用人工知能は今後数年間の焦点となるでしょう。

 

緒方良輔

自己紹介:DataRobotデータサイエンティスト。CPG担当。サイケデリックミュージックが好き。

FacebookやMicrosoftなどがディープフェイクの検知ツール開発コンペを開催

正直に告白すると、今年のはじめ頃に、Deepfakeで作られたトランプ大統領のおもしろ動画で腹を抱えて笑ったことがあります。反省しています。

ディープフェイクとはディープラーニングを利用した、複数の写真や動画の一部を合成する技術です。これを用いると、本物にしか見えないような偽(フェイク)動画や写真を作成することが可能になってきています。技術の利用も簡単になっており、現在は閉鎖されていますが、2019年前半ごろまでは誰でも簡単に上記の技術を無記名で利用可能なプラットフォームもネット上に公開されていたようです。

昨今はこれを悪用して、政治家や著名人を題材にしたネットミームを作ったり、さらに悪質ないたずらに用いることで問題視もされています。また問題をさらにややこしくしているのは、最近の技術進捗により、この偽動画や画像を事後的に偽と見破るのが非常に難しい点です。機械学習コンペサイトKaggleで開催された新たなコンペDeepfake Detection Challengeは、こうした偽画像を検出する、より精度の高い検出ツールを開発する目的があるそうです。

判別できないほど高精度な偽画像を作成する機械学習の進歩にも驚く一方で、悪用される技術を駆逐するのもまた同じ機械学習となることと思います。なんだかマッチポンプみたいだなぁとも思いますが、こうやって技術というのは進歩していくのかというサイクルを1年で見ることができて、感慨深い気持ちになったニュースでした。


川越雄介

自己紹介:DataRobotデータサイエンティスト。製造・ユーティリティー業界担当。趣味は楽器演奏。

AWS、ディープラーニング向け自動作曲キーボード「DeepComposer」を99ドルで予約開始

普段からYAMAHAのピアノやRolandの電子キーボードで遊んでいる私。「あのAWSが電子キーボードを!?」タイトルを斜め読みしてまずはそう驚いてしまいました。

今年急速に注目を集めだした敵対的生成ネットワーク(GAN: Generative Adversarial Networks)。これまでAIは「認識するための技術」として画像や文章を認識することが主流でしたが、GANのような生成系のAIは実在しない新しいデータを作り出すことができます。応用範囲は文章、画像、音声、動画と幅広く、特にクリエイティブ系での実用が期待されています。今回注目したAWSの自動作曲キーボードは、まずメロディーをこのキーボードから入力し、次に好きなジャンル(ロック、ポップ、ジャズ、クラシック、ユーザーによるオリジナル)を選択すると、AIがピアノ、ギター、ベース、ドラムの演奏を自動でつけてくれて新しい曲を「作曲」できるというものです。(メロディーは自分で作らなければならないようなので、個人的にはこれは「編曲」ではないかと思っているのですが(笑)。)

プレゼンテーションによれば、この「作曲」にGANが使われているようです。GANには「ジェネレーター」と「ディスクリミネイター」という2つのディープラーニングのネットワークが登場します。ジェネレーターは自然に聞こえる良い音楽を作り出そうとする一方で、ディスクリミネーターはそれが本当に良い音楽かどうかを評価する役割を担います。この関係は「敵対的」との言葉が示すように、通常は偽物を作り出す犯人と、それを見抜く探偵に例えられることが多いのですが、このAWSのプレゼンテーションではそれを「演奏者」と「指揮者」の関係に例えてあり、とても素敵ですね。

敵対的生成ネットワークもクリエイティブ系の世界に素敵な恩恵をもたらしてくれるだけであればよいのですが、一方で偽物が本物を出し抜くためにこの技術を使う動機が生まれてしまうのは残念ながら否めません。その例として、前の記事で弊社の緒方がディープフェイクを、次の記事で菅原がフェイクニュースを取り上げていますので、併せてぜひお読みください。

 

菅原功

自己紹介:DataRobotデータサイエンティスト。製薬業界をメインで担当。趣味は読書とカラオケ。

「危険すぎる」と話題の文章生成AI「GPT-2」の最新版がリリース、実際に使えるデモサイトも登場

TeslaのCEOイーロン・マスク氏が出資しているOpenAIが開発したテキスト生成ツール「GPT-2」。文章を少し入力するだけで、その後に続く文章を自動で生成してくれると言うものです。AIが作詞や作文などを人間の代わりにしてくれる技術として大いに話題になりました。

OpenAIはこの技術は悪用される危険が高いとして、論文の公開を遅らせていました。それは非常に簡単に「それっぽいデマ」、つまりフェイクニュースを作成出来ると考えられたためです。GPT-2はレベルの低いものから段階的にリリースし、社会的な影響を見ながら公開を進めていました。それがいよいよ最終版をリリースした、と言うのが上記のニュースです。

そんなGPT-2を簡単に試すサイト”textsynth”もニュース内で紹介されています。

早速私も下の文章で試してみました。

”DataRobot gives you the power of AI to drive better business outcomes.

DataRobot will be”

(DataRobotを使用すると、AIを使用してビジネスの成果を向上させることが出来ます。DRは、・・)

と記載し、後はGPT-2に続きの文章を作ってもらいます。

さあ、結果を見てみましょう。

ーーーーー

DataRobotは、データの力を組み合わせて顧客満足度、収益の増加、ROIの向上を実現するスタンドアロンのAIプラットフォームです。

DataRobotは、データを分析し、データインテリジェンスと意思決定を改善するための新しい機会を見つける方法を提供します。

AIエキスパート、エンジニア、データサイエンティストのチームを編成して、データインテリジェンスなゴールを達成できるようにします。

これにより、よりパーソナライズされた予測的でかつスケーラブルなエクスペリエンスが提供されます。

DataRobotを使用すると、次のものが得られます。

  •  ビジネスにデータを使用する自由
  •  データを活用して顧客体験、収益、ROIを向上させる機会
  •  新しい洞察、より良い意思決定、生産性の向上のためにデータを使用する機会
  •  他の業界、新しい市場、新しい顧客の問題を解決するためにデータを使用する可能性

私たちと共にAIソリューションのグローバルリーダーに参加しましょう。

ーーーーーーーーーーーーーーーーーーー

どうでしょうか?なんだかすごくそれっぽい文章を勝手に作ってくれました。念のためですが、上記はDataRobotの正式なメッセージではないですよ!

ちなみに実行するごとに結果は変わります。この後何回か試した結果、DataRobotのファンが登場して成功体験を話し出したり、Steve Pendergrassなる謎の人物がCEOを名乗りながら今後のビジネスを語り出したり、温かな朝食とベッドを安価で提供し始めたりしていました。

笑い話にもなる反面、確かにフェイクニュースがネット上に氾濫することは現実になると感じます。ネットリテラシーなんて言葉が叫ばれて久しいですが、人間はより情報ソースの信頼性を意識しながらインプットが求められる時代になりそうです。

ちなみにOpenAIは、こうしたAIが作成した作文を高精度で見分けるAIも開発しているとのこと。AIによって作られる不利益をAIで解決する、なんて活用用途も今後増えていくかもしれませんね。

 

コウザイテツヤ

自己紹介:DataRobot金融担当データサイエンティスト アソシエート。趣味はサッカー。

未来のサッカーは二つに分かれる。VAR経由でAI審判へ

2018年に開催されたサッカーW杯ロシア大会において、VAR(ビデオ・アシスタント・レフェリー)と呼ばれる主審が試合中にピッチ上で起きた事象について映像を用いて確認するシステムが初めて導入されたことは記憶に新しい。日本のJリーグにおいても2020年シーズンからVARの導入が決定した。

そんななか、近年サッカー界では目まぐるしくルール改正が行われており、サッカーからAI化へ歩み寄っているかのようなルール改正が話題を呼んでいる。例えば、これまでハンドのルールは「意図的にボールに手で触れたか否か」が唯一の焦点だったが、2019-20の競技規則改正ではケース毎に条件が細かく切り分けられ「どの状態で手に触れたか」が焦点となっている。つまり、審判の主観の範囲が狭められ、0と1でデジタル判断できるルールに変わってきている。私はこれまでサッカーやバスケットボールなど人間の主観的な判定が多いスポーツにおいては審判のAI化が難しいだろうと感じていた。しかし、今回のルール改定のように既存のルール・仕組みを見つめ直し、機械やAIに寄り添うことでAI化を実現できるのではと最近は感じている。

これらのことはスポーツに止まらずビジネスでも同様のことが言えるのではないでしょうか。「この業務はAI化に向いていない」、「データが存在しないから実現できない」という思い込みを捨て「どうしたらAIに寄り添えるか」、「どうしたらデータ化できるのか」と考え直すことで、これまでAIによる自動化・効率化が不可能であった場面においてもAI化を実現できるのではないかと考える。そういった既存の仕組みをゼロベースで考え直し、新たな枠組みで再構築する知的生産活動こそがこれからのビジネスパーソンに求められる仕事なのではないかとこの記事から感じた。

 

マツモトタカヒロ

自己紹介:Data Science Associate. 元バックパッカー。現大学院生。

Uber、ロンドンでの営業免許を更新できず--安全面に懸念

Uberがロンドンでの営業許可が更新されなかった事例で、その背景は過去数ヶ月で14,000の乗車が不正ドライバーにより行われたものと判明したため、安全上の理由から営業すべきでないと当局(TfL)に判断されたというものです。これにより、4万5000人のドライバーと、350万人のライダーに影響がおよぶ可能性があります。

UberがTfLによりロンドンで営業許可が更新されないのは今回で2回目で、appealしている期間は、判決が確定するまで営業を続けることができますが、ロンドンのような非常に大きなマーケットで、不正ドライバーを理由に営業ができなくなるということはあまり聞いたことがありません。ロンドンには非常に数多くのUberでの乗車がありますので、過去数ヶ月での14,000の乗車は全体に対する割合としては大変小さいのですが(もちろん判明してない分もあると思いますので、実態はこれ以上の可能性はあります)、これを根拠に営業許可が更新されないことは、ビジネス上、機械学習による二値分類を実ビジネスに適用させることの難しさを考えさせられます。

Uberでは安全対策の一環で、無作為にドライバーに顔写真の撮影を求め、画像認識を行い、リアルの本人であるかどうか機械学習を用いて、本人かどうか確認します(例えば、本人の写真でないかなど)。本人と判定されないと一時的にアカウントが凍結されるなどの処置が取られます。これは、ドライバーからすると機会損失含めてコストが大きく、Uberとしてもオペレーションコストや逸失利益の増大もあります。そのため、安全対策と利便性のバランスが求められます。偽陽性も偽陰性もコストが高く、社会的なインパクトも大きい場合には、適切なしきい値の設定には非常に高度なビジネス判断が求められる例だと思います。

 

小島 繁樹

自己紹介:DataRobot CFDS。趣味はダイビング・バイク・サウナ。

Google 量子超越性を達成と発表

SIerのSEとして仕事をスタートした2000年当初(だいたい20年前)、「いつか、手のひらにTB級のストレージが乗る日が来る」といった話はまだ笑い話でしたが、当時の上司から「技術の進化で世界、仕事のあり方は変わるんだよ」という話をされたのを覚えています。

このニュースを見た時、その会話の中で「量子コンピュータが現実になると、科学技術計算で利用されているXX億円のサーバのあり方も変わるだろうね」という話もしたことを思い出しました。

「量子コンピューターは、実用性に大きな制約を抱えている。量子情報処理の基本単位である量子ビットは、攪乱されやすいため、絶対零度からコンマほどしか高くないというほど超低温の複雑な冷却ユニットに格納しておかなければならない。コアハードウェアを取り扱うために動作を停止するには、損傷せずにシステムの温度が上がるまで2日以上かかるし、再起動のときも超低温になるまでまた2日かかる。量子コンピューターがノートPCのサイズになる日は、そう簡単には来そうにない」

"まだ特定用途にしか使えない"   "運用はそう簡単ではない" 

発展途上な点ももちろんありますが、現在のコンピュータも黎明期には特定用途でしか利用されていない、運用がとても大変だったものです。今では手のひらの中で稼働する世界になりました。

技術の進化は連綿と、そして確実に続き、ふと気づいた時には「手のひらにTB級のストレージ」という日が来ていて、世界や仕事が大きく変わっているのだろうと思います。そういった技術による世界の変化にふと気づかされるニュースではないかと思います。

 

メンバー募集

DataRobotでは民主化をさらに加速していくためのメンバーを募集しています。データサイエンティスト、マーケティングから営業まで多くのポジションで募集していますので、興味を持たれた方はご連絡ください。