大変好評いただきました「今年のベストAIニュース」のPart 2となります。

Part 1と同様に今年一年間の振り返りとして、各メンバーが注目した、今年のニュースを発表したいと思います。

Blog 執筆者が選ぶAIニュース

シバタアキラ

自己紹介:DataRobotデータサイエンスチームリーダー。DataRobot歴4年。趣味はアイスクライミング。個人ブログ:http://ashibata.com

初のトランジスタ数1兆のチップを製造するためにCerebrasが克服した5つの技術的課題

大量のデータとディープラーニングを使いより高い精度の予測モデルを生成するには大量の計算リソースが必要となります。GPUやTPUを使った機械学習のハードウェアアクセラレーションはここ数年人工知能技術のフロンティアを押し広げてきました。一般的なシリコンチップはウェハーと言われる大きなシリコン基板上に数百エッチングされ、一つ一つの小さなチップに分割されますが、シリコンバレーのスタートアップであるCerebrasは、ウェハー全体を一つの巨大なチップとして製造するという大胆な発想にたどり着きました。

半導体の製造はその難しさから歩留まりが低いことで知られており、一つのウェハーから作られた多数のチップの中には不良品が複数含まれることが避けられません。つまり、Cerebrasの製造するウェハーサイズのチップにおいては、ウェハー全体の製造品質を著しく向上しなければ、正常な製品の出荷にこぎつけることができません。同社は今年その技術的挑戦を乗り越えプロトタイプの製造に成功しました。同時にこの様なチップ上でプログラムを開発し、動作させるには、独自のコンパイラーなどのソフトウェア基盤が必要になり、同社はその開発も行っています。

この様な巨大な計算リソースを使わなければ解決できない課題はなんなのか?同社で働く知人に聞いたところ、遺伝子医療の事例が上がりました。個人のDNAの特徴により、特定のがんの発がん確率に関してはかなりの精度でのリスク予測ができるケースがありますが、膨大なDNA配列の中から、発病に関連する遺伝子を発見する研究はまだ黎明期にあるといえます。多数の人間のDNAを特徴量に、特定の疾患の発症をターゲットにした機械学習は今まで計算リソースの制約からその発展には大きなチャレンジがありましたが、異次元の計算能力を持ったCerebrasのチップにはその課題解決に期待が持たれています。

 

オガワミキオ

DataRobot金融担当データサイエンティスト。DataRobot歴3年。趣味はサウナ・キャンプ(クライミングは引退)。

UBER自動運転が横断歩道上の人しか認識できず

「米ウーバー・テクノロジーズの自動運転車が昨年の試験運転中に歩行者をはねて死亡させた問題で、この車両には交通規則を無視して道路を横断する人を認識して反応するプログラムが組まれていなかったことが分かった。米運輸安全委員会(NTSB)が5日に公表した文書で明らかになった。」

AIがブラックボックスでは使えないというのは共通認識ですが、仮にどのように判断しているかということがわかってもその判定ロジックにリスクがないかを見逃しては問題になってしまいます。このケースでは、実験場では普通だった「横断歩道を渡る人」というのを「人」として高い精度で認識していましたが、道路交通法違反をしている人、すなわち「横断歩道外から無理やり渡っている人」は認識しづらいAIになっていました。AIの非ブラックボックス化、説明できるAIは昨今のトレンドとして研究も進んできていますが、その説明を元に正しく人が解釈して、リスクを判断することが重要になっています。

今後のデータサイエンティストの役割はどう変わるのかという質問を多く受けますが、まさにこのようなモデルの真なる性質をしっかりと把握して、手元のデータの中だけでなく、実世界の事象も想像しながら判断していくことも重要な役割となっています。モデルの精度以外の質についてもしっかりと見ていくことがいかに重要か改めて気づかされるニュースでした。

 

中野高文

自己紹介:DataRobot小売担当データサイエンティスト。DataRobot歴2年。趣味は旅行。

米グーグル、「量子超越性」達成と発表 スパコン超える

Quantum Supremacy Using a Programmable Superconducting Processor

2019年もGoogleはビックリな結果を残してくれました。GoogleのSycamoreと呼ばれる量子コンピューターが最速のスーパーコンピューターでも1万年かかる問題をたった200秒で行える事を実験で実証しました。これは量子超越性(古典コンピューターが解けない問題を量子コンピューターが解ける)が実験で実証された初めての事例です。

量子コンピューティングを活用した、AIの研究も進んでいます。量子コンピューターを使う事でSVMやPCAなどの計算が飛躍的にスピードアップする事が明らかになり、量子ニューラルネットワークに対する研究も活発になっています。

ただ量子コンピューターを活用したAIが現れるのはもう少し時間がかかりそうです。今回の実験は量子状態のシミュレーションを古典コンピューターにやらせると言う少し特殊な状況での優位性を証明しただけです。AIなどの一般的なタスクを実行できる量子コンピューターは非常に大規模になる必要があり、それだけのスケールアップをするにはエンジニアリングの進歩を待つ事になりそうです。

 

山本祐也

自己紹介:DataRobot製造担当データサイエンティスト。DataRobot歴2年。趣味はKaggle, Kaggle Profile: https://www.kaggle.com/nejumi

グーグルAI道場「カグル」の正体 世界に通じるAI人材(上)

AI人材「カグラー」大活躍 DeNA・PFN・日立 世界に通じるAI人材(下)

2019年は日本のKaggleコミュニティにとって非常に大きな飛躍になった年だったと感じています。国内でも多くの企業でKaggler達の実務における活躍が大きな話題になっていますし、slack channel kaggler-jaには12月時点で7500人が集まっており、日本人Master+Grandmasterも12月の時点でついに100人を突破したとの推計も出ています。これは世界全体での昇格率を大きくoutperformしており、国内Kaggleコミュニティの力強さを表していると言えるでしょう。さらには10月には圧倒的名著「Kaggleで勝つデータ分析の技術」が発売され、12月に日本初のKaggle公式イベントKaggle Days Tokyoも開催されるなどKaggleの盛り上がりはどこまでもとどまることがありません。2020年には一体どうなってしまうのか?目が離せませんね!それでは皆さん、年末年始もHappy modeling!

 

坂本康昭

自己紹介:DataRobot保険担当データサイエンティスト。DataRobot歴2年。趣味は親子レク。

How to Build Artificial Intelligence We Can Trust by Gary Marcus and Ernest Davis

2019年もAI技術が発展しましたね。採用の自動化、画像認識の自動化などニュースになりました。自動運転も話題になりましたが、みなさんは自動運転、安心して任せられますか?わたしはまだこわいです。Deep Learningなど今の機械学習はたくさんの教師データから学習して精度の高い予測ができるようになりますが、まだヒトのようにOne Shot Learningや、いくつかの例から素早く学ぶことができません。ヒトは常識やドメイン知識といったPrior Knowledgeを使用して、この問題は過去経験したあの問題と同じように解ける、と気付くことができ、よってOne Shotで学習することが可能です。この記事では、AIがPrior Knowledgeをもとにヒトのように判断できるようになるまでは、AIだけによる自動判断は安心して任せられないよね、という内容です。日本語バージョンが見つからず、英語でごめんなさい。実はこのトピックはわたしが認知科学を勉強していた頃のテーマで、著者の一人も認知科学者です。AIで、ヒトだけではできないことができる世界になりましたが、2020年も引き続きわたしたちヒトがきちんと考えてAIを使っていきましょう。

伊地知晋平

自己紹介:DataRobotヘルスケア分野担当データサイエンティスト。DataRobot歴1.5年。趣味はサックス演奏。

深層学習を活用した脳MRI分野のプログラム医療機器として国内初の薬事承認を取得し、医用画像解析ソフトウェア EIRL aneurysm (エイル アニュリズム)を発売

今年の夏まで約1年間弊社オフィスは「大手町ビル」内に間借りしていたのですが、技術系メンバーのデスクがあったオフィスのお隣がエルピクセル株式会社でした。私が前職時代一緒に仕事をしたことのあるメンバーも何人か働いていてビル内でよくご挨拶していたのですが、同社は今年大きなイノベーションを成し遂げました。ついに彼らの開発した「深層学習を活用した脳MRI画像から脳動脈瘤を検出するAI」がPMDAの審査をパスし管理医療機器として薬事承認を受けたのです。これは、そのAIが出力する結果を参考にして医療従事者が診療行為を行っても良い、とお墨付きが与えられ、日本国内でも「AIが患者さんを助けるのに有効である(臨床観点から効果・効能がある)」と認められたことを意味します。

日本は欧米などと比べて医療用画像診断装置(CTやMRIなど)の設置数が多いにも関わらず読影を担う放射線科医の数が圧倒的に不足しており、その結果、例えば脳神経外科領域では画像診断の専門家ではない脳神経外科医が自ら大量のMRI画像を読影している施設もあり、疾患の見逃しリスクや医師の負担増大が指摘されています。これらの差し迫った課題を解決するため、AIの活用による医療用画像診断プロセスの質標準化・効率化はエルピクセル社のような先駆者のリードにより今後ますます拡大・加速するものと思われます。

 

メンバー募集

DataRobotでは民主化をさらに加速していくためのメンバーを募集しています。データサイエンティスト、マーケティングから営業まで多くのポジションで募集していますので、興味を持たれた方はご連絡ください。