メールマガジン

サイバーセキュリティや
ラックに関する情報をお届けします。

ラックピープル　|　
2020年11月 6日

CDLEハッカソン2020に入賞しました！～提出期限ギリギリまで考えた、未来の雲の変化を予測するAIとは？～

庄司勝哉

メルマガ登録する

メルマガ登録する

サイバー・グリッド・ジャパン次世代セキュリティ技術研究所の庄司です。

新しい技術が日々生まれてくる現代、技術者は常に自身の技術を磨き続ける必要があります。インフラ技術者だった私がデータサイエンティストを志してサイバー・グリッド・ジャパンに異動してから1年が過ぎました。この1年、私は日々の業務の中でデータ分析の経験を積み、AIエンジニアを認定するE資格の勉強などを通じて、データ分析の技術を磨いてきました。

しかし、データサイエンティストとしてはまだまだひよっこ。さらなる高みを目指すために、AIの精度を競うAIコンペティションに参加したいと考えていました。そんな私が最近、CDLEハッカソン2020というイベントでAIコンペティションデビューし、なんと8位入賞しました！

* CDLEハッカソン2020 - 一般社団法人日本ディープラーニング協会【公式】

資格試験合格者のみが参加できるCDLEハッカソン2020
未来の雲の変化をAIで予測する
本当に時間との戦いだった
さいごに

資格試験合格者のみが参加できるCDLEハッカソン2020

CDLEハッカソンは、「ディープラーニング人材のさらなる技術向上及び活躍に貢献すること」を目的に、日本ディープラーニング協会（JDLA：Japan Deep Learning Association）が開催しているハッカソンイベントです。本イベントは昨年度、日本オープンイノベーション大賞で「日本経済団体連合会会長賞」を受賞しており、高い関心が寄せられています。

昨年度は、CDLEメンバー（G検定/E資格合格者）の中でもスポンサー企業に選ばれた30名のみが参加できましたが、今年度はCDLEメンバーなら誰でも参加できるようになり、参加規模が大きくなりました。私は今年2月にE資格に合格していたため、参加資格がありました。

未来の雲の変化をAIで予測する

今年度のCDLEハッカソンは"アイデア部門"と"予測性能部門"の2部門で開催されました。私が参加した予測性能部門のテーマは「画像データに基づく気象予測」です。参加者は、過去4日分の気象衛星ひまわり8号により撮影された雲画像データと気象データ（気圧、温度、湿度、風など）を基に、その先1日分（1時間毎24枚）の雲画像を生成するAIを作成し、そのAIが生成した画像の精度を競います。

未来の雲画像を予測するという今回のテーマは、気象業界にとって革新的なチャレンジの1つです。近年、AIによる気象データの分析はエネルギーの需要予測や小売店の来客予測、農業における収穫量や収穫日の予測など、様々な分野で成果を挙げてきています。当然ながら、AIを用いた気象予測の取り組みも行われています。

現在の気象予測は、流体力学や熱力学などの物理方程式からスーパーコンピュータを用いて計算していますが、膨大な気象データをAIで分析すれば、スーパーコンピュータほどのコンピュータリソースを必要とせずに予測できたり、予測精度を向上させたりといったことが期待できます。

さて、「過去の雲画像と気象データから未来の雲画像を予測する」と言うのは簡単ですが、一体どのように実現すればいいのでしょうか。

上図は、私が雲画像を生成した手法のイメージです。

①入力データを小さくしながら特徴を見つける ※見つけた特徴は特徴データと呼ぶことにします。
②特徴データを大きくしながら画像を生成する

①で入力データをだんだんと小さくしているのは、大域的な特徴を効率良く見つけるためです。そうすると特徴データが小さくなりますが、特徴データをだんだんと大きくすることで必要な画像サイズの出力データを生成できます。

特徴データには、出力データを生成するためにAIが必要とした特徴の情報が詰まっています。例えば、雲がどこにあるか、台風はどこか、雲はどっちに流れているか、X時間後にここで雲ができる、などが入っているものと思います（AIが自動で見つけた特徴であるため、作成者の私も想像するしかありません）。衛星画像は季節や時間（厳密には陸地や海面の温度）によって濃淡が変わるため、季節はいつか、時間は何時かといった情報も入っているのではないでしょうか。

本当に時間との戦いだった

未来の雲画像を予測するというテーマに対して、上記の手法を採用することは最初から決めていました。しかし、すべてが順風満帆に進むわけがありません。入賞までの道には時間との切実な戦いがありました。

競技期間は7月23日～8月31日の40日間ありましたが、業務と私的な都合があり、私が着手し始めたのは8月21日のことです。日数にすると11日間です。本来であればAIを何度も何度も作り直して精度を上げていきますが、その時間がありません。締め切り前日までに1回成果物を提出しましたが、それは入賞圏外。締め切り当日に何とか期限に間に合うようAIの学習時間を調整してラストチャンスにかけました。結局、入賞圏内に入り込む成果物を提出したのは締め切り10分前。ギリギリまで時間と戦い、もぎとった入賞でした（成果物提出回数2回というのは、入賞チームの中で最少回数だったという......）。

その後、競技期間にはできなかった試行錯誤を行いました。詳細はラック・セキュリティごった煮ブログをご覧ください。

ラック・セキュリティごった煮ブログ
CDLEハッカソンで入賞したモデルを検証してみた

さいごに

やや不完全燃焼になってしまった部分もあった今回のイベントですが、AIの実装方法やデータ前処理・モデルの設計・検証のそれぞれの勘所、最新のAI技術など、多くのことを学べました。

コンペティションの企画・運営、データを提供してくださった、日本ディープラーニング協会、SIGNATE、株式会社ウェザーニューズの皆様、本当にありがとうございました。また、短期間でコンペティションに入賞するまでのAI開発スキルを身に付けることができたのは、E資格の認定プログラムとして受講したスキルアップAI株式会社の講座の存在が大きかったと感じています。スキルアップAI株式会社にも改めて感謝申し上げます。

当社が得意分野とする情報セキュリティにおいてもAIを用いた攻撃やAIに対する攻撃が行われており、AIと関係が強くなってきています。今後は、今にもましてAI技術に精通した情報セキュリティ技術者が必要になってくるでしょう。

今回のイベントは私に自信を与えるとともに、叱咤激励もしてくれました。今後もAIコンペティションに参加しながら、さらなるAI技術向上に努めていきたいと思います。

この記事をシェアする

メールマガジン

サイバーセキュリティや
ラックに関する情報を
お届けします。

登録する

この記事は役に立ちましたか？

はいいいえ