LAC WATCH

セキュリティとITの最新情報

RSS

株式会社ラック

メールマガジン

サイバーセキュリティや
ラックに関する情報をお届けします。

ラックピープル | 

ラックの生成AIの最先端事例がまるっと分かる「LAC AI Day」を開催!その1

ラックは2023年6月、全社員が生成AIを活用して業務の効率化を実現するための整備を行いました。この取り組みに至る2年ほど前、有志の技術者がAIについての調査などを進め、その成果発表の場としたものが、「LAC AI Day」の始まりでした。

4回目となるLAC AI Day 2023は、ラック社内向けのイベントから、少数のお客様も招待した半公開イベントとして開催されました。

この記事では、本イベントでどのような内容が語られたのかを全3回のダイジェストでお伝えします。

オープニング:ラックにおける、生成AI活用・取り組み状況

まず始めに、最高技術責任者(CTO)である倉持が、ラックの生成AI活用に関する取り組みの現状について説明しました。

AIの活用については、様々な事業で取り組みを行ってきましたが、生成AIについてはChatGPTの発表から利活用の研究をはじめ、2023年6月に組織横断の生成AI利用の支援チームである、CoE(Center of Excellence)を立ち上げ本格的に取り組みを開始しています。

最高技術責任者(CTO)倉持

取り組みの一例として、社員の生成AIの活用を促進するために、有料版のChatGPTの費用を会社が負担しています。また、Microsoft TeamsにChatGPTをベースとしたアプリケーション「ChottoChat(ちょっとチャット)」を開発し、社員へ提供しています。

さらに、各事業部の持つ膨大なデータを分析するシステムの基盤となるソフトウェアを自社開発し、社内でオープンソースとして提供するなど、生成AIの業務利用を進めています。生成AIの利用に向けた手順書やガイドラインの整理、一般社員向け勉強会、プロンプト(生成AIに渡す質問情報)のコンテスト、開発者向けの勉強会など、社員の生成AIの理解を進める取り組みも行われています。

その結果、42.6%の社員が何らかの手段で生成AIを日常的に利用するようになりました。一方で、試用のレベルでとどまっている社員に対してはハンズオントレーニングや先行しているユーザーの利用方法を紹介するなど、利用の促進に取り組んでいます。

倉持は、経済学者であり経済評論家の野口 悠紀雄氏の言葉から、「AIに職が奪われるのではなく、実際にはAIを使える人間に職が奪われる」を引用し、社員のだれも置いてきぼりにならないよう取り組むと語りました。

講演1:ビジネス成果につながるAI/MLの"リアル"な活用方法とは?

続いて、日本テラデータ株式会社の森 浩太氏が登壇し、データウェアハウスであるTeradata Vantageの分析機能をAI連携する活用方法を紹介しました。

実はラックでは、SOC(セキュリティオペレーションセンター)の監視システムの一部にTeradataを採用しています。今回の講演はこのご縁でTeradata社に依頼し実現したものです。

日本テラデータ株式会社 森 浩太氏

Teradata社でデータサイエンティストとして活躍する森氏は、研究者時代からデータに魅入られ、データを集め管理・整理することを好み、一見すると地味ですがとても重要な作業に魅力を感じていたのだそうです。そんな森氏は、データ分析のためにTeradataを活用する「In-Databaseアナリティクス」をすすめています。その理由は以下のような内容であると説明しました。

  • データベース内で分析することにより、システム間で大量なデータ移動がない
  • サンプリングではなく全量データの分析ができる
  • データを持ち出さないため安全性が高い
  • 運用の容易さ
  • スケーラブルかつ高パフォーマンス

また、Bring-Your-Own-Model(BYOM)機能を用いて、Teradata外で学習したAIモデルをインポートして利用することで、開発ツールを選択する自由度を持ち合わせながら、スケーラブルな展開を可能にするとしています。

生成AIとの連携については、データウェアハウスらしくAI学習用のデータをTeradata Vantageに取り込み、分析に活用するメリットとして次のポイントを説明しました。

  • 高速・効率的なデータ処理により、常に最新の情報を提供
  • インデックス・分割機能により、指定されたデータを高速に検索
  • データベース上に最適化されたベクトル演算により、類似項目を高速に抽出

このように、Teradata Vantageの分析機能を分かりやすく説明されていました。Teradataのパワフルな機能と、ラックのサイバーセキュリティ領域に関するドメイン知識を組み合わせ、新しいサービスの開発に取り組んでいきましょうと語りました。

講演2:競馬予想AI作ってみた!~改良編~with ChatGPT

次の登壇者はSI統括部 AIプロダクト開発グループの小林 達也です。小林は、ラック入社8年目のエンジニアで、競馬が好き過ぎて一口馬主にもなってしまったようです。

競馬は、様々な不確定な条件の組み合わせで勝負が決まるため、勝敗予想が非常に難しい点が逆に魅力と語っています。この難しい競馬予想を、AIに予想させたら良いのではないか?と思い立ち、自身のAIモデルを作ることとしたようです。

SI統括部 AIプロダクト開発グループ 小林 達也

実は、今回の発表は昨年のAI Dayの続きとなっており、昨年発表したWebスクレイピング(レース結果データの収集)したWebサイトは、重賞以上のレース結果しか手に入らず、分析のためのデータが不足していたようです。

また、1頭ごとの着順予想であり、他の競走馬との関係性を分析していなかったことや、海外馬が入ると予測が狂うことなどを学びとして挙げていました。昨年のAIモデルでの競馬予想の結果として、「当たったものもあったけれど、外れたものも多かった」とのことで、今年はモデルの見直しをしているようです。

見直した内容は、とにかくレースの情報が肝なので、収集元を重賞以外も扱っているサイトに変更し、特徴量の見直しを行いました。モデルを競馬場ごとに作り、予測ターゲットを着順ではなくレースタイムにして、カテゴリ値を扱いやすいCatboostを使用することとしたうえで、データ作成に生成AIを活用するようにしたそうです。

レース予想までの大まかな流れとしては、レースの情報をWebサイトから入手し、そのデータをAIの分析に使えるように加工してから学習パラメータを調整しました。いよいよ学習モデルを使った予想となりますが、一番大変なデータを取り出す加工の作業を、生成AIに手伝ってもらうことにしました。

ChatGPTに次のようなプロンプト(生成AIに話しかける入力テキスト)を入力し、取得したHTMLファイルから必要なデータを取得するpythonのコードを生成させました。

「競馬の出馬表のHTMLからデータを取得するpythonプログラムを作るのを手伝ってください。データはtarget.htmlです。ここには抜粋した1頭分のデータが入っています。まずはここから馬名、騎手、枠番を取得しましょう。手掛かりとなる情報を提示します。馬名は"⚪⚪⚪︎"、騎手は"△△"、枠番は"1"です。」

「ありがとうございます。今回は一例挙げましたが、馬名、騎手、枠番はその都度変わるので汎用的なコードを作成してください。そして最終的なコードを教えてください。」

こうしたプロンプトのやり取りを繰り返した結果、HTMLファイルからデータを取得するコードが手に入ったそうです。AIモデルの作成に向け、使用するデータも生成AIで作成するというユニークな取り組みでした。

講演3:ラック独自のAIチャットツール「ChottoChat」の全貌

ラックは、2023年6月に生成AIを全社員が活用できるプラットフォームを提供したことを発表していますが、その中核になったのがサイバー・グリッド・ジャパンの庄司 勝哉が開発した「ChottoChat」です。

サイバー・グリッド・ジャパン 庄司 勝哉

ChottoChatは、Azure OpenAI Serviceの生成AIモデルを使って開発されていることから、社内の機密情報等がパブリックなChatGPTに学習されることなく安全に利用が可能です。また、ChottoChatは社内のコミュニケーションインフラである、Microsoft Teamsに組み込まれ、全社員が容易に生成AIの機能を活用できます。

生成AIの活用で重要なことの一つに、プロンプトの入力のコツを知らないと期待した結果が手に入らないというものがあります。「ChottoChat」では、プロンプトのテンプレートを事前に用意し、プラグインと呼ばれる拡張機能から社員に提示しています。

例えばデータ分析に有効なコード実行機能は、IT企業らしく社員の業務効率化に寄与しそうですし、生成AIによる画像作成機能、そしてセキュリティサービスを提供する企業らしく情報セキュリティ脅威情報の検索機能も提供されています。

マイクロソフト社からはCopilot for Microsoft 365も発表されましたが、庄司は本家に負けない機能強化に取り組むとしていました。

ChottoChatで脅威情報検索機能を使用している例

最後に

さて、LAC AI Day 2023のご紹介、その1はこの辺りでおしまいですが、まだまだ気になる発表は続々と控えています。

次回は、GitHub Copilotを使ってやってみたこと、先端技術ラボの取り組み、社内規定を回答してくれるAIを評価した方法、LLMのパフォーマンスを最大限に引き出すために知っておくことについての講演をお届けします。

この記事は役に立ちましたか?

はい いいえ

関連記事

LAC WATCH

関連記事をご紹介します

  • 社内向けAI開発の新人研修で工夫したポイント

  • 生成AIはプログラミングやシステム開発をどう変えていくのか?ラックの社内イベントをレポート

  • ラックでの生成AI活用の最前線~組織横断の推進チームが目指す企業での活用とは