2022.12.08

ビジネス成果を生み出すデータ活用のテクニック

グローバルAIコンペティション「Kaggle」優勝者に聞く(NIKKEI Data Science Forum 2022)

2022年10月26~27日、データ価値の最大化とビジネスへの活用をテーマにしたオンラインイベント「NIKKEI Data Science Forum 2022」[1]が開催され、電通デジタル 石川隆一と村田秀樹がセッションに登壇しました。

石川、村田ともにアドバンストクリエイティブセンター(ACRC)でAIエンジニアとして業務に携わるかたわら、グローバルAIコンペティション「Kaggle(カグル)」 に参加するKaggler(カグラー)としても活躍しています。

このセッションでは、Kaggleへの参加と業務を両立する2人の取り組みや考え方を通じて、企業がAI人材、DX人材を採用・登用していくためのヒントを探りました。モデレーターは「日経クロストレンド」発行人の杉本昭彦氏です。セッション内容を採録して紹介します。

グローバルAIコンペティションKaggleとは? 

杉本 最初に私から、簡単にKaggleの説明をしておきます。Kaggleとは、世界最大の機械学習コンペティションのプラットフォームです。

ホスト(企業、大学、各国の政府機関、研究所など)が、課題とデータ、賞金を提供してコンペティション(以下コンペ)を開催。統計、データサイエンス、AIの専門家たちがチームまたは個人でその課題解決に最適なモデルを作り、その精度を競い合います。

Kaggleでは、コンペの順位に応じて金銀銅のメダルが授与され、獲得メダルの合計数により、Novice、Contributor、Expert、Master、Grandmasterの称号が与えられます。

石川さんはMaster、村田さんは最高位のGrandmasterの称号をお持ちです[2]。お二人は、いつ頃からKaggleに参加するようになったのでしょうか?

日経BP 杉本昭彦氏

石川 私は2018年頃から独学でマシンラーニング(機械学習)の勉強を始めて、ひととおり基礎的なことができるようになってから、Kaggleに挑戦するようになりました。これまでに30個ぐらいのコンペに参加してきました。

村田 私もほとんど同じぐらいです。2018年からKaggleを始めて、これまでに参加したコンペも30個ほどです。

杉本 Kaggleで上位に入賞するには何が大事なのでしょうか?

村田 上位0.1%に入るには、最終的には時間との戦いになります。コンペの開催期間は3カ月。期間中は精度を0.01上げるために、毎日何時間も研究とトライアンドエラーを繰り返します。

コンペによって取り扱うデータの種類や量は様々です。例えば「500GB 程度の大量の画像データを使って 予測AIを作り精度を競う」というコンペもあれば、「1GB 程度の比較的軽いエクセルファイルのようなテーブルデータから予測AIを作り精度を競う」コンペもあります。ここでの学びや経験が、業務に活きる機会は多いです。

杉本 Kaggleにはどのような地域からの参加が多いのでしょうか?

村田 アメリカ、ヨーロッパはもちろん、最近はアジア、特に中国やインドからの参加者は本当に多いですね。国によっては、Master以上だと就職に有利な国もあるそうで、メダル争いはかなり厳しくなっています。


Kaggle参加は自身の業務、所属企業の役に立つのか?

杉本 これまでお二人が電通デジタルで取り組んできた業務について教えてください。

村田 現在取り組んでいるのは、バナー/リスティング広告効果予測ツール「CXAI(シーエックスエーアイ)」の開発です。バナー画像やリスティング広告の配信前に効果を予測することで、A/Bテストに頼ることなく、出稿枠を有効に使うことを目的としたツールです[3]。プロトタイプですが、現在社内で実際に使っています。将来的には、バナー広告までも生成して、それをさらに効果予測するところまでを目指しています。効率的な配信や省力化が可能になり、かなり夢があると感じています。

電通デジタル 村田秀樹

石川 私は1つ目が、警察庁の協力を得て取り組んだ「TEHAI」プロジェクトです[4]。AIによって、指名手配犯の顔写真の解像度を上げたり、白黒写真をカラー化したり、数十年後の顔を予測した画像を作成しました。

2つ目の「"名画になった"海展」は、有名な絵画の巨匠のタッチで2050年の海を描くとどうなるか、という展示イベントです[5]。写真をもとに、AIでさまざまな画家のタッチに変換させて、ゴッホや葛飾北斎、ラッセンが2050年の海を描いたらどうなるか、を再現しています。反響の大きかった企画で、こうしたSDGsにちなんだ取り組みをAI を使って表現していくのも、今後大切なことだと思っています。

「ADVANCED CREATIVE MAKER」は、先ほど村田さんが紹介した「CXAI」に繋がるもので、バナー広告を自動生成するツールです[6]。元々は、クリエイターの美的センスや審美眼を AI でモデル化できないかという研究を兼ねて取り組んだもので、クリエイターに3000 枚ぐらいのバナー画像を好き/嫌いで分けてもらって、それを正解ラベルにして AI に学習させています。経験の浅い人や、デザインが分からない人がバナーを判断する基準として活用することを目的としています。すでに社内では活用しています。

電通デジタル 石川隆一

杉本 Kaggleへの挑戦という経験は、これらの取り組みにどのくらい影響しているのでしょうか?

石川 かなり大きな影響があると思います。Kaggleに何度も参加することで、トライアンドエラーを繰り返してモデルの精度を上げるという行為が習慣づきます。それが実務でもものすごく役立っていると実感しています。

村田 Kaggleに挑戦することで、トライアンドエラーの速度が上がるので、実務においてもかなり実装が早くなった実感があります。「CXAI」は、Kaggleで学んだ手法を取り入れて作っていますが、狙いどおり大幅に予測精度が上がりました。プロダクトの精度向上の面でも、大きな影響があると思います。

杉本 Kaggleで求められるトライアンドエラーとは、どのような感じなんでしょうか?

村田 Kaggleの場合、いろいろな手法を試してたくさん失敗したとしても、有効な手法を1つでも見つけることができればスコアが改善します。つまり、たくさん失敗しながらうまくいくものを見つけるという姿勢で取り組むことがとても重要です。

杉本 トライアンドエラーを繰り返すことができる環境であったり、最新の課題に触れられたりするという意味で、Kaggleは最適な鍛錬の場なのですね。

村田 はい。大変ではあるんですけど、楽しく鍛えられています。

石川 私は、社内の別の部署の人から相談される案件に関して、ゴールまでの見極めがつくのが早くなりました。デジタルの会社とはいえ、社員全員がAI に詳しいわけではないので、相談内容が漠然としていることもあります。Kaggleでさまざまな種類のデータやアルゴリズムを扱ってきたことで、事前に用意されたデータ量から判断できることが非常に増えたと思います。

杉本 Kaggleのコンペには、どのくらいの時間を費やしているのでしょうか?

石川 コンペによってまちまちです。全力で取り組むコンペの場合、1日8時間で3カ月間取り組むので、単純計算で720 時間ぐらいは費やしているかもしれません。今年5月に参加して優勝したコンペ[7]では、その日の業務が終わった後、プライベートで毎日のように夜中まで 2人でコードリーディングして、仮眠をとって朝起きてまたやり取りして、を繰り返していました。

杉本 そこまでやりこむと仕事に影響も出るのでは?とも思いますが、電通デジタルではKaggleへの取り組みは、どのような扱いなのでしょうか?

石川 AI技術の進歩は本当に早いので、1年でも勉強を怠るとついていけなくなるという危機感が強くあって、2018年の入社時、会社に在籍したままKaggleに参加できる制度を作ってもらいました。現在は、エンジニアがKaggleに挑戦することは会社にとっても利益があるということで、配慮してもらえる仕組みになっています。ただ、あくまでも業務が最優先なのは当然です。私自身もここ3カ月ほどはKaggleに参加できていません。

杉本 電通デジタルがAIエンジニアの採用や、社員のスキルアップのために取り組んでいることはありますか?

石川 今年は、電通、電通デジタル、電通国際情報サービス(ISID)の3社合同で人工知能学会(JSAI2022)に出展して論文を発表したり、自社のソリューションを出展したりしました。また、電通グループ横断で、週1回~月1回の頻度で論文の輪読会を開催し、AIに詳しい人や興味がある人が集まってディスカッションしています。最新情報に留まらない幅広い知見を得ることが、クリエイティブにとって非常に大事なことだと思っているので、こういう機会を作ってもらえるのはとてもありがたいです。

杉本 ビジネスの場にはAIに詳しくない人もいます。そういった人とコミュニケーションをとってビジネスを進めていくために心がけていることがあれば教えてください。

石川 ディープラーニング(深層学習)の領域は、突き詰めていくほどに人間がハンドリングしきれないことがたくさん出てきます。例えば、近年AI導入が期待されている領域に医療がありますが、AIが診断して誤診が発生したら誰が責任をとるのか。AIが車の自動運転をして起こした事故のリスクをどう捉えるか。AI導入・活用については、メリットとリスクを提示しながら、コミュニケーションしています。

とはいえ、何事も新しいことへのチャレンジにトライアンドエラーは欠かせません。リスクケアを踏まえつつ、関係者全員で話し合いを積み重ねながら進めていくことが大事だと思います。

村田 私も、AI の使い方に関する共通理解に関しては、かなり気をつかっています。例えば、「CXAI」は、バナーの良し悪しを「80%の確率で良い」「20%の確率で悪い」のように確率で提示しますが、人によってはそれを「AIが”いい”と言っている」「AIに”ダメ”だと言われた」と単純化して絶対視してしまう。そうではなく、傾向を確率で提示しているだけということを理解して使ってもらえるように、説明はかなり丁寧に意識して行っています。


2人のキャリアからデータ人材育成のあり方を考える

杉本 お二人とも、電通デジタルには中途入社です。それまでどのようなキャリアを経て今に至っているのでしょうか?

村田 私は大学で数学を専攻し、卒業後は国家公務員として税務署や財務省で働いていました。10年ほど働いたところでAI に興味を持って独学で勉強を始めて、その後2年ほど専業KagglerとしてKaggle挑戦を続けていましたが、縁があって2020年に電通デジタルに入社して今に至ります。入社後もKaggleに挑戦できる仕組みが整っていたのは、大きな決め手でしたね。

杉本 AIをおもしろいと思ったきっかけは何だったのでしょうか。

村田 競馬の予想や電力の消費量など、未来の事柄の予想ができるところですね。それに、今後伸びていくことが確実な分野であるにもかかわらず、当時はまだAIを勉強している人自体が少なかったので、そこもなんだかおもしろいと思いました。

石川 私は将棋が大好きなんですが、将棋のAIがプロ棋士に勝ったニュース(2013年第2回将棋電王戦)が興味をいだいたきっかけでした。世間的にも大ニュースになり、AIは本当に世の中を変えられるのではないかと思い、勤めていたレコード会社を辞めて AI の勉強を独学で始めました。中学数学からやり直しだったので、最初はすごくハードでしたね。それでも、AIへの期待感というか、ワクワク感の方が大きかったです。

杉本 そんなお二人から見て、企業のDX人材、データサイエンス人材を増やすためには、どうしたらいいと思いますか?

村田 私や石川さんのように、Kaggleのようなコンペで実際にデータをたくさん触ることで興味を持てる人というのが一定数いるはずなので、そういった場に参加しやすいようなバックアップ体制を作るのがまずひとつです。

また、自分の生活データを分析するのはかなりおもしろいので、それを促してみるのは有効かもしれません。分析するコードがあればGoogle Colaboratory(Colab)などのサービスを使い、クリックするだけでデータ分析を体験することができます。まずは気軽に触れられる場をアレンジして、データサイエンスへの興味を持ってもらえるようにすると良いかと思います。

石川 素養や素質を見極めるのも大切です。エンジニアであれば、やはり数学が好きで、データを長時間見ていても苦にならない人を見つけ出すことが大事で、その上で育成する取り組みを行っていくのがいいのかなとは思います。


データサイエンス人材を採用・育成するために大切なポイント

杉本 今回お二人の話を伺ってきて、企業がAI人材、DX人材、データサイエンス人材を採用・育成する上で、学びのポイントが3つありました。

1 つ目は、こうした人材の採用は、大学で専門に学んだ人だけが正規ルートではないということです。数学の知識、データ分析のスキル、周囲の人間とコミュニケーションする能力、これらの必要な能力を備えていれば、さまざまなキャリアを持つ人に可能性があるということがわかりました。

2つ目は、Kaggleの経験値はビジネスに直結するということです。豊富な参加経験により実務に役立つ能力やスキルが向上していくのですから、企業としてKaggleへの参加を拒む理由はありません。

3つ目は、チームワークの重要性です。Kaggleはチーム戦で行いますが、お二人の話を聞いて、その経験は社内実務にも確実に還元されていると感じました。

AI人材、DX人材、データサイエンス人材を必要とする企業の方々は、ぜひ参考にしていただければと思います。


脚注

PROFILE

プロフィール

この記事・サービスに関するお問い合わせはこちらから

EVENT & SEMINAR

イベント&セミナー

ご案内

FOR MORE INFO

資料ダウンロード

電通デジタルが提供するホワイトペーパーや調査資料をダウンロードいただけます

メールマガジン登録

電通デジタルのセミナー開催情報、最新ソリューション情報をお届けします

お問い合わせ

電通デジタルへの各種お問い合わせはこちらからどうぞ