AI開発とデータ不足:日本企業の戦い

AI、データ不足6割」という記事が日本経済新聞に出ていた。製品やサービスの開発、事業開拓などにAIを活用しようとしても、必要なデータが不足していたり、データ形式が不ぞろいで使えなかったりという問題に日本企業が遭遇しているという内容だった。

先日の情報通信政策フォーラム(ICPF)で医療分野でのAI活用について議論した。この分野では、学習用データを集めて解析アルゴリズムを開発し、精度を高めたアルゴリズムでビジネスを展開する。Google系の23andMeは、FDAに中止されるまで遺伝子検査サービスを格安で提供し、赤字でも大量のデータを収集した。一方で、23andMeが保有する解析アルゴリズムの特許数は非常に少ない。この例のように、学習用データを押さえることは非常に重要である。それが日本企業にはできないというのが日経の記事であり、事態は深刻である。

学習用データを獲得しようと努力している日本企業もある。予防医療へのAI活用に倉敷中央病院と共に取り組むと昨年発表し、AI技術を活用した保健・医療・介護における重症化・重度化の防止に向けた共同研究を千葉大学予防医学センターと開始すると今年発表したNECがその一例である。

NECの最先端AI技術群「NEC the WISE」(コーポレートサイトより:編集部)

23andMeのように自ら学習用データを集める以外に、医療機関・研究機関から大量の学習用データを取得する方法がある。NECはこの第二の方法を取っているわけだ。

健康・医療・介護分野の学習用データには要配慮個人情報が含まれるので、個人情報保護との両立が求められる。記事にある「携帯電話から得られる人の分布」も携帯電話番号付きなら個人情報保護の対象になる。

学習用データをどう獲得するか、診療報酬制度や個人情報保護などの制度問題にどう対応するか、IT企業が克服すべき課題は解析アルゴリズムの開発以外にも多くある。

ICPFでは10月10日にこの分野の開発状況についてNECに話を聞くことにした。どうぞ、ご参加ください。