AIとビッグデータの知財論、大詰め。

知財本部 新情報財委員会@霞が関。委員長を務めます。
AIとビッグデータの知財論、大詰めです。
内閣官房、内閣府、総務省、文科省、文化庁、経産省、特許庁が出席。
産総研、NICT、国会図書館も参加。オールキャスト。

テーマ1:AI学習用のオープンデータ、オープンサイエンス。
公的資金での研究成果のデータ利活用を推進することと、官民データ活用推進基本法を稼働させることを方針として確認しました。

産総研は研究によって得た地理空間、物質・材料、人体、情報系のデータを提供する「データバンク構想」をプレゼン。
NICT(情報通信研究機構)は、ウェブ由来の学習データを他の研究機関と共有できないこと、収集した100億ページのデータを大学・企業に提供できないことの問題を提起。

NICT鳥澤さんは、創作性のある表現をする対話ロボットが出典の引用をどう扱うか、という問題も提起。
ウェブ情報を引っ張ってきてしゃべるAIロボットはもう実用化されてますもんね。「今」の課題です。

文科省はNIIの学術情報ネットワークの整備、3省連携による理研AIPでの汎用研究について紹介。
ぼくも理研AIPの研究が社会に寄与する役割を果たしたいと考えています。がんばってください。

国立国会図書館は262万点のデジタル化資料を提供し、35万点のパブリックドメイン資料は自由に利用が可能だが、データのテキスト化が進んでいないとのこと。12万件のネット資料をAI学習用に使うには法整備(国有財産法等)が必要との見解を示しました。

これを受け、突っ込んだ議論となりました。一口にデータと言っても、私的・公的なもの、研究用のもの・汎用のもの、ウェブもの・センサーもの、いろんな種別があります。業界によってもデータのオープン度や共有度が異なります。まずこれをどう整理するか。

データの利活用を促進するための法制度、インセンティブ、データマネジメント、そして海外との関係整理を進める必要があります。国がどこまで出ていくのか、ヘタに出ることで止まることはないか、などの見極めも必要です。

もう一つのテーマ:AI生成物の問題。特許庁ではAIを使った「発明」の保護策、ビジネスモデル、3Dプリンティング・データによる模倣品対策などを議論しています。文化庁では著作権に関する柔軟な權利制限の議論が大詰めを迎えています。

AIが生成するアウトプットの權利をどう扱うか。世界でもまだこの問題に本格的に取り組んでいる国はなさそうです。日本での議論も、制度としてどこまで関与するのか、進んだり戻ったりしています。
しかし、いま出せるアウトプットと、引き続き考えるテーマとに線を引いて、そろそろ結論を出さねば。

いつもより1時間弱、会議を延長しましたが、ここで力尽き、まとめの論議に進むことができませんでした。

ごめんなさい。また次回。


編集部より:このブログは「中村伊知哉氏のブログ」2017年4月27日の記事を転載させていただきました。オリジナル原稿を読みたい方はIchiya Nakamuraをご覧ください。