筆者は平沢進氏の「夢みる機械」という曲を友人の紹介で知り、この記事を書く前日の真夜中に初めて鑑賞した際には、感動のためにしばらく寝られなかった。
さて、現実の機械は夢をみるのだろうか?実は見るのである。というのも、筆者が愛用する検索エンジンを運用するGoogle社が開発した”Deep Dream”という技術により、任意の画像から不思議で神秘的な「夢」のような画像を生成できるのだ。
筆者はシリコンバレー、北京、ロンドン、パリに友人を持ち、彼らが異口同音にいわく、最新のホット・テクノロジーといえば「人工知能」だという。日本人工知能学会(JSAI)会員の筆者にとっても、その発展と活用は関心事である。ここでは筆者の友人の一人である、北京大学の方の意見も参考に論じたい。
第4次産業革命の荒波
本文の主題は、第4次産業革命。以前、筆者はこの題材の掲載記事を書いたことがあり(「第四次産業革命で目指せ、技術的特異点」)。筆者の専門は外国語、特に英語、中国語、フランス語の3か国語で書かれた、ビジネスと技術特許に関する文書の翻訳である。最近の大手海外メディアは、「人工知能(AI)」を常設のトピックとして掲げている。ドイツ発祥の”Industrie 4.0”はアメリカや中国のビジネスモデルとして参考にされてきた。最近では、インターネットとAIを家電や自動車のシステムに応用した、IoTやスマート・カーといった新分野も開拓されている。
例えば筆者個人のTwitterアカウントのアバターは、ニューラルネットワーク上の人工知能が生成したアニメキャラクター風のサムネイル画像だが、これも絵師の描いたイラストと見間違えるほど精密に彩られている。携帯やパソコンには音声入力で会話しながら、情報を入力したり検索したりできる機能が充実しているし、車のナビゲーションや調理家電にルートやレシピを訊ねることも可能だ。
このように便利なAI技術が世界に普及すれば、2030年以降の日本やフランスといった国々のGDPを倍増させるのではないか、と目されている程。製造・サービス自動化の自動化は枚挙にいとまがなく、中国・杭州に2017年開店したアリババ集団の無人店オープンや、2018年には日本のメガバンク三行へのAI導入による大規模リストラも起こっており、第四次産業革命と呼ばれる荒波が世界経済を飲み込もうとしている。
AIに必要な3類型の技術:画像認識、音声認識、自然言語処理
筆者はトヨタグループで開発されている電気自動車の試走を、会社構内で見かけたことがあるが、こうしたEVの電子部品は実にスマートフォンやPCの半導体メーカーが開発している。愛知県豊田市で行われたトヨタ自動車と名古屋大学による公道上のコムス自動運転実験はスマートシティ・豊田市を象徴するイノベーションの祭典といえよう。この自動運転にAIが使われており、車線、車両、歩行者、信号、駐車場を画像認識することで安全に走行するよう開発されている。
AI製品を概観するに、必要な技術は大きく三類型に分けられる。一つは画像認識、いま一つは音声認識、最後の一つは自然言語処理である。これらの技術を用いて得られたデータに基づき、ニューラルネットワークとよばれる人間の神経回路を模したANN(Artificial Neural Networks)が、データ全体の特徴を分析し、システムを最適化したり、利用者が必要とするデータを答えとして提供することができる。
特に自然言語処理では、画像からの文字認識や音声認識を通じて取得された文字列に対し、予め大量のコーパスを学習させておいたニューラルネットワークをベースとする自動翻訳を行ったり、感情認識を行うなど、数字の処理を離れて文字ないし単語、文章、文書のあらゆる自然言語を扱うことができる。
自然言語処理については文字通り「言葉の壁」が存在し、英語をはじめとするアルファベット表記の印欧語族言語と日本語とでは、文字コードの処理から単語の分詞(分かち書き)に至るまで一連のアルゴリズムを異としている。ゆえに、アメリカの企業が英語圏向けに開発した製品を日本語対応の製品に作り直すには、一からコードを書き換えて、十には再度、異なるデータを元手に学習データを作成しなければならない。そのため、その工程に数年を要することも考えられる。
日本はAI新興国である。すでにAI先駆者の過半数をアメリカと中国が輩出している。アメリカではGoogle、Microsoft、IBM、Apple、Amazon、Facebookといった大手企業が続々AI開発に参入。続いて中国の百度(バイドゥ)、腾讯(トンシュン、またはテンセント)、阿里巴巴(アリババ)などIT企業が追随している。日本ではソフトバンクのPepperが日本語と英語での対話機能を既に実現しているが、今後とも日本語処理技術の発展と普及が望まれる。
技術革新で懸念される失業問題にどう向き合う
その一方で、技術革新に立ち遅れてしまった技術失業者とよばれる人々の増加も懸念されている。そこで人間とAIの分業と協業が必要となり、クリエイティブな仕事や経験を要する職人技や経営に人間の強みを活かしていく、次世代の仕事スタイルを確立すべきと考える。
例えば芸術家。確かに、AIがレンブラントのような名画風の画像を生成することは実証されている。しかし、それは過去の作品を学習した特徴データに対し、ニューラルネットワークが近似の画像を生成するだけのDCGANという手法を用いている。GeneratorがDiscriminatorを騙す(要するに自動生成の画像を、本物の画像だと誤認識させる)ことで、近似度が高く、本物まがいの画像を自動生成できる。
しかし、芸術家にしかない独特のアイデアや発想力を、このAIが模倣することはできない。あるいは、芸術家が内に秘めたテクニックをAIが余すところなく学習できるという保証もないのである。要するに「数字にできない世界」をAIが語ることは、至難の業であると言わざるを得ないのだ。職人技をNC(数値制御)で再現することも同様に難しいであろう。
現時点のAI導入の限界:「夢みる機械」の時代は来るか?
筆者は産業翻訳や文学翻訳を通じて、外国語で書かれた文章の論理性や文学性を追究しようと努めるが、AIに文学を習得させることは果たして可能か疑問である。あくまで統計学上の「みんなが使う表現」(専門的には熟語やイディオム、慣用句)を追い求めていたのでは、非凡にして独特な表現を生み出せないことと同じく、AIにもまた統計学上の限界があるのではないか。
なぜなら、AIは確率論と統計学の範疇をいまだに抜け出せていないからだ。ならば、前述したDeep Dreamも実は夢ではなく、「万人にとって夢の世界に見えるであろう」画像を生成しているだけではなかろうか。真の意味で発想し、そのアイデアを形にできるようなクリエイティブにあふれた「夢みる機械」が、第4次産業革命には必要でなかろうか。
技術的特異点(シンギュラリティ)と呼ばれる、科学が予測不可能な域に達する時点は今世紀中に到来すると巷ではうわさされているが、実際にコードを扱えばわかる話、AIというのは極めて稚拙なタスクにしか対応できず、かつ最適化においてのみ、その真価を発揮しうる。北京大学の友人も、機械翻訳によって翻訳の専門家を失職させる日は来ないであろうと述べていた。ゆえに、クリエイティブで経験を要する専門職や職人職、総合職へのAI導入には限度があり、また人間を駆逐できるものではない。
「夢みる機械」が世界を席巻する時代も遠からずと信じ、その前途に希望を託す。かくいう筆者も、翻訳業で失職したのなら、自然言語処理という分野でAIに携わりたい。
—