ここから本文です

「わたしは真悟」の「モンロー」を、2018年のテクノロジーで解説しよう

2/14(水) 7:00配信

@IT

 「わたしは真悟」は、小学館ビッグコミックスピリッツ(小学館)1982年8号から1986年27号までに掲載されていた長編SF漫画だ。工業用の生産ロボットが意思を持ち、さまざまな事件を繰り広げるSFホラー。作者は楳図かずお先生。なお、2018年1月、フランスで開催された「第45回アングレーム国際漫画祭」で「遺産賞」を受賞した(関連リンク「楳図さんに「遺産賞」 仏アングレーム漫画祭」:日本経済新聞 2018年1月31日)。

筆者が1986年に研究していた微細作業ロボットハンド(筆者撮影)

 物語の中心は、ロボットの「真悟」だ。当時AIという言葉は一般的ではなく、ロボットと人工知能のようなIT技術は一緒くたに考えられていたはずなので、この時代に「ロボット」という場合は、「その知能的な能力」を含んでいることに注意されたい。

 また、本作品は当時の産業用ロボット発展時代を色濃く反映しており、楳図かずお先生がとても熱心に取材して、その成果を作品に込めていることを感じ、頭が下がる。

 連載当時、筆者は某工業高専の機械工学科で学び、自動制御技術を専攻していた。しかも専攻は「ロボットハンド」だ。テレビCMで「片手で卵を割るロボットハンド」を見て、「あんなロボットハンドを作ってみたい」と思っていた。実際には「ピンセットでつまんだ物を回す微細制御ロボットをX-Yテーブルを用いて作る」という卒業研究をしていたのだが、マシン語の四則演算のみでロボットアームを円運動させるのに苦労したものだ。その当時の漫画として思い返せば、この作品、よくリサーチされていると感心する。

 物語の冒頭で工場に導入された産業用ロボットは、マリリンモンローの写真が飾られ「モンロー」と名付けられる。その後意志を持ち勝手に動き始めたそのロボットは、主人公「まりん(真鈴)」と「さとる(悟)」の名前の文字を取って「真悟 (シンゴ)」と自称するようになる。

 モンローは、2000年3月10日発売の小学館版「わたしは真悟」3巻、「PROGRAM(以降、P)3―Apt1 はじめとおわり」の中で「意識をもった」とある。本稿では、それ以前を「モンロー」、それ以降を「真悟」とする。

●マシンへの「恐れ」から始まる物語

 新しい技術はいつも、「人の職を奪う」といわれてきた。

 今日のAIブームでキーワードとなっている「シンギュラリティー(Singularity)」は、もともとは重力などの「特異点」を示す言葉だが、AIの世界では「AIの能力が人の能力を超える瞬間」といった意味で捉えられている。現代の社会では「AI(より広く浅く捉えればコンピュータ)の能力が、人の能力を飛び越えて凌駕(りょうが)する時代がすぐそこまで来ているのではないか」という不安をかき立てるための呪文のようだ。

 私は真悟の根底にも、産業用ロボットに対する何らかの「恐れ」が感じ取れる。産業用ロボットは「強力」で「正確」で「休まず」働き続ける。もし「意思」を持ったらどうなるのだろう……。

 しかし、さまざまなテクノロジーは既に人間の能力を大幅に超えているし、人間の社会は自身の能力を超えた科学の能力を使うことで発展し、地球に君臨していることをわれわれは忘れてはならない。

 人間は1トンもある物を持ち上げることはできないが、重機は軽々と持ち上げる。持ち上げる高さも人間なら2メートルが限界だが、機械を使えば300メートル以上もある建築物を建立できる。人間は全力で走っても時速20キロが限界だが、新幹線に乗れば平気で時速250キロで走る。ましてや人は空を飛ぶことはできないが、現代の地球では常に数十万という航空機が空を飛び、宇宙にさえ行けるようになった。

 これらは「人の能力を超えた」ものであり、しかも「超えることで仕事を奪われる」と危惧するよりも「なくてはならない存在」となっているものだ。

 コンピュータが生まれてからおよそ100年。計算能力は最初から人の能力を超えていたし、超えていたからこそ価値のある存在なのだ。

 AIの知能技術が人の知能を超えることを、「人間の仕事を取られるのではないか」と心配する論調をよく聞く。「知能」を「機械にはできない、最後の砦」のように考える人が多いのかもしれないが、それを超えてこそ、新しい文明社会があるのではないだろうか。

POINT!:AI以外の多くの技術は、既にシンギュラリティーを超えている

●職人がロボットに職を奪われる

 「わたしは真悟」も、同様の論調から物語が始まる。

 時はバブル直前の年代。日本は好景気に包まれていた。たくさんの仕事が来れば労働者は残業で対応した。そして機械化の波が来る。ハイテクの導入、生産性の向上、売り上げや利益の向上――といった期待が経営者の頭をよぎる。

 1巻「P1―Apt4 ロボットは少年と出会った」で、「モンロー」と名付けられた産業用ロボットが、主人公の「さとる」(真悟の「悟」)の父が働く町工場で稼働を始める。

 父はそのころ、「X座標を動かすと……」と座標の話をするようになる。さとるが父にじゃれつくと、「じゃますんなっ!! ひとが勉強してんのに!」とどなりつける。工場のエンジニアである父は、金属加工や組み立てを手工業で行う専門家であったのだろう。ハードのエンジニアと座標やベクトルなどの幾何学の知識はまだ違う分野のものだった時代だ。

 「いままで俺がトンカチやっていたのをよ、モンローのやつがよ、組み立てやがるから、おらっちは出来上がったモーターを集めて運ぶのが仕事になっちゃったもんね」という父のセリフから、彼が従来の「仕事」をロボットに取られ、運ぶという「作業」に回されたことが読み取れる。「P1―Apt9 ワードプロセッサ」でも、「うちの人、キカイにこき使われてるだけじゃないの」というさとるの母のセリフがある。「職人がロボットに職を奪われる」という論調が、当時あったに違いない。

POINT!:さとるの父のような熟練の必要な加工や組み立ての仕事を、産業ロボット「モンロー」が取って代わるようになり、最終的には「ロボットに職を奪われる」ことが危惧された

●人間は「物を運ぶ」

 近年の「AIに仕事を奪われる恐怖」と、この現象を比較してみよう。

 モンローのような産業用ロボットが導入されている製造現場では、機械と機械の間の移動にはベルトコンベヤーを利用するが、そこから箱に詰めて倉庫へ運ぶ作業は最近まで全て人間がやっていた。これはどういうことか。

 「曲げる」「削る」などの金属加工には「熟練の技」が必要だ。なぜかというと、人は「精密な作業」を「正確」に「繰り返し」行うのが苦手だからだ。このため、熟練の作業は「誇り高い」とされ、職級も高いことが多い。

 それに比べ「運ぶ」という作業には特別な訓練が必要ない。「人間が普通にできること」をやれば、物を運ぶことはできる。

 ところが実際には、熟練作業がロボットに置き換えられ、「物を運ぶ」という一見単純な作業が人間に残った。これには「物を運ぶ」という作業の特殊性に理由がある。

1. 繰り返す、同じ作業ではない

 ロボットは「物を運ぶ」という作業が、あまり得意ではない。

 町工場では、ある程度精密な機械を図面に合わせて製造することが多い。毎回、「違う形状」の物を「違う方法」で「違う方向」で「さまざまな大きさ」の箱に詰めなければならない。単純なプログラミングではできず、形状を認識したり、箱詰めを計画したりしなければならず、箱詰めの自動化はコストに見合わない。

2. 移動が難しい

 組み立てロボットは固定位置で腕だけを動かしていればよいが、運搬ロボットは移動しなくてはならない。バッテリーが弱かった1980年代では、バッテリー駆動も、電源ケーブルを付けるのも無理があっただろう。

 また、狭く入り組んだ工場を移動するには、カメラやレーザーレンジファインダー(レーダー)で周囲の形状を認識し、複雑な行動計画を立てる必要がある。滑る床の上や段差のある工場を移動するのは、設計通りにいかず、危険も多い。

3. 例外処理が多い

 「物を運ぶ」作業には、多くの例外が発生する。

 箱を適宜運んで、積み上げ、ある程度高くなったら別の山を作る。他の製品とうまく混ぜて積み上げなければならない。運んでいる途中で他の人が通れば待ったり避けたりしなければならないし、運送トラックは時間通り来ないかもしれない。

 人間が「鍛錬して可能としてきた動作」はAIで効率的にできるが、「人が誰でも普通に行っていること」は、AIや機械ではなかなかできない。

 ここに、AIと人間の仕事の分担のヒントがあるのではないだろうか。

POINT!:「物を運ぶ」は、人間には容易だが、ロボットには難しいタスクである

●モンローと真悟の入出力装置

 入力装置を確認していこう。

 「わたしは真悟」1巻「P1―Apt8 夜の工場」で、モンローは「画像認識技術」を使っている。解像度は1024×588(60万ピクセル)、モノクロだ。大写しになった図を見ると、ところどころ大きな点と小さな点で描かれているため、白黒二値ではなく、グレースケールだと思われる。「P1―Apt10 入力」でも、「私に色を識別する力がそなわっていれば」というくだりがあるので、カラーではない。

 一方、言語は文字コードに頼る。さとるやまりんがモンローと会話するシーンではもっぱら「キーボード」と「画面操作」に頼っており、音声で話すシーンはモンロー時代には出てこない。このことからモンローには「音響センサー(マイクロフォン)」と「スピーカー」は搭載されていないと推察される。

 しかし真悟になってからは、3巻「P3―Apt13 ワタシハシンゴ」で謎の少女「美紀」と電話を通して会話し、5巻「P5―Apt5 偶像」では、何かによって作り出された口で「ワ・タ・シ・ハ・シ・ン・ゴ」と船員に話しかけている。

 真悟は、モンローには備わっていなかった「音声対話型の言語機能」を自ら手に入れたのだ。

 1巻「P1―Apt9 位置ぎめ」に、「位置ぎめというのをしてもらい」という箇所がある。この表現から、モンローの動作は「フィードバック制御」ではなく、「位置決めからの相対位置」で行われている可能性が高い。

 私が試作していたロボットは、ハンド位置を「レーザー距離センサー」で計測していたため、位置決めという操作はなかった。今日のロボットの多くも、そういう操作を減らす方向で努力している。

 しかし、一般的には、センサーの多くが品質や動作環境が均一でないのが常識で、何らかの調整が必要だ。製造後に自動調整する機能を付けていることが多く、これを「キャリブレーション」という。スマホの方位センサーがそうで、ぐるぐる回す動作をさせられた経験をお持ちの読者も多いはずだ。

POINT!:モンローには中程度の「モノクロカメラ」、入力装置としての「キーボード」、表示装置としての「ディスプレイ」(当時の状況からしてブラウン管)が備わっていたと考えられる

●学習と認識

 「わたしは真悟」1巻「P1―Apt3 ロボットは動き始めた」に、さとるの父が「X座標を動かすとロボットの手は右へ、Y座標を動かすと左へ」と若干意味不明なことを呟くシーンがある。

 座標を設定してロボットハンドを操作するという方法は、筆者もよくやっていた。その当時から自動加工機は工場に普通に導入されていた。手順を数字入力するような「NC(Numerical Control=数値制御)」は、古くからなじみのあるものだ。昔は数値入力に紙テープを使うことが多かったが、現代は当然コンピュータである。

 これは「命令」の入力であり、「学習」とは少し違う。モンローに絵を描かせるシーンもあるが、これも数値入力しているように見える。「プロッター」と呼ばれる、図面を書くための機械と似た動作だ。

 1巻「P2―Apt1 Name!?」の冒頭で、さとるがモンローの手を握ってカタカナの「イ」を教えるシーンがある。ここから、何らかの「位置センサー」がモンローの腕に付いていたことが分かる。

 アーム型ロボットハンドの位置読み取りを行うためのセンサーとして古くから使われているのは「角度センサー」だ。

 角度センサーには、いろいろな種類がある。回転角によって電気抵抗値が変わる「バリ・オーム」は、アナログアンプのボリュームによく使われている。バリ・オームは安価で手軽なため、ラジコンのサーボモーターなどにも使われているが、精度が悪いという欠点がある。

 接続する接点を変える方式の「デジタルエンコーダー」という装置もある。接点を使わずに、印刷されたパターンを光学センサーで読み取る「光学エンコーダー」もある。デジタルエンコーダーは、精度は良いが大きくなりがちだったり、高価だったりする。

 動いた量だけパルスを出力する「パルスエンコーダー」という装置もあり、高速回転に強く強度が高いなどの性質があるが、パルス落ちという現象が起こるため精度に課題もある。

 ロボットハンドを動かして動作を教える方法は、「ダイレクトティーチング」と呼ばれる。

 昔から存在したが、位置決めを正確にしないといけないのに加え、精度が低く、全く同じ動きを再現するだけだったため、あまり役に立つものでなかった。近年、カメラ、物体認識、人の動作認識技術などのAI技術を組み合わせることで、教えている人が「何をしたいのか」「対象物の形状、大きさ、色形、方向などの状況が変わったとき」などを覚えられるようになり、工業用ロボットで再度見直されている。

 さとるとまりんは自身の顔をカメラで読み込ませ、名前と一致させる。これは、顔写真による「識別器」を使えばできる。物語の中ではさとるとまりんのみを覚えさせているので「どちらであるか」を認識しているだけかもしれない。そのような二者択一の問題を「二値分類」といい、その程度なら当時の画像処理技術でも可能だったかもしれない。

POINT!:モンローには「NC制御」の他、腕を持っての「ダイレクトティーチング」、顔をカメラから読み込んでの「画像識別装置」が備わっている

●真悟になってから発揮する能力

 「わたしは真悟」3巻「P3―Apt1 はじめとおわり」で「意識をもった」あと、モンローは真悟になり、モンロー期にはできなかったことを始めるようになる。

・認識技術

 最初に驚くのは、「口の動きを読み取り言葉にする」シーンだ。

 これは現在でもなかなかうまくいかない認識技術である。口の形状から母音はある程度推測できるが、子音は分かりにくい。言葉の流れから話した言葉を「推定する」必要がある。

 これには時間により並ぶデータ(シーケンスデータという)を認識する機械学習が役に立つだろう。現代では「CRF(Conditional Random Field=条件付き確率場)」や「RNN(Recurrent Neural Network=再帰型ニューラルネットワーク)」などの活用が考えられる。これは音声認識でも入力テキストの予測に使われている手法だ。

 4巻「P4―Apt4 逃走」で子供たちと出会った真悟は、子供たちが話している言葉とコミュニケーションをとる。モンローには音声聞き取り機能が搭載されていたとは思えるくだりはないので、なぜ言葉が聞き取れたのかは少し疑問であるが、何らかの音響センサーがあらかじめあったのかもしれない。

・感情と生存本能

 次に重要なのは、犬を「殺し」たりしたことから「壊れる」とはどういうことかを「理解」し、自らを「守る」ために「逃げる」、ネズミが他のネズミの死骸を食べるのを見て自分も電気を「食べる」ことを覚える、という流れだ。

 これらの行動はあらかじめ作られたものではなく「まりんに言葉を伝えたい、さとるに会いたい、会うために自分を守らなければならない」といった複雑な「感情」から来るものだ。現代のAIやロボットシステムには動物的な「生存欲求」はなく、真悟が特殊なロボットであることがうかがえる。

・ネットワーク

 そして真悟は、5巻「P5―Apt13 進化」で、世界中のコンピュータとつながり、全てを知ることになる。これは現代でいえば「インターネット」であり「クラウド」である。現代のAIは、その基盤を既に手に入れている。問題は「理解する」という能力がまだ欠けている点である。

 真悟は読唇術を行い、周りの状況から物事を理解し、新しい知識を得、自分を守り、地球の全てをネットワークから知ることになる。

 モンローが真悟化していく流れのなかで、「ICのつながり方は、まるで人間の脳細胞のつながりに似ている」という箇所がある。

 昔は電子回路が先端技術であり、プログラムは命令とデータでしかなかった。その後、電子回路は速度を上げ、容量を増やすための技術となった。莫大なデータ処理は超並列化、ネットワーク結合、クラウド化などで実現された。GUI、タッチパネルといった操作性向上はセンサー技術やOSの進化によって成された。そして、現代のAIでは電子回路の発達よりもベクトル計算や統計技術を基礎とした機械学習という計算理論によってもたらされており、その多くがソフトウェアによって実現されている。

 今日の「ニューラルネットワーク」という「脳細胞のつながり」を模したものは「考え方」であり、多段処理の判断結果の受け渡しにすぎない。機械学習を実際に使っている人は理解していることであるが、ICのサーキットの配線が脳細胞の接続に似せてあるのではなく、さまざまな判定結果の受け渡しがニューロンネットワークを模したものから来ているのである。

 「わたしは真悟」各巻頭のとびらに、「奇跡は 誰にでも 一度おきる だが おきたことには 誰も気がつかない」というメッセージが書かれている。

 現代のAI技術が高く注目されている背景には、多くの技術者が努力によって作り上げてきた多くの認識ソフトウェアがどうしても超えられなかった精度の限界を、機械学習が突然壁を破るかのように性能向上させたことがある。

 それには、GPUのような大規模並列処理が得意なプロセッサの登場、非線形分離、バックプロパゲーション、多層化といった地道な工夫があるのは確かだが、突然性能向上したさまざまな認識処理は技術者から見れば「奇跡」のようなものだ。

 その奇跡は誰にでも使えるにようになり、利用者はその奇跡が起きたことには気付かず、技術はいつのまにか生活に入り込んでくるのであろう。

●筆者プロフィール

米持幸寿
人工知能とロボットのシステムインテグレーター

Honda Research Institute Japanで実用化部門ダィレクターとして、インテリジェントテクノロジーの開発に関わる。前職は、日本IBMでソフトウェア関連の仕事を28年。研究・開発、マーケティング、セールス、開発支援、アフターサービスなど、ソフトウェアビジネスの多くの業務を経験。

最終更新:2/14(水) 7:00
@IT