第17回:シリーズ『AI画像認識 再入門』(1/2)

「5歳児 vs. AI」で知るAI画像認識のキソ

ディープラーニング(深層学習)技術によって、AI(人工知能)を使った画像認識は進化を続けています。ただし、AI画像認識に対しては、過大評価と過小評価が入り乱れ、ビジネス現場のどこにどう適用するのが正解かがわかりにくくなっているはずです。そうした状況を打開すべく、本シリーズでは「AI画像認識 再入門」と題し、AI画像認識の基礎的な理解を深めていただくための情報を4回連載でお届けします。その1回目となる今回は、ヒトとAIの画像認識力の違いを、5歳児の「花子ちゃん」とAIとの対決を通じて明らかにします。

画像認識で勝負! 花子ちゃん vs. AI

まずここに、「花子ちゃん」という一般的な5歳児がいると仮定します。一方で、ディープラーニング(深層学習)技術を土台にした「AI(人工知能)」があるとしましょう。

この2者に「画像認識」の能力を競わせたとしたら、果たして、どのような結果になるでしょうか──。

おそらく、読者諸氏の中には、AIの圧倒的な勝利を予想される方が少なからずいるはずです。「AIはすでに将棋や囲碁のプロに勝てるレベルに到達している。画像認識で5歳児に負けるはずがない」といった具合です。その一方で、「AIの認識力はヒトには到底及ばない。5歳児のほうがすべてで上だろう」と考える方がいるかもしれません。

結論から先に言えば、この両極の見解は、どちらも間違っています。

例えば、花子ちゃんとAIの両者に下記について競わせたとしましょう。

対決1:コンベア上の箱の認識(ベルトコンベア上を流れる「箱」の認識)
対決2:箱に貼ったラベル(取扱注意ラベル)の認識
対決3:X線画像のがん細胞の認識
対決4:静止画におけるビー玉の数を数える(静止画でのビー玉カウント)
対決5:動画におけるビー玉の数を数える(動画でのビー玉カウント)
対決6:食べこぼしのシミの認識

その結果は、図1のようになるはずです。

図1:花子ちゃん vs. AIの星取表
図1:花子ちゃん vs. AIの星取表

いかがでしょうか。この結果を見て、「え? どうして、そんな結果になるの?」と疑問に思う方がいるかもしれません。

ただし、この推定には根拠があります。そして、その根拠をご理解いただけると、ヒトとAIによる画像認識の違いが見えてくるのです。

以下では、図1に示した結果の根拠について簡単に説明していきます。

5歳児にできることが、AIに難しいワケ

まず、「対決1」の「コンベア上の箱」については、花子ちゃんも、AIもほぼ完璧に近いかたちで認識できるはずです。AIには、ベルトコンベア上を流れる箱の画像を学習させる必要がありますが、例えば、図2のような段ボール箱の認識であれば、それほど手間をかけずにAIに認識させられるようになります。

図2:コンベア上の箱をAIが認識するイメージ
図2:コンベア上の箱をAIが認識するイメージ

また、その箱に「取扱注意」のラベルが貼られているかどうかも、AIに認識させることが可能です。それに対して、「取扱注意」の漢字を知らない5歳児の花子ちゃんには、そのラベルが箱に貼られているかどうかの認識は少し難しいかもしれません。

もちろん、AIも、「取扱注意」の意味までを理解して判定を下しているわけではありません。ただし、箱に貼られている「取扱注意」ラベルの画像(=教師データ)を数多く学習させることで、AIはその「特徴」を自動的に抽出します。そして、「今、インプットされたデータが教師データと同じ特徴を持つかどうか」を判定します。これにより、ベルトコンベア上を流れる箱に「取扱注意」ラベルが貼られているかどうかを、一定の精度で認識することが可能になるのです。

さらに、上記「対決3」の「X線画像のがん細胞の認識」についても、今日のAIは、医師に迫る精度での認識が可能になりつつあります。

一方で、医学の知識がなく、またX線画像のがん細胞を見た経験のない5歳児の花子ちゃんには、X線画像のがん細胞を認識することはまず不可能です。また、花子ちゃんでなくとも、がん細胞がまだ小さかったり、視認しづらい画像では、相応の経験を積んだ医師でないと、がん細胞かどうかの判定は難しいとされています。

それがAIの場合、X線画像に写るがん細胞の画像を大量に学習することで、X線画像にあるがん細胞の特徴を抽出し、一定の経験を積んだ医師と同等の判定が下せるようになるのです。

上記「対決4」の「静止画におけるビー玉の数を数える」という能力も、AIは5歳児の花子ちゃん、あるいはヒトの上をいきます。

例えば、図3をご覧ください。

図3:静止画の中のビー玉の数を数える
図3:静止画の中のビー玉の数を数える

皆さんは、この画像の中に、ビー玉がいくつかあるかを瞬時に数えることができるでしょうか。おそらく、特別な訓練をされている方以外は、一瞬のうちにビー玉の数を数えることはできないはずです。また、ビー玉の数が多くなればなるほど、数を数えるのが面倒になったり、疲れたりするはずです。それは、5歳児の花子ちゃんも同じです。

それに対し、学習によってビー玉の特徴を認識しているAIは、この画像の中から、ビー玉がどれかを判別し、一瞬のうちに数をカウントすることが可能です。また、AIはコンピューターですから、ビー玉の数がさらに増えたとしても、数えるのが面倒になったり、疲れたりすることもなく、正確に、そしてスピーディーに数え続けることが可能です。

その反面、「対決5」の「動画におけるビー玉の数を数える」のは、AIにとって難度の高い作業となります。

バックナンバー





























商品に関するお問い合わせ

※ 記載されている会社名、商品名は各社の商標または登録商標です。なお、本文中では™、®マークは基本的に明記していません。