画像
従来は、画像はコンピュータにとって、認識できない対象でした。
なので、例えば、ウェブページに画像ファイルを掲載する際には、その画像が何を表しているのかと言うタグを付けるのが通例です。
例えば、リンゴの画像があっても、コンピュータはそれがリンゴであるコトを認識できないため、人間が、
alt="リンゴ"
と言うタグを付加しておくのです。
そうするコトで、その画像と、「リンゴ」と言うテキストデータがリンクし、検索エンジンで探すと出て来るようになるわけです。
ところが、最近のコンピュータはAIによって、リンゴの画像がリンゴであるコトを認識します。
なので、人間がその作業をする必要が無くなりつつあります。
文字
同様のケースが、画像内の文字にも言えます。
昔は画像内のテキストデータを認識させるのは、一大イベントでした。
OCRと呼ばれるその作業は、コンピュータの進化と共に発展しました。
当然、初期のOCRは雑でしたが、最近のOCRは優秀です。
ところが、いまや、リアルタイムで画像内のテキストデータが認識される時代です。
iPhoneで写真を撮ろうとすると、被写体にテキストデータを見つければ、その場でiPhoneは教えてくれますし、それをコピーするコトもできます。
昔を知る人間、これまでを知る人間からすれば、これは脅威なんです。
画像を画像データとして認識するだけでは無く、それが何の画像なのか、その中にはどんなテキストデータが含まれるのか。
これって、実は巨大なパラダイム転換なのです。
こうやってコンピュータはどんどん進化します。
残された、
コンピュータが苦手とする作業
については、ボクはあとひとつだと思っていますが、それはいずれ書きます。