自然言語処理

しぜんげんごしょり(英:Natural language processing)

情報科学の分野ではプログラム言語などの人工言語に対して、歴史的経緯を経て自然発生的に形成された日本語や英語のような人間が使う言語を自然言語と呼びます。この自然言語をコンピューターに処理させようとする一連の技術を自然言語処理といいます。

人工知能と言語学の一分野には「計算言語学」というものがあります。自然言語処理はこの計算言語学との類似もあるのですが、自然言語処理は工学的な視点からの言語処理をさすのに対して、計算言語学は言語学的視点を重視する手法をさす事が多く、データベース内の情報を自然言語に変換したり、自然言語の文章をより形式的な表現に変換するといった処理が含まれます(たとえばIMEなど)。

自然言語処理は形態素解析と構文解析、文脈解析、意味解析などをシンタックスなど表層的な観点から解析をする学問です。人間とコンピューターの間の対話インタフェースとして、自然言語がもし使えたら非常に便利であるということもあって、コンピューターの登場初期(1960年頃)には自然言語処理にある種の過剰な期待もありましたが、初期のシステムが、限定的な世界でうまくいったことで、すぐ楽観的な見方や期待が出てきましたが、現実を相手にする曖昧さや複雑さがわかるとその勢いは収まりました。また、何が簡単で何が難しいのか、といったようなことはなかなか共有されなかった為、進展も遅いものとなりました。

やがて、コンピューターの発展とともに、「音声認識による便利なシステム」が多くの人に利用されることとなり、何が簡単で、どういう事に使うのは難しいのかが理解されるようになりつつあります。
自然言語理解は、AI完全問題と言われることがあります。なぜなら、自然言語理解には世界全体についての知識とそれを操作する能力が必要と思われるためです。将来的には可能となるかもしれませんが、ハードウェア、ソフトウェア的にも超えなければならないハードルはかなりのものと思われます。


AI研究所 AI(人工知能) 用語集 2019/1/23 転載