音声認識

おんせいにんしき(英:Speech recognition)

音声認識とは、人間が話す言葉を音声データとして解析して、文字データとして認識する技術のこと。
人間が話す言葉は言語もさまざまで、方言やなまり、イントネーションの個人差などがあるため、高い精度で自然言語を音声認識させることは極めて困難とされてきた。そのため、当初は決められた単語や限定された語句の範囲内の音声認識が、携帯電話やゲーム機などで利用されてきた。
現在は、音声データとノイズの分離、認識させたい人間の声のサンプリング、音声辞書の活用、話の流れや認識後の文章などを推測するなどの手法により認識率が向上し、文字入力や音声アシスタントとのやり取りなどで実際に使われている。


KDDI(用語集)2019/1/22 転載