統計的自然言語処理を徹底的に論じた教科書
原著が刊行されたのは18年ほど前になるので,本書の内容の一部は歴史的な記録となっており,現在の状況に照らして異なる含意を読み取るべき言及もある。そのような若干の注意書きを要するとはいえ,本書の重要性,今日性は高い。
学問的基礎の記述の豊かさに加えて,マルコフモデルや確率文脈自由文法など,統計的自然言語処理の基盤となる概念について,丁寧な式の導出を含めたわかりやすい説明がなされている。そのような理論的基盤と合わせて,n-グラムモデルにおけるスムージングや分類学習における過学習など,実際に研究を進める上では重要でありながら,えてして短めの注意書きになりがちな部分についても,十分な量が割かれている。
「今」の自然言語処理研究をその基礎から正しく理解し,その上に新たな積み上げを行うための基盤を提供してくれる良書となっている。
[原著名:Foundations of Statistical Natural Language Processing]