自然言語はしばしば曖昧なのだが、どうすれば良いか? 厳密な人工言語で表現しなおそうというアプローチは幾度か試みられたがうまくいってないように思う。

厳密な記号体系で何らかのものが記述された時、それを人間が読んで解釈するためには記号体系についての知識を伝達する必要があるが、人間はポンコツなので大部分の個体にはできない。できる個体でも高コストな投資が必要になる。その投資をするだけの価値があるかどうかどうすればわかるか?

人間が読むために作られた知識体系を機械が読める形に変換しようとするアプローチは、使っている機械可読な記号体系で表現できないものが現れた時に困る。元々の記述の曖昧さに気づいて、どう表現するべきかのコンセンサスが得られない(これに関しては得ようとしないのが正しいと思う。正しくて無益常識的知識)

この二つをまとめると「人間が読んで理解することを期待しない」「今人間が読んでるものを直訳しようとしない」(これは英訳和訳でも同じだ。元の文章の内容を保つことよりも、変換先の言語でまともに読めることが優先)「記号体系は必要に応じて拡張できるものでなければならない」となるか。

それに加えて何らかの価値が生み出されなければならない。

人間の自然言語の曖昧さの中に解消することで利益が得られるようなものがある。機械的にそれを検出できるとよい。 「曖昧であるものを検出する」ではない。ほとんどすべてが曖昧だ。

表記揺れ