意味符号化

  • 読み: いみふごうか
  • 種類: 造語

一言要約

文字コードのように 意味そのものに符号(ID)を振る という発想。デライト/デルンの設計の原点。「文字コードならぬ意味コード」。

詳細

宇田川氏の説明:

  • デルンは「(文字だけでなく)意味を書けるシステム」というイメージで始まった。
  • 16歳頃、文字コードのように「意味コード」を文章に埋め込めないかと考え始めた。
  • 議論や翻訳で、文中の言葉の意味が不明確なことで起こる問題は多い。意味コードの実現は 知的コミュニケーションのブロードバンド化、文字のやりとりから意味のやりとりへ、「脳が直接交信しあうような体験(疑似テレパシー)」を可能にする。

実装上の判断:

  • 意味を符号化するなら、対応する「意味集合」の定義が必要。それは静的には定義できない。個人が随時更新するシステムが必要 → そもそも意味とは何か、どう形式化するか、という問いから 輪郭法 へ。
  • 結果、これは PKM(個人知識管理) の目的と一致する。
  • デライトで行われているのは「絶え間ない『意味の Unicode』作り」。
  • 暗黙的に埋め込まれる文字コード方式はデモしにくい・誤入力リスクが高いと判断。語句に 人間可読な識別子知番)を付け、ウィキのように張り巡らせていく方式に。
  • ウェブ上でのインパクトのあるデモを兼ねるため、デライト開発者は文中の語句を大量にリンク化している(総 輪符 化)。リンクは目立たない装飾にしてあり、強調記法と併用しなければ閲覧専用モードで非リンク化される。

ここまで踏まえてもう一度デライトを見直すと、もしかしたら全く違うものに見えてくるかもしれない。

先行概念

「意味そのものに符号を振る」というビジョンは、20世紀後半から セマンティック Web および計算的オントロジー研究で広く共有されてきた。

  • Semantic Web vision(Berners-Lee, Hendler, Lassila, “The Semantic Web”, Scientific American, 2001): 「意味を機械が読める形で Web に埋め込む」というビジョン。Linked Data 4 原則として実装されている。
  • WordNet(Miller, 1995-): 単語ではなく 意味(synset) に ID を振る、英語の意味データベース。“bank の意味 #1(金融機関)” と “bank の意味 #2(川岸)” は別の synset。
  • ConceptNet: 多言語の常識概念ネットワーク。意味の ID 化と多言語対応。
  • Cyc(Lenat, 1984-): 万象の意味を形式化する半世紀規模のプロジェクト。
  • Wikidata: Q-number として意味(実体)に ID を振り、ラベルと多言語表記を分離。
  • Schema.org: Web 上で語句に型を付けるための語彙体系。

宇田川氏の独自性:

  • これらが主に 機械可読 を目的としているのに対し、デライトの知番は 人間が日常的に読み書きする識別子 として設計され、人間可読性(4桁単位、URL風)が重視されている。
  • 「個人が随時更新する自分用の意味集合」というスケール感は、組織・標準化団体主導の上記とは異なる。
  • 「意味の海」を文中にちりばめる UI 表現(輪注 など)は宇田川氏固有のもの。

先行概念マッピング

関連用語

ソース