plurality-llm-wiki

各言語で自律的に発達した Plurality 概念体系を、言語ごとに独立した wiki として持ち、それらをまたぐ「概念の文節化の差異」を観察・分析する多言語 wiki森。

Wikipedia は言語間の概念の文節化の差異を observe するが、分析はしない。この wiki は分析もする。

Language Wikis

各言語版は独立した GitHub プロジェクトとして運営され、別の admin / contributor が参加できる。本 repo (plurality-llm-wiki) はメタ層 (project 解説 + 言語間対応の registry + cross-language analyses) を担う。

新言語を追加するには、plurality-llm-wiki-<lang> 命名で独立 repo を作り、本 repo の correspondences.yaml に該当言語 column を追加する。

Cross-language Registry

correspondences.yaml — 言語間の概念対応データ。

- en: Plurality
  ja: プルラリティ
- en: ~      # 英語に対応単語なし → 観察対象
  ja: <ja-only-concept>

null で表現した欠落を python3 scripts/show_gaps.py で列挙する。

Concepts

(meta-wiki なので、個別概念は子 wiki 側に住む。ここに置くのは本 architecture 自体を説明するメタ概念のみ)

  • wiki-forest — 本 repo の architecture 名。各言語 wiki を独立した「木」として並存させ、森全体を横断観察の対象とする多言語 wiki 設計。

Entities

Sources

  • words-as-public-goods-lt — 西尾 LT「Words as Public Goods / 公共財としての言葉」(2024-01-03, Plurality Tokyo “Glen in Japan”)。本 wiki 森の発想の根底。
  • meta-wishlist — 3 子 wiki の wishlist を集約。subagent では取得できなかった 22 items を人間支援用に優先度別整理。

Analyses

言語間で発見された文節化の差異を ad-hoc に記録していく場所。仮説検証は実運用の結果として自然に貯まることを期待し、無理に先取りしない。

同じ概念の文節境界 / 説明が違う

  • role-vs-ideology-noun-split — テクノクラート vs テクノクラシー、リバタリアン vs リバタリアニズム — 日本語の外来語形態が concept space の文節化を駆動

  • plural-voting-lineages — 多元投票 / Plural-Voting: JA は分人民主主義 (鈴木健) を主要セクションに、EN は Amartya Sen / Arrow 不可能性定理を冒頭に

  • augmented-deliberation-examples — 拡張熟議 / Augmented-Deliberation: JA は安野貴博 2024 都知事選を canonical example に、EN は bridging algorithms 理論を主要セクションに

  • quadratic-voting-framings — クアドラティック投票 / Quadratic-Voting: JA は鈴木健の 1/5/25 クレジット例で導入、EN は Licklider 信号検出理論で “なぜ二乗か” を justify

  • plurality-definition-framings — プルラリティ / Plurality: JA は鈴木健経由で身体的・感覚的差異まで含む射程拡張を Open Question 化、EN は Mandarin 數位 のダブルミーニングを definition の中核に

  • loanword-retention-patterns — 山形浩生訳が概念ごとに loanword 残し / 翻訳を選び分けるパターン (プルラリティ / クアドラティック投票はカタカナ、多元投票 / 液体民主主義は訳す)

  • kanji-as-ja-zh-bridge — correspondences.yaml に zh annotation を加えると ja-zh 対応 (39) は en-ja (23) より dense、さらに 11 entries で直接 kanji を共有する。words-as-public-goods LT のテーゼ検証

  • civic-ai-homophone-substitution — 唐鳳の「Civic AI」→「仁工智慧」翻訳は字面置換 (人→仁) で儒家倫理を召喚する creative translation。kanji-as-ja-zh-bridge とは逆方向のメカニズム

  • kami-as-dishen — 「Kami」(日本神道) →「地神」翻訳は文化的含意を脱ぎ捨てて機能的な核 (在地・有界・可退場) だけを最小構成で残す「意味の最小化」戦略

  • zh-tw-translation-strategies — zh-tw が Plurality 用語を翻訳する 5 戦略 typology (直訳 / 同音異字置換 / 意味の最小化 / 既存哲学概念での再 framing / 音訳)

  • civic-ai-cross-language-shapes — Civic AI / 6-Pack of Care を EN (source 横展開 9 件) / zh-tw (concept hierarchy 縦展開 7 件) / JA (void with touching mentions) で carving 形状が全く違う

  • habermas-blocks-pluralization — DE で「Plural Publics」が複数形「Öffentlichkeiten」になれない (Habermas が単数 die Öffentlichkeit を 1962 年以来 dominant にしているため)。DE 翻訳者は ⿻ 記号で迂回。discursive convention による block の事例

  • nattoku-translation-vs-native — 「納得」が JA Plurality 本翻訳に 2 回のみ vs JA native sources で 40+ 回。翻訳経路の比較と native discourse の収集は別の方法論で違う carving を surface する

Meta-meta (typology of analyses)

  • carving-types-typology — 14 analyses (+ habermas-blocks) を見渡した type 分類。翻訳戦略 (Type E) が最多 4 件、新 Type N (理論伝統 activation/block) 3 件、概念境界 / 系譜選択 / canonical example / 説明力点 / 言語学的 affordance / ingest shape も含む 8 types。未観察 future types (connotation / dormancy / ingest velocity / dialect / 翻訳者一貫性) も列挙

言語コミュニティ固有の lineage (記録のみ、carving 差ではない)

  • suzuki-ken-lineage — 鈴木健由来の 4 concept page (なめらかな社会とその敵 / 分人 / 分人民主主義 / PICSY) が JA 固有の理論系譜を形成
  • japan-reverse-import — 安野貴博の 2024 東京都知事選由来のブロードリスニングが本書日本語版に逆輸入された pattern
  • push-asymmetry-activity-vs-word — cross-language push は activity(低コスト, 先) と word(高コスト, 事後) で非対称。活動が articulate 不足を露呈した後に word 借入が起こる仮説