broad-listening-book-source

出典

リポジトリ: digitaldemocracy2030/broad-listening-book
ローカル clone: work/broad-listening-book/
参照 commit: 5826726 (2026-05-21 時点 main)
ライセンス: CC BY-NC 4.0（タグ license-cc-by-4.0-final まで CC BY 4.0）
主担当: tokoroten、出版社はインプレス、英語版／Web は Luke Closs

本 wiki 上での位置づけ

書籍そのものは本 wiki のスコープ外（entity page 参照）だったが、2026-05-21 に clone を取得して 12〜13 章および 10 章 DD2030 節、現場取材の column / case 章が 開発者にとっての一次資料として価値が高い ことを確認したため、本 source として扱う方針へ更新した。理由：

Slack や議事メモで断片的に語られていた設計判断が、出版可能な形で整理されている
自治体・メディア・選挙の現場で観測された運用上の問題（label 抽象すぎ問題、外れ値クラスタ吸収、キーワード設計の難しさ）が記録されている
賛否分離プロトタイプ（センチメント次元拡張・DivCon）など「次に手を入れたい場所」が明文化されている

開発者向けの抽出は broad-listening-book-extractions にまとめている。

章マップ（開発向け価値で序列化）

Priority 1: 設計判断・実装の一次資料

13_広聴AIの技術スタック解説.md — パイプライン 8 ステップ詳解、プロンプト全文、設計トレードオフ、ミニ広聴AI実装 (100 行 Python)、コスト試算、Scatter vs Long Context 二アーキ比較、賛否分離プロトタイプ (sentiment-dim / DivCon)
12_ブロードリスニング要素技術解説.md — Word2Vec→BERT→Sentence-BERT、エンベディングの賛否分離限界 (12.3.5)、Few-shot/Structured Output/Reasoning Model、UMAP の解釈（軸に意味なし・遠距離に意味なし）
10_00_DD2030による広聴AIの開発活動.md — TTTC Scatter からのフォーク経緯、Spectral→K-means 変更理由、Web 化、階層クラスタリング導入、濃いクラスタ抽出、2025-05 のリソース崩壊と最小運用、Devin 利用量 (210 commits / 約 7.6%)、属性フィルタ 2203 行が Copilot Agent 実装、source-link 機能の意義、自治体導入で繰り返された 4 つの障壁

Priority 2: 現場運用知見 (要求仕様・障害事例)

05_東京都、シン東京2050、ブロードリスニングによる政策転換.md — 多チャネル収集 (Form / X / YouTube / 郵送 / 対面)、Silver Democracy 構造への対抗としての設計意図、40-50 クラスタが分析的には豊かだが読者には過多というジレンマ、運用者が LLM ラベルを手で再ラベリングする実態、off-topic 大クラスタの発生
04_05_朝日新聞の特設記事.md — ラベルが抽象すぎる問題、プロンプトで「見出しを 5 つ付ける」工夫、選挙直前一発勝負への試行錯誤、SNS は綺麗にクラスタリングできずアンケートは綺麗、外れ値除外機能の要望、ローカル実行できる UI ツールの要望、座標を Flourish で再可視化している実装、検索キーワード設計が一番難しい
column/1万件の声を集めて気づいたこと.md — 9,688 件集めても多くが断片的立場表明にとどまる、「スケールアップ」より「スケールアウト」、合意形成のボトルネックは 自己理解（青山柊太朗 / 多元現実）
column/安全な共感.md — 散布図 UX の固有価値、Polis が返信機能を意図的に排除した設計、SNS 分断装置からの全体像復元、「ノイジーマイノリティ」の留保
column/ワードクラウドは分析ではない.md — 頻度ベース可視化の限界、なぜセマンティッククラスタリングが必要か
06_* 国政選挙各党 — チームみらい・国民民主・公明党・維新・再生の道のそれぞれ異なる利用形態。要件差分が読める
08_* 自治体 (太田市・広島) — 太田市の「自分ごと化会議」は事前 AI 対話による自己理解促進を組み込んだ設計、広島は 3,000 件の自記式意見処理。組織採用がボトルネック
11_海外におけるブロードリスニング — Polis / vTaiwan / Remesh / Birdwatch、AI ツールは熟議文化に上乗せされる accent であって熟議の代替ではない、という設計哲学（Vaidya）

Priority 3: 補助・背景

00_序文.md / 00_本書の読みかた.md / 01〜03 — ブロードリスニング概念定義、デジタル民主主義文脈
04_01〜04_04 / 06_01〜06_05 / 07_* / 09_* / 10_01〜10_05 / 11_02〜11_05 — 個別事例。要求仕様や障害事例として読める箇所は Priority 2 章にも触れられているのでまず Priority 2 を読む
99_付録_用語集.md — 書籍側用語集。glossary と突き合わせる

コードとプロンプト

code/llm_opinion_analysis.py — LLM 分類のリファレンス実装（Structured Output）
code/political_wordcloud.py, code/rashomon_wordcloud.py — wordcloud アンチパターンの参照実装
code/test_mini_kouchou_ai.py — 13.3.2 のミニ広聴AIの構造テスト
13 章本文のプロンプト全文（抽出・初期ラベリング・統合ラベリング・要約）は kouchou-ai 本体の apps/api/broadlistening/pipeline/prompts/ および packages/analysis-core/.../prompts/ と突き合わせる際の参照になる

書籍と本体実装の照合上の注意

本書は 2026 年出版前 の確定版相当として書かれている。たとえば analysis-core への移行・run_workflow() 化・plugin 化のような 2026-Q1 以降の実装変化はほぼ書かれていない
「広聴AI では K-means / Ward を使う」「UMAP→クラスタリング順」などの記述は本体実装と一致するが、analysis_mode=llm_grouping 等の今後の枝は書籍には登場しない
column / case の引用は 取材時点の運用 を写しているので、現状の機能整理（refactoring-status）と必ずしも一致しない

Updates

2026-05-21: 初回作成。5826726 時点で章マップを取得

kouchou-ai developer wiki

エクスプローラー