広聴AI
Digital_Democracy_2030(DD2030)が開発した、大規模な市民意見を収集・クラスタリング・可視化するオープンソースのAI分析ツール。Talk_to_the_Cityをベースに日本向けに改良された。
詳細
広聴AIは、CSVデータを入力として受け取り、大規模言語モデルとクラスタリングアルゴリズムを用いて意見を構造化する。主なパイプラインは以下の通り:
- 抽出(Extraction)— LLMが複合的な意見を個別の論点に分割
- ベクトル化 — Sentence-BERTで意見を数値ベクトルに変換
- 次元削減 — UMAPで高次元データを2次元に圧縮
- クラスタリング — 類似意見をグループ化
- ラベリング — LLMが各クラスタの要約ラベルを生成
- 可視化 — 散布図として表示
Talk to the Cityと比較して、Webベースのインターフェースにより非プログラマーでも利用可能で、日本語の処理に最適化されている。行政機関向けに内部サーバーでのホスティングにも対応している。
2025年3月16日にオープンソースとして公開。Digital_Democracy_2030の総コミット数は2,756件(2025年2月〜2026年2月)で、AIコーディングエージェントDevinが210件(約7.6%、5位)を貢献。
1万件の自由記述を解析するコストは約500円。
主な利用事例
- シン東京2050 — 約27,915件の市民意見を分析
- 2025年参議院選挙での各政党の利用(チームみらい、国民民主党、日本維新の会、公明党)
- アルティウスリンクでのVOC(顧客の声)分析
- 広島AIラボ — 2,953件の市民意見を分析
- 朝日新聞 — 消費税・参院選・万博などの報道分析
- 日本テレビ — 2024年衆院選リアルタイム分析(10,091件を25分で処理)
- SteamレビューやGoogle Mapsレビューの分析(非政治的データソースへの応用)