広聴AI

Digital_Democracy_2030(DD2030)が開発した、大規模な市民意見を収集・クラスタリング・可視化するオープンソースのAI分析ツール。Talk_to_the_Cityをベースに日本向けに改良された。

詳細

広聴AIは、CSVデータを入力として受け取り、大規模言語モデルクラスタリングアルゴリズムを用いて意見を構造化する。主なパイプラインは以下の通り:

  1. 抽出(Extraction)— LLMが複合的な意見を個別の論点に分割
  2. ベクトル化Sentence-BERTで意見を数値ベクトルに変換
  3. 次元削減UMAPで高次元データを2次元に圧縮
  4. クラスタリング — 類似意見をグループ化
  5. ラベリング — LLMが各クラスタの要約ラベルを生成
  6. 可視化 — 散布図として表示

Talk to the Cityと比較して、Webベースのインターフェースにより非プログラマーでも利用可能で、日本語の処理に最適化されている。行政機関向けに内部サーバーでのホスティングにも対応している。

2025年3月16日にオープンソースとして公開。Digital_Democracy_2030の総コミット数は2,756件(2025年2月〜2026年2月)で、AIコーディングエージェントDevinが210件(約7.6%、5位)を貢献。

1万件の自由記述を解析するコストは約500円。

主な利用事例

関連項目