大規模言語モデル(LLM)
自然言語を理解・生成するAI技術。「次の単語の予測」を基盤とし、テキストの意味理解、要約、分類、生成を行う。ブロードリスニングを実現する中核技術。
詳細
2022年11月のChatGPT(OpenAI)公開が転機となり、ブロードリスニングが実用的になった。LLMにより、従来は人手では不可能だった大量の自由記述テキストの意味理解と構造化が可能になった。
ブロードリスニングでの役割
- 意見抽出 — 複合的なコメントから個別の論点を分離
- クラスタラベリング — 意見グループの要約名を生成
- 分類 — 意見のカテゴリ分け
- 要約 — 大量意見の概要生成
- 構造化出力 — JSON形式での整理されたデータ出力
主要モデル
- GPT-3、GPT-4、GPT-4o(OpenAI)
- Claude(Anthropic)
- Gemini(Google)
- Llama(Meta)
- Takane(富士通)
- PLaMo(Preferred Networks)
- DeepSeek R1
課題
- ハルシネーション — 入力にない虚偽情報の生成
- 政治的バイアス — 西洋的・リベラル寄りの傾向(Stanford大Andrew Hall教授の2025年研究)
- 文化的バイアス — 英語圏・プロテスタント欧州の価値観に近い(PNAS Nexus 2024年研究)