問い

普通の業務 PC で local LLM を動かすのが茨の道なら、hardware 調達からやってもらう route はどうか。

結論

かなり現実的になる。ただし、目標は「担当者の Windows PC で単一 exe」ではなく、認定済み local box / appliance を 1 台置き、担当者は普通の PC から browser で使う route に切り替えるのがよい。

この route は、単一 exe 配布の問題を「全ユーザーの既存 PC で動くか」から「こちらが認定した数 SKU で確実に動くか」に変える。ユーザーの hardware share 問題は消える一方、調達、資産管理、設置、更新、故障対応、セキュリティ review、モデル更新責任が新しい論点になる。local-ai-runtime-user-share-estimate-2026-05-31より

推奨 route

最も筋が良いのは 広聴AI Local Box route。

  • 組織が推奨 hardware を 1 台調達する
  • その box に FastAPI + static assets + local model runtime + model cache を載せる
  • 利用者は普段の業務 PC から http://local-kouchou-ai/ のように browser でアクセスする
  • データは LAN / box 内に留め、OpenAI / Gemini API 契約なしで小〜中規模分析を完走させる
  • 高品質が必要な時だけ API route に切り替える、または別 profile にする

この構成なら、担当者の PC は 8GB RAM の事務用 Windows でもよい。重い local inference は box 側で吸収し、support target も「認定 box」だけになる。local-ai-hardware-procurement-market-notes-2026-05-31より

2026-06-01 定例でも、来年くらいに local LLM で動く時代が来ると、Talk to the City 的なアルゴリズムの large context を要求しない 性質が強みに化ける、という見方が共有された。ローカルマシン / local LLM で完結すれば、データを外部に出さずに分析できる。tokoroten は RTX Spark(RTX5070相当+20コアARM+128GBメモリ) のような認定 hardware で動くと言えると楽、と例示しており、これは本ページの local box route と整合する。meeting-minutesより

Hardware tier

tier目安役割
Demo box16GB VRAM GPU, 64GB RAM, 1〜2TB SSD小さな sample / 100〜500 件規模の local 完走確認
Standard local box16〜24GB VRAM GPU, 64〜128GB RAM, 2TB SSD7B〜14B 級 quantized model と local embeddings の実用検証
High-memory box24GB+ VRAM GPU or 64GB+ unified memory20B class、複数 workflow、重い rerun の研究・pilot

2026-05 時点の具体候補としては、RTX 5060 Ti 16GB が entry 16GB VRAM、RTX 5070 Ti が余裕のある 16GB VRAM、RTX PRO 4000 Blackwell が professional 24GB VRAM の候補になる。Mac mini M4 Pro / 64GB unified memory も、Windows にこだわらず appliance として置くなら候補になる。local-ai-hardware-procurement-market-notes-2026-05-31より

単一 exe route との関係

この route は「Windows user が exe を 1 個 download して自分の PC で動かす」話ではない。むしろ、単一 exe route の難点を避けるために、運用境界を box に移す案である。

観点単一 exe / 既存 PClocal box / hardware 調達
導入download だけなら軽い調達・設置が要る
動作保証PC 差分が大きい認定 SKU に絞れる
local privacy端末内組織 LAN / box 内
API 契約不要model 同梱 / download が必要preload / cache しやすい
サポート個別 PC と AV / policy が地獄box image と SKU を見る
普通の業務 PCspec 不足で厳しいbrowser client だけなら可

したがって、非専門家向け普及の本線は「既存 PC で local LLM」ではなく、SaaS route / API route / local box route の 3 本に分けた方がよい。node-runtime-free-windows-exe-2026-05-31より

実装順

  1. Foundry Local + small model + embeddings で、sample report が local box 上で完走するかを見る
  2. 同じ box に FastAPI static serving を載せ、普通の client PC から browser で作成・進捗・閲覧できるかを見る
  3. 100 / 500 / 1000 件の wall-clock、メモリ、品質を測る
  4. 認定 hardware tier と dataset size guidance を docs にする
  5. API route との品質差を UI で明示する

ここでの success criteria は「OpenAI/Gemini と同品質」ではなく、「API 契約不要で小〜中規模 pilot を完走し、出力品質の限界が説明できる」である。

Open Questions

  • local box を誰が調達・保守するのか。DD2030 が推奨 SKU を出すだけか、貸し出し / appliance 提供まで踏み込むか
  • local box の OS は Windows にするか、Linux / macOS appliance も許すか
  • 自治体ネットワークで LAN 内 web service を立てることの security review はどの程度重いか
  • model download を初回起動時に許すか、事前 preload 済み image として配るか
  • RTX Spark のような具体 SKU / appliance を候補として扱う場合、実在スペック・供給時期・価格・日本国内調達性を別途一次情報で確認する必要がある

Updates

  • 2026-05-31: 初版作成。既存業務 PC ではなく hardware 調達込みで API 契約不要 local 完結を実現する route を整理
  • 2026-06-01: 定例議事録を反映し、local LLM 時代には TTTC 的な large context 不要アルゴリズムが強みになること、認定 hardware で「これで動く」と言える route が有効であることを追記