Context
2026-06-02、nishio の「やってみよう、まず何をする?」を受け、judge / view / label 改善ではなく、まず既存 CLI 実行の結果を比較可能な実験台帳へ保存する first slice に着手した。
この作業は experiment-result-storage-policy-2026-06-02 と clustering-labeling-comparison-corpus-2026-06-02 の実装着手である。
実装対象は work/kouchou-ai-experiment-storage の topic branch codex/experiment-storage。base は digitaldemocracy2030/kouchou-ai の main@3c5d1f0267571edbe045d36775ab2461a0989581。work/kouchou-ai/ 本体は main のまま維持した。
Implemented
packages/analysis-core/src/analysis_core/__main__.pyに--experiment-root、--experiment-id、--experiment-overwriteを追加packages/analysis-core/src/analysis_core/experiment_archive.pyを新規追加し、1 回の pipeline output からmanifest.json、datasets.jsonl、tree_runs.jsonl、labelling_runs.jsonl、空のhuman_observations.jsonl/judge_runs.jsonlを生成- 既存 output の
args.csv、relations.csv、hierarchical_clusters.csv、hierarchical_initial_labels.csv、hierarchical_merge_labels.csv、hierarchical_result.json、hierarchical_status.jsonなどをartifacts/へコピー report.html、metadata.json、icon.pngなど表示 bundle 由来のファイルがあればbundles/へコピーpackages/analysis-core/README.mdにraw/experiments/<experiment-id>/への保存例を追記
この first slice で保存できるのは、dataset / tree / labelling の最低限の比較索引である。人間 observation と judge run は、同じ実験 ID に後段で追記する前提の空 JSONL として作る。
Validation
packages/analysis-core で以下を実行した。
PYTHONPATH=src pytest tests/test_experiment_archive.py tests/test_cli.py -q
ruff check src/analysis_core/experiment_archive.py src/analysis_core/__main__.py tests/test_experiment_archive.py tests/test_cli.py
git diff --check結果:
13 passed in 7.43sruff: All checks passedgit diff --check: no output
Open Questions
- この branch を PR 化する時、CLI option 名を
--experiment-rootのままにするか、--archive-root/--experiment-archive-rootのようにするか。 human_observations.jsonlとjudge_runs.jsonlへの追記コマンドを同じ CLI に足すか、別 script にするか。- 既存 LLM grouping 400 件実験の過去 artifact を、この schema に手動移行するか、まずは新規実行だけを対象にするか。