2021/1/22 ラボ勉強会 文章を最大20文字の付箋に刻む自然言語処理アルゴリズムについて話す予定だけども、まずは大枠から話す
Regroup
- 頭の整理を手助けするツール
- 情報を断片にして二次元的に配置し、自由に動かすことで整理する
- 西尾が書籍の執筆や講演資料の作成に使ってる方法を電子化したもの
- 重要な付箋を2クリックで大きくしたりできる
- ある程度の断片を集めてからじゃないと効果が感じられない
- 断片を作ることに慣れていないと使えない
- 使えないと断片を作るスキルが身に付かない
- 鶏と卵の関係だ!
分割付箋化アルゴリズム
- そこで「西尾が付箋を作るときにやってること」を観察してプログラムにしてしまう
- 「文章を入れれば付箋が出てくる」
- その文章はどうやって用意するのか?
- この勉強会に出てる人は世の中の平均と比べるとかなり言語化が得意な方
- 多くの人はブログ記事書いたりとかしない
- 言語化が得意でない人にとって「文章を用意する」がそもそも難しい
- 頭の中のモヤモヤまとまってない思考を文章にするのが難しいから、まずは断片的に書き出して、それを並び替えながら文章を作ろうというのがRegroupのストーリー
- 「まず文章を用意」では鶏と卵の関係
聞き出しチャットシステム
- プログラムが人間に質問をして人間がそれに回答する
- ユーザの回答に対してキーワード抽出を掛けて、重要そうなキーワードに対して掘り下げる質問をする
- 前に作ってMattermostの未踏ジュニアチャットにチャットボットとして住まわせていた
- ログを時々Scrapboxに載せていたら使いたいという人が何人かいたが、クローズドのチャットなので使わせられない
- 今回、一部の機能を削ってWebに移植した
この3つの要素を結合する
- 聞き出しチャットシステムの会話ログを、
- 分割付箋化アルゴリズムで付箋にし、
- Regroupに取り込んで整理
1月21日(木)にできたばかり
- 発散してから収束させるフェーズの切り替わりが明確でよい
- 整理をするには大きな画面が必要
- チャットは散歩しながらスマホで使うことができる
- 「散歩しながらチャットで発散」
- 「帰ってきてからPC/iPadで整理」
- 分割付箋化アルゴリズムにはまだだいぶ穴がある
今後の話
- チャットシステムの保存してるデータに不足があって、チャット中にせっかく抽出したキーワードがあんまり活用できてない→直す
- 今回の移植の際に機械学習を使ってるところと、機械学習のための学習データを吐くところが削られてる→直す
- 具体的には「質問に対してユーザが盛り上がってるかどうか」と「どんな状況でどの質問を選んだらユーザが盛り上がったか」
- 今は会話を始めるたびに記憶喪失になる
- ユーザごとの記憶を持ったらもっと良いかも
- 「この人がよく使うキーワード」とか
- 究極的にはRegroup上で付箋を大きくしたとか、隣接させたとかの情報を活用して対話できると良さそう
- 今は何も記憶しないのでまずは簡単なところからやる
アルゴリズムの話
議論
- 機械的分割と職人技分割
- Regroupを使った文章整理プロセス
- 元々KJ法から派生したが、もはやKJ法と呼ぶと誤解を招く
- KJ法の「グループ編成」はグループの内外が明確
- この方法は明確なグループ境界を持たない
- 束ねて表札をつけるプロセスもやらない
- 「どのような関係かを明示的に言語化できなくても、近くに置くことでなんとなく関係ありそうと表現することができる」に重点が置かれている
- 作った空間配置を半年後に読んで意味がわからないのでは?他の人に伝わらないのでは?
- 文章作成過程のテンポラルなものなので、伝わる必要はない。
- 「このRegroupの時、チャットに何が起こりますか?」
- 60097864aff09e0000100886
- 日本語としては少し不自然な質問だけど、これが気づきを促した
- この質問をされるまで「チャットで聞き出す→分割する→Regroupに入れる」という一方向の流れだけをイメージしてた
- 逆方向もありだなと聞かれて気づいた