今回の目的
- AIに対する「よくわからない気持ち」や「漠然とした不安感」を解決する
- 今回の講演を見て感情がネガティブに振れる可能性がありますが、事前にそれに配慮することはできません
- 「恐怖は常に無知から生まれる。知識は恐怖の解毒剤である」エマーソン
- 「漠然とした不安感」が解決されても「明確な不安感」に変わるだけかもしれない
- 問題は理想と現実のギャップ
- 事実と解釈がある
- 解釈が言語化されていないと「モヤモヤ」「漠然」になる
- 言語化された解釈を共有する
僕とGPTとの最初の出会い
- 2022年の未踏ジュニア
-
NoxicelはAIを用いた、英作文を通じて英単語を学習するアプリです。英作文によって、英単語を文脈や文法と共に覚えることができます。また、教師がいない場面でも気軽に英作文ができるように、OpenAIの技術を使用し文法や用法等の提案をします。
- https://jr.mitou.org/projects/2022/noxicel
-
- 公開は11月だがもちろん5月の応募段階で気にかけていた
- 採択されたのでプロジェクトの様子を見ていて、夏頃には自分でもAPIを試してみた
- 当時は補完APIをPlaygroundで使う形だった
- 当時の感想「なるほどねー、意外と色々できる。でも英語ならそれなりだけど、僕がやりたい日本語での知的生産性向上にはまだ使えないなー」
- そして11月にChatGPTがでた
- これって「悲観的勘違い」じゃん!
- 強化学習 その1 2017-01-13 @ 機械学習勉強会
- 各10回試しても、まだ4割ぐらいは「何もしない」を選択する
- 100回試せば割といい結果になる
- 10回試した程度では1.5倍の価値(成功確率,期待値)の差を理解するには足りない
- 少ないサンプル数で価値を低く見積もってしまうと、さらにサンプル数を増やす行動が行われなくなるので、無知の状態から脱出できなくなる
- →悲観的勘違いをしたことを反省してとにかくたくさん使うことにした
- 補足: この実験は「ランダム」だが、実際には「使えば使うほど上手く使えるようになる=期待値が上昇する」効果もある
英語と日本語の性能差
- ChatGPTを使う体験をどんどんやっていった
- 英語と日本語の性能差を感じた
- 「感じる」だけではないことが5/2のGPT4リリースで明確になった
- GPT-4
-
- 同じシステムを、同じ費用を払って使っていても、日本語などのマイノリティ言語の話者は英語話者に比べて得られるものが少ない
- この格差は広がっていくのか縮まっていくのか?
- A: 広がっていく
- 指数関数的発展の素直な解釈
- B: なぜか遅れてる側が加速して追いつく
- 神風が吹くとか?
- C: どこかで飽和して、遅れて追いつく
- S字発展だと考えた場合の解釈
- AなのかCなのかは知り得ない
- (Bは…希望的感想だよね…)
- A: 広がっていく
- Aだとするなら
- 英語を使う国やチームは、日本語を使う国やチームよりもより大きな便益をAIの進歩から受け取る
- 国際的な競争力を考えたときに、日本語などのマイノリティ言語を使っていることは不利
- とはいえ「じゃあ社内公用語を英語にするね」が機能するとは思えない
- アウトプットのハードルが上がってコミュニケーションが抑制されるから
- どうしたらいいかわからないけどとりあえず自分のScrapboxを毎日DeepLで自動的に英訳する仕組みを作った(3/25)
- pScrapboxAutoTrans2023-03-25
- 近々GPTを使った翻訳に切り替える予定
- 明治の日本は、高等教育を自国語でできるようにすることが大事だと考えた
- before LLMの時代には、それは良い判断だったように見える
- after LLMの時代に、これが呪いにならないか不安
- 英語を話す発展途上国は、英語を話す先進国で今後発生する「教育のイノベーション」の恩恵を直接受け取ることができる
- 教育における双方向インタラクションが「人間の教師」に負荷集中する問題が、教師をAIで支援してスケールさせることによって解消される
- マイノリティ言語話者はこのイノベーションに遅れることになる
- 0/1ではなく、LLM以前からすでに発生していた傾向でもある
- ソフトウェアエンジニアが新しいライブラリを使おうとしたり言語やブラウザの世界標準を確認しようとしたとき「英語を読まなければならない」という事態がしばしば発生していた
- その対象となる人や分野が広がっていく
- Q&A
- マイノリティ言語を使うことによるオーバーヘッドはあるが、それは指数関数的に広がって行かないので、全体の効用が指数関数的に広がって行くなら全体の中での割合は減少していく
- 確かにその世界線はある、AとBの間に2本の線が平行線になるものがあるわけだ
- 機械翻訳でなんとかなる論
- 専門用語や社内用語などが元に戻る保証がない
- 企業の実務には世の中で使われてない単語や「なになに株式会社」「なになにさん」みたいな固有のキーワードがたくさん出現する。翻訳によってどの程度破壊されるか。例えば「西尾泰和」が元に戻らないw
- もっと時代が進んで、AI同士が情報交換するようになると、もはや英語も第一言語ではなくなるかも
- 多分それはSimpified EnglishにJSONやPythonが混ざった言語になる
- 関連: 英語話者国の競争優位
情報の分断
- 3/8に自分のScrapboxをChatGPTにつないで、ChatGPTがこのScrapboxを参照した上で反応を返せるようにした
- いまではRAGと呼ばれてバズワード化してる
- 3/24 自分のScrapboxをChatGPTにつないだ話勉強会
- Toolformer: LLMが外部ツールを使う方向性
- を、今後の方向性として話した
- 同日ChatGPT Pluginsリリース
-
-
- 事前にPluginsのことを知らされた企業と知らされなかった企業がある
-
gdb Thank you to our amazing set of launch partners — Expedia, FiscalNote, Instacart, KAYAK, Klarna, Milo, OpenTable, Shopify, Slack, Speak, Wolfram, and Zapier. Each has built a very cool integration!
-
-
世界のちぎれ
- この出来事3/24の少し前の3/21にまだらな未来が拡大しない、少し後の3/25に世界がちぎれた後を書いた
- この時期に「世界のちぎれ」という概念が結晶化した
- この時期の思考をトレースしてみよう
- まだらな未来とは
- 未来はすでにまだらに存在している
-
「未来から来ました!」 奥田 浩美の講演はこの言葉から始まります。勿論2050年とかからタイムマシンに乗ってきたわけではありません。未来は現実の世界で”まだら”に存在していて、すでに一部のビジョナリーリーダーには「在りたい未来」が見えています。見えているどころか、すでにその未来の姿を生きているのです。
-
未来は、現実の世界においてすでに「まだら」に存在しています。… 私はすでに私にとっての「こうありたい未来」が見えていて、その未来の働き方の一部を育児や介護を通じて実践しています。それがいつも数年後に常識化するという意味で「未来から来ました」と言っています。
-
とはいえ…そんな一部の”勝手な行動ができる人は恵まれた人だけ”、”現実は…”みたいな「世間の常識」を語られますが、そこを越えた現実がどんどん広がり、現実がどんどん破壊されていっています。その破壊されたところに「まだら」に未来人が住んでいるのです。私はそんな「まだらな」未来人の一人です。
-
- 3/21 まだらな未来が拡大しない
- 「まだらな未来」のある世界、今までA1からA2へと変化していくと思っていたのだけど、今観測してることはB1からB2への変化のように見える
- 3/25 世界がちぎれた後
- 引き伸ばされた世界がちぎれてしまった後、何が起きるのか
- ちぎれて残った古い世界が定住する人
- 孤立して農耕をする村
- 気候が変わってゆっくりと農耕に適さなくなっていく
- じわじわと衰退するが茹でガエル
- その世界を訪れた「移動する人」が何をするか
- 連れていくのはwin-winっぽい
- 村を出て行く若者と連れて行く旅人はwin-winで、村に残る人が激おこする構図かも
アーリーアダプター集団の形成
-
2022-11-19 アーリーアダプター集団の形成
-
時系列変化
-
移動した先が正しいかどうかとは独立
-
2ステップ先に進んだ人は、0ステップの人に呼び掛けたりはしない?
- それが「旅人が村を訪れる」だと思う
- メリットの有無などの議論も同様で、メリットがあればやるし、なければやらない
- 津波てんでんことも繋がってて「逃げて走ってる段階ではそれをやる余裕がない」「落ち着いて余裕ができてから救助活動が行われる」というイメージ
- それが「旅人が村を訪れる」だと思う
どう生きていくのかという悩み
- 3/29 津波てんでんこ
- 津波の場合は「高いところ」に逃げれば良いことが既知
- しかしどこに逃げればよいかが不明なタイプの変動もある
- 2023/9/16加筆
- 観測範囲を広くする必要がある
- しばしば移動が重要
- 移動先が決まる前に移動を始めなければならない
- 2023/9/16加筆
- しかしどこに逃げればよいかが不明なタイプの変動もある
- 11/6 津波が来る方に賭ける
- LLM meetup(4/10)
-
takahiroanno 都内某所で行われたLLM meetupに行ってきたけどめっちゃ良かった。参加者は全員LLM関連のデモ持ってこないと参加不可というハイブローなmeetupだったんだけど、50人ぐらいきてた。参加者がひたすら蒸留されてて、LLM無職がたくさんいた。一つの時代のはじまりを感じたよおれは
-
takahiroanno LLM無職=LLMの凄さを目にして思わず会社を辞めた人(最近起業した人を含む)
-
kenn 自分もLLM無職です!まじめな話、スタートアップの始まりなんて無職と何も変わらんので、どうせ無職やるなら会社はじめるのがいいよね。自分のモチベ操作的な意味で。作ってしまえば案外なんとかなるし、なんとかならなくても元から無職だし。笑
-
- nishioさんもどう生きていくか悩むことがあるのですね
- 問題は理想と現実のギャップなので、理想を高くするほど問題も大きくなる。
- 僕一人で生きてくだけならなんとでもなるとは思うけど、転職活動とかめんどくさいのでやりたくないから理想としてはサイボウズが健全な経営状態をあと20年保ってほしくて、20年のスパンを考えるために20年前のサイボウズと今を比較すると、まあ同程度の変化があると考えるのが自然かなと。(AIで加速する可能性を考慮しなかったとしても)
- で、変化が必然なら「どう変化するべきか」が問いになる、という流れ。
- 関連: 人生を悩む
- 問題は理想と現実のギャップなので、理想を高くするほど問題も大きくなる。
書籍を書くことに対するネガティブな気持ち
- 最初の書籍「Jythonプログラミング」書いてる最中にバージョンアップ、出版して数年で陳腐化
- 10年陳腐化しない本を書くぞという気持ちで書いたのが「コーディングを支える技術」(2013)
- 今年、改訂版を出す話が持ち上がった、10年売れ続けてきた証拠
- 改訂版が出るということは書籍の有益さのシグナリングなので引き受けようとしていた
- 1月には「この10年のプログラミング言語の変化」の準備をやってた
- が、辞めた。次の10年のスコープで考えた時に書籍という媒体に存在意義が見出せなかった
- 知識の伝達形式として書籍は適切なのか???
- 4/6 人間のために書くよりLLMのために書く方が楽
-
nishio 技術的にはもうできてるので近いうちに一般消費者にも「自分が興味がある分野の知識パッケージをLLMに与える機能」が降りてくる。そうなったら新しい言語の作者はLLM向けの知識パッケージを作って、その言語を使いたい人はそれをLLMに読み込ませて使うようになる。
- これを書いて、4/7にChatGPT Pluginsで実装して、11/7のOpenAI DevDayでAssistants APIという名前で提供された
-
nishio 知識パッケージの作成って実は人間が読むためのドキュメントを作るよりも楽。というのは人間は短期記憶が限られてるので「良い順番」で知識を与えてやる必要があって、執筆者からするとこれがとてもしんどいのだけど、LLMに与える時には順番は関係ないから思いついたことをどんどん書けばいい
-
nishio むしろユーザの質問をもとに「何が足りてない情報か」を特定してそれを追加していく作業をガンガン回す方が良いし、それをやるためのシステム作りが重要になる
- 速やかにScrapboxで公開し、翌日には英訳、半年経ってから「半年前のこの時にこう書いて公開したけど」と言及する
RAG: Retrieval-Augmented Generation
- LLMが賢くても、公開されてない社内情報のことは知らない
- 検索で知識を補うのがRAGのアプローチ
- この検索を改善していくことに価値がある!
- 7/18 Azure Cognitive Search
- 活路を見出したと思って進んだ先にローマ兵がいた気持ち
- ローマ帝国=Microsoft帝国
どこにいってもローマ
- 需要の規模によってGPUの使用効率に差が生じる
-
GPUが高価なリソースで、一つのGPUで出せるスループットに限界があるので、世界全体から十分な需要があるサービス提供者は負荷を平準化して効率よくGPUを使えて、そうでないサービス提供者は低負荷時にGPUを遊ばせてしまって何倍も使用効率が落ちてしまう
- 顧客が全世界のタイムゾーンに散ってるサービス提供者と比べて、例えば日本に顧客が集中してるようなサービス提供者はリソースの使用効率が何倍も悪くなってしまう
- 11/16 [速報]マイクロソフト、独自設計のAIチップ「Azure Maia」発表。AIの学習と推論に最適化。Ignite 2023 - Publickey
-
「Maiaは…そしてすでにGitHub Copilotを含む多くの我々のサービスで使われている。まず我々のワークロードで使い始め、その後サードパーティのワークロードへも展開していく」(ナデラCEO)
-
- 垂直統合だ
-
垂直統合とは、企業グループが、製品やサービスを供給するためのバリューチェーンに沿って、付加価値の源泉となる工程を取り込むことをいいます。
-
- 関連: MSと契約締結、サム・アルトマンも出資する核融合発電スタートアップに話を聞いた | Business Insider Japan
- 5/10 Helion announces world’s first fusion energy purchase agreement with Microsoft | Helion
- 電力・チップからサービスまで統合しつつある
-
-
現状の製品の設計を前提にして汎用の機能としてLLM機能の追加を考えることは現状の抽象度を暗黙に仮定することになる
- Cybozu Days Keynoteで「今はインターネット黎明期のようなもの」と話した
- 0→1のビジネスモデル探索が必要な時期
- 「見つけるべきもの」がなんなのかまだわからないが、それが既存製品と連続的なものだと思い込んではいけない
- /nishio/街灯の下で鍵を探す
-
ある公園の街灯の下で、何かを探している男がいた。そこに通りかかった人が、その男に「何を探しているのか」と尋ねた。すると、その男は、「家の鍵を失くしたので探している」と言った。通りかかりの人は、それを気の毒に思って、しばらく一緒に探したが、鍵は見つからなかった。そこで、通りかかりの人は、男に「本当にここで鍵を失くしたのか」と訊いた。すると、男は、平然としてこう応えた。「いや、鍵を失くしたのは、あっちの暗いほうなんですが、あそこは暗くて何も見えないから、光の当たっているこっちを探しているんです」
-
-
nishio 「AIに仕事を奪われる」みたいな1の思考してる人、システムの理解を高めるためにFactorioをした方がいいのではないか(唐突)
- 1の入力で2の出力が出てた変換装置が、3の出力を出すようになるのが生産性の向上
- この時に下流のネットワークに十分な需要があるなら効率がアップする
- たとえば「実装すべき機能がたくさんあるけどエンジニアの手が足りてない」的な状況ではよりたくさんの機能を実装できるようになる
- 未充足の需要がたくさんあるから
- しかし需要がないなら下流の在庫が積み上がったりベルトコンベアが埋まったりしてその生産装置の稼働率が下がる
- 企業の税務処理のタスクはだいたい充足されていて、1.5倍に需要が増えたりしない
- なので1.5倍の生産性向上が起きたら3人に1人必要なくなる
- この時、アメリカでは不要になった人を解雇する
- この時に下流のネットワークに十分な需要があるなら効率がアップする
-
- from 仕事に役立つ新・必修科目「情報Ⅰ」
- 自発的か会社の命令かによらず”社内を個々人が移動”が発生していく
- どこに移動していくかというと:
- 1: システム開発(この本の冒頭の「プログラミング教育の必修化」が行われた話につながる)
- 2: 直接システム化されない「世界とのインターフェース」部分の仕事(図の下部)
- 3: 「ノウハウ」矢印の中に入って情報を抽出伝搬する役割
- 追記: 少数だけどもちろん「経営者」に移動する人もいるだろう
どうすれば良いのか
- 何をやっていくのが正しいのか
- 議論しても多分コンセンサスに至らない
- コンセンサスに至るのを待つことはよくないことだと思う
- 勝手に色々やっていく
僕の今のターゲット: 要約
- 自分が本を読んで理解するプロセスで何が行われているのか
- 書籍全体よりもデータ量の少ない表現になっていってる
- 広い意味で「要約」
- その上でリンクの接続が行われている
- 書籍全体よりもデータ量の少ない表現になっていってる
- 要約は曖昧概念
- 「要約」という言葉で表現されるタスクにおそらくいくつかのことなったものがある
- それを表現する言葉が熟してないため言葉でLLMに指示をすることが困難
- 一方で「大きな入力を受け取るタスク」なのでFew shotsの事例でやってほしいことを表現するのも困難
- データを作ってファインチューニング
- この方針が正しいかどうかはわからないし数ヶ月後にはまた別のことをしているかもしれない
- だが思考によって「やってみなければわからないこと」の森の入り口に到達したので、分け入ってみるしかない
Q&A
- そんなに変化しないのでは
- そうかもしれないし、そうでないかもしれない。正常性バイアスで「変化しない」側に認知が偏る傾向がある。