from 日記2023-09-18 AIによる英語化の考察 2023-09-19 image nishio.icon日本語のWikiに日々文章を書いていて、それを英語に自動的に機械翻訳している。その質に満足できない時がある。今はその不満を解消することのハードルが高い。それは自動的な機械翻訳のせいで英語版を修正しても次に日本語版を修正したら上書きされてしまうからだと気づいた。どうするのが良いか? gpt.icon日本語のWikiの内容を英語に翻訳する際に質の問題が出ているとのこと、以下の提案をします:

  • 同期の停止:日本語版と英語版の自動的な同期を一時的に停止することを検討してみてください。これにより、日本語版を更新しても英語版が上書きされることはなくなります。
  • 手動の翻訳改善:一度自動翻訳を行った後、英語のネイティブスピーカーや専門家に翻訳をチェック・修正してもらうのが良いでしょう。
  • 翻訳ソフトウェアの見直し:使用している機械翻訳のツールやサービスを見直すことも考えてみてください。近年、多くの進化が見られるので、より高品質な翻訳を行うツールがあるかもしれません。
  • バージョン管理:日本語版と英語版の内容を別々に管理するシステムを導入することで、それぞれの内容を独立して更新できるようにすると良いでしょう。
  • 通知システムの導入:日本語版に変更が加えられた際に、英語版の担当者や翻訳者に通知するシステムを設けることで、必要に応じて英語版の更新や再翻訳を行うことができます。 最終的には、自動翻訳の便利さと翻訳品質のバランスを見つけることが大切です。

正論of正論!

  • いまの全ページを翻訳の対象としているのを停止する
  • Pioneer modeによる「リンクで指示されたページをAI書き込みの対象とする」のメカニズムを取って「リンクで指定されたページを翻訳の対象とする」を作る
  • 今のAI生成ページと同じように変換時刻を記録する?
    • 元の日本語の変換時刻、英語への変換開始時刻、英語版への変換終了時刻、英語版への書き込み時刻、全部異なる
    • 翻訳を書き込んだ後に英語版で修正が行われていないか検知するためには英語版書き込み時刻をベースにしなければならない
  • どのような修正をしたくなるか、の情報が今は蓄積していない
    • それは僕が単語置換による修正メカニズムを先に作ってしまったせい
      • それで実現できるようなものはそこに書かれるが、実現できないものが書かれない
    • 多分表層的な「この単語はこれになって欲しい」「こう翻訳されることがあるがこうなって欲しい」の束ができて、それから、それでは表現できないような深い意味的なものが明確になる
      • 表層の例
        • 「西尾泰和」を「Yasukazu Nishio」にするな。「NISHIO Hirokazu」にせよ
          • 「AをBにするな、Cにせよ」構造
            • 日本語の側をA→Cしてから翻訳する方法と、翻訳された英文にB→Cする方法がある
            • [/villagepump/ScrapboxTranslator v2を作る](https://scrapbox.io/villagepump/ScrapboxTranslator v2を作る)
            • タイトルを翻訳してから渡している
      • 深層の例

加筆9/19

  • 翻訳されて「その翻訳ではよくない」と思うような概念は意味のある一塊の概念なのでページタイトルであることが正しい?
    • かもしれない

英語化」という表現は「翻訳とは限らない」というニュアンス

Fine-tuningしたGPT3.5で英語生成する?

9/20 GPT3.5のファインチューニングをやる手も