OpenAI APIのサンプルコードではこんなことが書いてある python

def get_embedding(text, model="text-embedding-ada-002"):
   text = text.replace("\n", " ")
   return openai.Embedding.create(input = [text], model=model)['data'][0]['embedding']

空白と改行自体は異なるトークンになっているのに、なぜ置換が必要なのか?本当に必要なのか?と疑っていたが、置き換えた方が結果が良くなるからだという記述があった。

追試はしていない

  • 日本語でもそうなのかは怪しい
  • が、まあ従っておこうかなという気持ち

OpenAI API