ImageHash · PyPI GitHub - jgraving/imagehash: A Python Perceptual Image Hashing Module

画像類似検索

  • PNGをローカルでmd5コマンドでダイジェストしたものと、それをGyazoにアップロードした時のURLは一致する
  • しかし画像をScrapboxにコピーペーストした時に自動でGyazoにアップロードされたものはURLが異なる
    • サーバサイドでPNGにする際の設定が異なるなどの理由でファイルの内容が異なるのか
    • この画像をダウンロードしてmd5を見たらURLと一致していた
  • 元画像、Twitterに画像を投稿してtwimgでサーブされた画像、それをローカルに保存したもの、Scrapboxにペーストされたもの、に同じ画像があっても判断しにくい
    • Pythonで画像類似検索をする
    • imgsimとImageHashがある
      • 前者はTorchを使って768次元の特徴ベクトルを作る風
      • clip-ViT-L-14の仲間かな
    • 後者は機械学習を使わない感じ
      • 後者が向いてそう
    • ペーストでアップロードされたハッシュ値の異なる画像もImageHashなら同一と判定できることがわかった