サムネイル画像

ollamaを仮想マシンに割り当てていざ何か作ってみようと思ったときに、まずは長年撮りためてきた写真の向きを自動で変えるというものが作りたかった。

具体的にはiPhoneなどのスマートフォンのカメラで撮影していると、縦横で撮影すると必ずしも写真撮影した向きが保持されることがない。

これをAIが自動で修正してくれるといったものを作ろうと思っていた。

コンピュータビジョンで物体を認識させ、それぞれの角度で最もスコアが高いものを採用するといったものを考えていた。

しかし実際にはexiftranといったコマンドがあるようでこれを使うとEXIFファイルの情報から向きを修正してくれるようで、圧倒的に早く正確だった。

そこで次に始めたのが今回のタイトルにあるブックマークにカテゴリとタグをつけて整理するというもの。

私はLinkWardenというオープンソースのブックマーク管理するツールを利用している。

といってもブックマークは追加するだけでほとんどあとから見返すものもないのだが、せっかく自分の興味を可視化できるのだからこれを活用しない手はないと思った。

以前紹介したGPUではなくサーバー用途なので仮想マシンにはやや古めかしいGPUを使用している。1

現時点ではまだ完成していないのだが、カテゴリとタグのタグは特に苦労しなかった。

というのもタイトルとURLからカテゴリとタグを推論させるのはLLMの得意分野なのでそこはよい。

問題なのは適切なカテゴリかどうかだと一気に難しくなる。

例えばLLMを使ったことがあると理解できるが同じプロンプトに対して必ずしも同じ出力が得られるとは限らない。

そのためカテゴリは様々なバリエーションがあるのだが、実際に機能するカテゴリというのは少なければ少ないほどよいわけだ。

具体例としては:

  • Artificial Intelligence
  • Artificial Intelligence & Digital
  • Art Artificial Intelligence (AI) Education / Learning Resources
  • Artificial Intelligence / Chatbots

これらはすべてArtificial Intelligence、けだし単にAIでよいはずだ。

こういったカテゴリを最小限まで絞っていくというと人間であれば(面倒なだけで)そこまで難しくはないが、AIにすべてを丸投げするにはまだ難しいようだ。

ただし露骨に電力は消費するようなので、使いどころは考えないといけないかもしれない。

UPSのけたたましいアラート音はどうも心臓によくない。

再帰的に何度かプロンプトを投げる構想はあるのだが、気づけば日曜日も終わってしまったのでまだ完成してはいないけれども投稿にすることにした。

実際ollamaを使えるようになると一気にwebアプリケーションの選択肢が広がるので面白いと思う。

今回はgoを使っているが、少なくともollamaを利用するだけならREST API経由なので言語の制約も受けないのもよい。


  1. GPUパススルーは前回の投稿を参照していただきたい