やっとGIF加工とOCRが終わった!
OCRサービスの提供について目処が立ってきた。
さくらVPSに入れたgoogle tesseractがGIFの読み込みでエラーになっていて途方に暮れていた。
GIF用のファンクションが入っていない? make前に設定する必要があった?
というところまでは想像してみたが、どうにもならんかった。
結局、INPUTであるGIFアニメーションに対する対処をした後にJPEGに変換してOCRに掛けることにした。
OCRは、なぜか1文字しかない画像は認識してくれないのだが、数文字あれば認識してくれる。
判断材料が増えるからなのかな。
まあいい。
とにかく睡眠だ!
明日は、最低でも自分が使うことができるようになっていたい。
その後のレシピをメモ
- さくらVPSに上げる
- 自分で使ってみる
- 途中で固まってしまったり遅延が発生するようにならないかパフォーマンスチェック
- もっともっと負荷を掛ける。10秒間に100リクエストを処理したいな。
- tesseractは一度ファイルに落とすからパフォーマンスが悪そうなんだよな。
- ユーザ管理。ユーザ管理が面倒だから現在稼動しているRedmineをSNS化してしまいたい。実績調査。
- Redmineと連携してOCRサービスに認証機能を入れる。
- あ、OCRで抽出したテキストを画面に表示していなかった。肝心なところを・・・。
- 出力ファイルが固定なので重複しないように工夫が必要。セッションIDにしようかな。でもメモリ使用量増やしたくないな。
- RedmineのMySQLにはパスワードは生のままで保存されないよな。OCRと連携するためには同じハッシュ処理をしないといけないので少し面倒かも。
- ああ、あと、もう1パターンの画像にも対処しておきたい。まだ何も手をつけていないので簡単に対処できるのならやっておきたい。
- む、すぐ調べてみようと思ったら、ソースいじってて動かん。。。明日にしよう。おやすみなさい。