Please enable JavaScript.
Coggle requires JavaScript to display documents.
shippio forwarder (貿易書類 OCR (OCR精度調査 (さらに精度を上げるには? (透かし・ノイズ問題?…
shippio forwarder
貿易書類 OCR
プロダクトの背景
現状大量の①House BL、②Arrival Notice、③Commercial Invoice&PackingListなどの入力が、人間の手作業によって入力されている。その入力を機械学習で置き換えられないか?
OCR精度調査
google vision API
-
-
精度は高い。見たところ、元々のスキャン精度が高い。
辞書を挟んでいるため、文章などに強い。ただ無駄に置き換えられてしまうことがある。それを無効に出来るAPI要チェック。
透かしには比較的弱くはないが、ただ精度が50%くらいになる。
-
-
-
-
cogentlab
-
月々定額
3万円 / 2,500枚 12円/枚
30万円 / 30,000枚 10円/枚
300万円/ 350,000枚 8円/枚
-
位置情報系(OpenCV MSER)
- 入力位置検出
- 単語区切り位置検出
文字認識系(Deep Learning)
*この辺りから調査開始する
- CNN
- LSTM layers
- Connectionist Temporal Classification Layer
-
OCRpy
Another OSS developed by indivisuals
Quite modern stack, decently active, well documented
-
However, it doesn't work on macos 10.12 (as of 7/12 by my effort). Not tested yet...
-
-
-
-
(精度)Deeplearningによって格段にアップした
(価格)1ページ平均2円程度に収まる見込み
(一旦の結論)現状google cloud vision APIがコストの面、信頼性の面で優勢。次は精度を上げて、安定させることが重要。業界に特化することや、お客様の細かい要望に答える意味でも、独自辞書作りや細かいアルゴリズムチューニングのための、社内自作も必要。
また、コンフィデンススコアなど細かいAPIは要チェック
-
Open CV MSER
全体ロジック(構想)