2ch勢いランキング 全部 1- 最新50

2013年、最強のOCRは?


[] 2013/07/31(水) NY:AN:NY.AN:wsG9QjLf
読取革命
e.typist
Adobe Acrobat
PDF Xchange Viewer
読んde!!ココ
ScanSnap Organizer
とか

電子化する大きなメリットとなる検索可能な自炊本にするためのOCR情報スレdeath
[] 2013/12/09(月) 16:57:57.89:sxshqx1w
e.typistのpdf出力の画質って設定で変えられるのね。
使えないと思ってたのが使えるようになったわ。
まったく、何でデフォルトが最低画質なんだか、、、
[sage] 2013/12/09(月) 19:59:41.86:YK1q4d3s
e.typist使ってるけど、ルビまでいい感じで読み取るけど?
そのまま青空形式でルビを書き込むようにしてる。
[sage] 2013/12/09(月) 21:40:25.53:nWZ+r3Cm

え、それほんと?
初耳

電子インクの電子書籍端末がいい感じで普及してきたのに、ルビつきのepubが簡単に自炊できるソフトがないことが最大のネックになってた
[sage] 2013/12/10(火) 00:11:47.09:ZC2PoFMy
e.typist neoの出荷メール来た
読取と両方試用版試したけど決め手はルビ出力の可否
認識率は本文より低い感じだけど二重山カッコでくくってくれるので
底本参照の校正がはかどるのではないかと思いまして

とは言え認識率が100パーで無い限り底本突合せで間違い探しする訳で根気ないと無理ですねこれは
どうしても残したく且つ電書化の可能性が限りなく低そうな手持ちの本限定…って感じです
[sage] 2013/12/10(火) 00:22:53.69:u4muTkK4
青空形式のルビ《 》もルビ開始位置の|も指定できるけど、本文でさえ校正が大変なのにルビまでは出来んわ
[] 2013/12/20(金) 19:26:33.98:YWA5PXvs
未だにsmartOCRをDLできる国外サイトいっぱいあるけど
あれって英数字だけだと月並み。
結局利用者は大概日本人か
[sage] 2013/12/23(月) 20:43:32.27:c3bY1Jmf
OCRは、高圧縮pdfを吐かせるためで
誤認識は気にしない、だいたい認識してくれれば検索も役には立つ
と割り切って無修正で使っている
[sage] 2014/01/28(火) 12:26:31.55:ncWCbP7Q
google docsが最強だろjk
しかも無料だし
[sage] 2014/04/21(月) 21:56:35.66:FL5+PVqW
OCRするとき、下準備やった方が良いのかな?
ChainLPでレベル補正とガンマ補正したら認識率上がるような?
[sage] 2014/06/01(日) 13:41:10.19:gZHlEIFi

上がるよ、フォトショで背景全部飛ばして文字の太さやらも調整する
[sage] 2014/06/01(日) 13:44:08.20:4XblVqBZ

ホントにホントに?
[sage] 2014/06/05(木) 10:44:39.50:5NUrKheB
書籍は画像で保存していて、
OCRかけて検索可能PDFにするのは自分は諦めてるんだけど、
画像内の文字列をちょこっと選択して、
Google検索だけしたいとはよく思う。
[sage] 2014/08/07(木) 08:08:09.99:nQfWpHNh
ビューアでそんなの出てほしいな
手動で範囲選択してそこだけOCRかけてweb検索やら辞書検索やらする
[sage] 2014/12/25(木) 21:01:09.03:5hKxSpYV
読取革命のアクチベーションはどのバージョンからですか?
[sage] 2015/03/24(火) 00:36:12.86:4AGjMhFZ
うちの文鳥は特別に可愛い
たぶん他のところのより可愛い
そうとしか思えないくらい可愛い

でもそう思っている飼い主ってけっこう多い?
[sage] 2015/05/01(金) 05:36:53.74:iCfLgs4D
読んde!!ココ パーソナル(エプソン版)

画像の読み込みは白黒でしか対応していないため、
モノクロビットマップに変換してやる必要がある。
※元ファイルを消してしまわないため、コピーを別ディレクトリに保存した方が安全。

とりあえず光学文字認識をしてしまい、あとは愛用のエディタを用い、
元ファイルの画面を参照しながら手作業で直していく。
自動文章認識機能に頼りきっていては、なめらかな文字認識ができないため、
きめ細かな修正はやはりオペレーター(ユーザー)が行うしか無いのだ。

Google翻訳で日本語から英語へ翻訳する際、長文のニュースサイト、
論文とかは翻訳にあたってのコツはいちいち使えませんよね。
そこで、Google翻訳ツールセットを用い、おかしな翻訳は
ユーザーが手作業で修正する。それと同じ。
[sage] 2015/05/17(日) 21:46:03.08:tp97P1Sy
パナソニックの体験版ずっと前に使ったらしく
テスト出来なかったので
とりあえず体験版で上手くいったんでe.Typist NEO買っちゃった。
パナのばか野郎

ちゃんと段落指定しないと文字間にスペースが入ったりするからめんどくさいけど
ルビもしっかり読み取るし
右クリックですぐ検索できて素敵なPDFライフ送ってます
スキャンしたjpgファイルのゴミの山が宝の山に化けたぞ!
[] 2015/11/11(水) 15:39:24.99:CAbtX60K
2010年購入image scanner CanoScan 5600F付属の読取革命Lite v.1.09。
Web pageにあるJPEGなどの画像表示、つまりそのままテキスト文でcopy&paste
できないものをテキストデータに変換したい時がたまにある。
画面キャプチャ(snipping tool)によるclip boardを入力データとして読み
込んで、文字認識させてテキスト文にする。

最近5年ほどでOCR softwareの文字認識能力が格段に向上したというけど、
私の使っているものは読み間違えが多い。
画数の多い漢字は正確に認識しにくいが、英字などで"i"&"l"&"1", "o"&"0"
などは必ず間違っている。
[sage] 2016/01/19(火) 15:11:19.09:mq3Mk8xh
etypistがえらい勢いで良くなってるな
読取はルビ読み取れないが eは読む
[sage] 2016/02/02(火) 12:46:48.20:8rKEDg16
etypist15の発売日2013年やないか
[] 2016/04/06(水) 20:44:12.53:0vG9P8H4
☆ 日本の核武装は早急に必須です。☆
総務省の、『憲法改正国民投票法』、でググってみてください。
日本国民の皆様方、2016年7月の『第24回 参議院選挙』で、日本人の悲願である
改憲の成就が決まります。皆様方、必ず投票に自ら足を運んでください。お願い致します。
[sage] 2016/07/29(金) 17:23:08.48:chwtCP1b
etypist、性能はいいんだが
読み込み時にいちいちウインドウがアクティブになるので
他の作業が出来なくなるのがうざい
別にアクティブになる必要ないだろ
[sage] 2016/08/02(火) 21:34:27.65:xQSe+qqJ
OCRソフトで、原稿のフォントを指定すると
認識精度が上がる機能があればいいのにな
ゴシックと明朝、フトコロの大小だけでも
だいぶ精度が上がりそうなのに
[sage] 2016/08/13(土) 09:58:07.95:cdpMErTk
活字なら文字の大きさも一定だし、フォントとか認識できれば、言偏が分解されたりせずに済みそうだよね
[] 2016/09/22(木) 00:19:47.24:ZZVNIQT0
認識率98.66%?!たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた
ttp://jump.5ch.net/?https://bita.jp/dml/reactive_int
[sage] 2016/10/06(木) 14:45:13.21:skZ2qPPb
体験版で精度をチェックしたいのに製品版と性能が違うのもあるらしいから困る
[sage] 2016/10/07(金) 09:30:18.61:jp9s72R4
FineReader買ったけどいいね。
[] 2016/10/07(金) 23:42:03.50:F621ToTQ

学習が日本語対応してないのが痛い
[sage] 2016/10/10(月) 07:22:47.51:xE3A06X4

実質、英文のOCR専用でしょう
日本のOCRソフトで英文OCRやってもグダグダなのと同じだと思う
洋書を電子化するにはなかなか良いソフトだと思う
[sage] 2016/10/10(月) 13:04:37.24:MNrX4hom
ホームページ見ると英語なら読取革命もABBYY社製エンジンだね
ちなみにe.typistはNuance社製
[sage] 2016/10/11(火) 01:30:01.21:eksnS3tm

俺はttp://jump.5ch.net/?http://monomania.sblo.jp/article/55737163.htmlで↓を読んでFineReaderを買うことにした。
>>読取革命は英語の部分はFine Readerという英語圏では最も信頼性が高いOCRを採用していますが、エンジンを上手く生かし切れていません。
[] 2017/07/08(土) 18:41:50.55:xQlgvdQ3
eTypistは認識中にウィンドウがアクティブになるのを防げんのかね
[] 2017/07/09(日) 16:06:20.21:iESi7AYh

確かに。読取革命とは対照的に、処理中はPCを
事実上専有されてしまい困るね。

googleのAPIを試してみたら、認識精度は相当良かった。
今は(たぶん)アプリがないので敷居は少し高いが、
将棋といい、今後はAIの方向性になっていくのかな。
[sage] 2017/07/11(火) 00:20:04.02:EO4izff5
パナソニックがすでにAIとかディープラーニングを投入した手書き文字
対応の帳票OCRソフトを発売しています

ttp://news.panasonic.com/jp/topics/148335.html

お値段もいいっすね。

・帳票OCR Ver.8 クライアント版:398,000円(税抜)
[] 2017/07/12(水) 19:51:06.12:yQE9Ft7A

お値段張りますね。個人にはちょっと手が出ません。

個人的にはGoogle cloud visionで満足ですが、
誤認識のフィードバックや学習機能はないですね。
[sage] 2017/08/20(日) 10:04:39.07:2KZZB/L/
Google Cloud Vision OCR使って検索可能なpdf作るコマンド昔作ったけど、Googleがjsonの形式変えて後ろに余計なものつけたせいで使えなくなったw
直したいけどヒマないな…

ttp://jump.5ch.net/?https://github.com/dinosauria123/gcv2hocr

Linux用。Bash on Windowsでも使える。
[] 2017/08/24(木) 19:50:24.14:m5h5ZsxQ

素のWindows環境なので試せませんが、
検索可能PDFはいい考えですね。

高級言語を何も知らないので、標準のPowershellで
フロントエンド部分のスクリプトを作ってみたら、
Google Cloud Vision、結構いいかも。
文庫本一冊あたり数分でテキスト化できるようになった。
[sage] 2017/08/24(木) 20:11:01.05:mY06hxQc
Google Cloud VisonのOCR, いいですよね。

古いカメラ好きで、戦前戦中期のカメラ広告のデータベースを作ろうとしてるのですが、
他のOCRよりかなり良くて重宝してます。

全てが読めるわけではないですが、ものによっては広告の見出しのロゴなども読み取れます。

ちなみにテスト中のサーバーはこちらです。
縦書きがひっくり返ったり、画像が出なかったりとまだうまくいかないのですがw

ttp://jump.5ch.net/?http://104.197.98.173/

スクリプトは公開されますか?興味ありますw
[sage] 2017/08/24(木) 20:51:11.80:mY06hxQc
Google Cloud Visionを使ったOCRソフトが1480円だそうです。いいかも。

ttp://jump.5ch.net/?http://n.shop.vector.co.jp/service/catalogue/ppocr/
[sage] 2017/08/24(木) 21:10:00.64:mY06hxQc
すまん、これTesseractベースらしいw
[sage] 2017/09/21(木) 15:18:37.11:oeq2WaFN
Googleドライブのサービスが終わることが決まったらしい

てことはOCR民に重宝されていたGoogleドライブを経由して上げたjpgから文字化するあのシステムも失われてしまうのだろうか
[sage] 2017/09/21(木) 15:29:09.54:oeq2WaFN
と思ったけど機能発展かなんかの流れで推移して仕組みが変わるだけでそういったシステムが無くなるわけではないのかな
よくわからんね
[sage] 2017/09/26(火) 18:13:31.59:L30pb7J/
手書きOCRの記事をよく読むけど、手書きであの精度がでるなら、活字は100%近い精度が得られそうな気がするけど、どうなんだろうね?
[sage] 2017/09/27(水) 16:30:29.45:kyhjOBdx
記事のための
[sage] 2017/12/30(土) 01:13:36.18:vWdc5/Pn
☆ 私たち日本人の、日本国憲法を改正しましょう。現在、
衆議員と参議院の両院で、改憲議員が3分の2を超えております。
『憲法改正国民投票法』、でググってみてください。国会の発議は
すでに可能です。平和は勝ち取るものです。お願い致します。☆☆
[] 2018/01/12(金) 08:46:36.99:OG0vqAvx
電子書籍のように無料で稼げる方法
グーグル検索⇒『稲本のメツイオウレフフレゼ

Z9GSY
[sage] 2018/02/28(水) 23:51:50.98:pigZ9q4r
Google Cloud Vision APIで透明テキストのPDF作ってみたんだけど、abbyy finereaderとか、e-typist、読み取り革命とか、捨ててもいいレベルですね。
何万も掛けて買って、精度の悪さにがっかりしていたのがバカバカしくなるレベル。
Google Cloud Vision APIのOCRはマジでおすすめ。
[] 2018/05/29(火) 15:55:16.34:20k4ukZr
IDSP8
[sage] 2018/09/30(日) 02:03:47.28:7yJ8ed3M
ttps://imgur.com/7FjSs7h.jpg
[sage] 2019/04/22(月) 13:32:08.24:S+OQcRwJ
LINEの新機能がOCR機能を搭載してたようだよ(現在PC版とAndroid版のみの機能)

Googleやtesseractと比べてどうなのかな?

こうなるとLINEの友達にOCR変換投げつけ用アカウントの人をどこかで用意しなきゃならん

勢い5万以上のスレをメールでお知らせするサービス、実施中!!
憧れボディをGETしたい!その夢、ボニックで!

2ch勢いランキング 全部 1- 最新50 電子書籍板ランキング

凡例:

レス番

100 (赤) → 2つ以上レスが付いている
100 (紫) → 1つ以上レスが付いている

名前

名無しさん (青) → sage のレス
名無しさん (緑) → age のレス

ID

ID:xxxxxxx (赤) → 発言が3つ以上のID
ID:xxxxxxx (青) → 発言が2つ以上のID

このページは2ch勢いランキングが作成したキャッシュです。元のページはこちら。削除についてはこちら