2013年、最強のOCRは?
: [] 2013/07/31(水) NY:AN:NY.AN:wsG9QjLf 読取革命 e.typist Adobe Acrobat PDF Xchange Viewer 読んde!!ココ ScanSnap Organizer とか 電子化する大きなメリットとなる検索可能な自炊本にするためのOCR情報スレdeath : [] 2013/12/09(月) 16:57:57.89:sxshqx1w e.typistのpdf出力の画質って設定で変えられるのね。 使えないと思ってたのが使えるようになったわ。 まったく、何でデフォルトが最低画質なんだか、、、 : [sage] 2013/12/09(月) 19:59:41.86:YK1q4d3s e.typist使ってるけど、ルビまでいい感じで読み取るけど? そのまま青空形式でルビを書き込むようにしてる。 : [sage] 2013/12/09(月) 21:40:25.53:nWZ+r3Cm え、それほんと? 初耳 電子インクの電子書籍端末がいい感じで普及してきたのに、ルビつきのepubが簡単に自炊できるソフトがないことが最大のネックになってた : [sage] 2013/12/10(火) 00:11:47.09:ZC2PoFMy e.typist neoの出荷メール来た 読取と両方試用版試したけど決め手はルビ出力の可否 認識率は本文より低い感じだけど二重山カッコでくくってくれるので 底本参照の校正がはかどるのではないかと思いまして とは言え認識率が100パーで無い限り底本突合せで間違い探しする訳で根気ないと無理ですねこれは どうしても残したく且つ電書化の可能性が限りなく低そうな手持ちの本限定…って感じです : [sage] 2013/12/10(火) 00:22:53.69:u4muTkK4 青空形式のルビ《 》もルビ開始位置の|も指定できるけど、本文でさえ校正が大変なのにルビまでは出来んわ : [] 2013/12/20(金) 19:26:33.98:YWA5PXvs 未だにsmartOCRをDLできる国外サイトいっぱいあるけど あれって英数字だけだと月並み。 結局利用者は大概日本人か : [sage] 2013/12/23(月) 20:43:32.27:c3bY1Jmf OCRは、高圧縮pdfを吐かせるためで 誤認識は気にしない、だいたい認識してくれれば検索も役には立つ と割り切って無修正で使っている : [sage] 2014/01/28(火) 12:26:31.55:ncWCbP7Q google docsが最強だろjk しかも無料だし : [sage] 2014/04/21(月) 21:56:35.66:FL5+PVqW OCRするとき、下準備やった方が良いのかな? ChainLPでレベル補正とガンマ補正したら認識率上がるような? : [sage] 2014/06/01(日) 13:41:10.19:gZHlEIFi 上がるよ、フォトショで背景全部飛ばして文字の太さやらも調整する : [sage] 2014/06/01(日) 13:44:08.20:4XblVqBZ ホントにホントに? : [sage] 2014/06/05(木) 10:44:39.50:5NUrKheB 書籍は画像で保存していて、 OCRかけて検索可能PDFにするのは自分は諦めてるんだけど、 画像内の文字列をちょこっと選択して、 Google検索だけしたいとはよく思う。 : [sage] 2014/08/07(木) 08:08:09.99:nQfWpHNh ビューアでそんなの出てほしいな 手動で範囲選択してそこだけOCRかけてweb検索やら辞書検索やらする : [sage] 2014/12/25(木) 21:01:09.03:5hKxSpYV 読取革命のアクチベーションはどのバージョンからですか? : [sage] 2015/03/24(火) 00:36:12.86:4AGjMhFZ うちの文鳥は特別に可愛い たぶん他のところのより可愛い そうとしか思えないくらい可愛い でもそう思っている飼い主ってけっこう多い? : [sage] 2015/05/01(金) 05:36:53.74:iCfLgs4D 読んde!!ココ パーソナル(エプソン版) 画像の読み込みは白黒でしか対応していないため、 モノクロビットマップに変換してやる必要がある。 ※元ファイルを消してしまわないため、コピーを別ディレクトリに保存した方が安全。 とりあえず光学文字認識をしてしまい、あとは愛用のエディタを用い、 元ファイルの画面を参照しながら手作業で直していく。 自動文章認識機能に頼りきっていては、なめらかな文字認識ができないため、 きめ細かな修正はやはりオペレーター(ユーザー)が行うしか無いのだ。 Google翻訳で日本語から英語へ翻訳する際、長文のニュースサイト、 論文とかは翻訳にあたってのコツはいちいち使えませんよね。 そこで、Google翻訳ツールセットを用い、おかしな翻訳は ユーザーが手作業で修正する。それと同じ。 : [sage] 2015/05/17(日) 21:46:03.08:tp97P1Sy パナソニックの体験版ずっと前に使ったらしく テスト出来なかったので とりあえず体験版で上手くいったんでe.Typist NEO買っちゃった。 パナのばか野郎 ちゃんと段落指定しないと文字間にスペースが入ったりするからめんどくさいけど ルビもしっかり読み取るし 右クリックですぐ検索できて素敵なPDFライフ送ってます スキャンしたjpgファイルのゴミの山が宝の山に化けたぞ! : [] 2015/11/11(水) 15:39:24.99:CAbtX60K 2010年購入image scanner CanoScan 5600F付属の読取革命Lite v.1.09。 Web pageにあるJPEGなどの画像表示、つまりそのままテキスト文でcopy&paste できないものをテキストデータに変換したい時がたまにある。 画面キャプチャ(snipping tool)によるclip boardを入力データとして読み 込んで、文字認識させてテキスト文にする。 最近5年ほどでOCR softwareの文字認識能力が格段に向上したというけど、 私の使っているものは読み間違えが多い。 画数の多い漢字は正確に認識しにくいが、英字などで"i"&"l"&"1", "o"&"0" などは必ず間違っている。 : [sage] 2016/01/19(火) 15:11:19.09:mq3Mk8xh etypistがえらい勢いで良くなってるな 読取はルビ読み取れないが eは読む : [sage] 2016/02/02(火) 12:46:48.20:8rKEDg16 etypist15の発売日2013年やないか : [] 2016/04/06(水) 20:44:12.53:0vG9P8H4 ☆ 日本の核武装は早急に必須です。☆ 総務省の、『憲法改正国民投票法』、でググってみてください。 日本国民の皆様方、2016年7月の『第24回 参議院選挙』で、日本人の悲願である 改憲の成就が決まります。皆様方、必ず投票に自ら足を運んでください。お願い致します。 : [sage] 2016/07/29(金) 17:23:08.48:chwtCP1b etypist、性能はいいんだが 読み込み時にいちいちウインドウがアクティブになるので 他の作業が出来なくなるのがうざい 別にアクティブになる必要ないだろ : [sage] 2016/08/02(火) 21:34:27.65:xQSe+qqJ OCRソフトで、原稿のフォントを指定すると 認識精度が上がる機能があればいいのにな ゴシックと明朝、フトコロの大小だけでも だいぶ精度が上がりそうなのに : [sage] 2016/08/13(土) 09:58:07.95:cdpMErTk 活字なら文字の大きさも一定だし、フォントとか認識できれば、言偏が分解されたりせずに済みそうだよね : [] 2016/09/22(木) 00:19:47.24:ZZVNIQT0 認識率98.66%?!たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた ttp://jump.5ch.net/?https://bita.jp/dml/reactive_int : [sage] 2016/10/06(木) 14:45:13.21:skZ2qPPb 体験版で精度をチェックしたいのに製品版と性能が違うのもあるらしいから困る : [sage] 2016/10/07(金) 09:30:18.61:jp9s72R4 FineReader買ったけどいいね。 : [] 2016/10/07(金) 23:42:03.50:F621ToTQ 学習が日本語対応してないのが痛い : [sage] 2016/10/10(月) 07:22:47.51:xE3A06X4 実質、英文のOCR専用でしょう 日本のOCRソフトで英文OCRやってもグダグダなのと同じだと思う 洋書を電子化するにはなかなか良いソフトだと思う : [sage] 2016/10/10(月) 13:04:37.24:MNrX4hom ホームページ見ると英語なら読取革命もABBYY社製エンジンだね ちなみにe.typistはNuance社製 : [sage] 2016/10/11(火) 01:30:01.21:eksnS3tm 俺はttp://jump.5ch.net/?http://monomania.sblo.jp/article/55737163.htmlで↓を読んでFineReaderを買うことにした。 >>読取革命は英語の部分はFine Readerという英語圏では最も信頼性が高いOCRを採用していますが、エンジンを上手く生かし切れていません。 : [] 2017/07/08(土) 18:41:50.55:xQlgvdQ3 eTypistは認識中にウィンドウがアクティブになるのを防げんのかね : [] 2017/07/09(日) 16:06:20.21:iESi7AYh 確かに。読取革命とは対照的に、処理中はPCを 事実上専有されてしまい困るね。 googleのAPIを試してみたら、認識精度は相当良かった。 今は(たぶん)アプリがないので敷居は少し高いが、 将棋といい、今後はAIの方向性になっていくのかな。 : [sage] 2017/07/11(火) 00:20:04.02:EO4izff5 パナソニックがすでにAIとかディープラーニングを投入した手書き文字 対応の帳票OCRソフトを発売しています ttp://news.panasonic.com/jp/topics/148335.html お値段もいいっすね。 ・帳票OCR Ver.8 クライアント版:398,000円(税抜) : [] 2017/07/12(水) 19:51:06.12:yQE9Ft7A お値段張りますね。個人にはちょっと手が出ません。 個人的にはGoogle cloud visionで満足ですが、 誤認識のフィードバックや学習機能はないですね。 : [sage] 2017/08/20(日) 10:04:39.07:2KZZB/L/ Google Cloud Vision OCR使って検索可能なpdf作るコマンド昔作ったけど、Googleがjsonの形式変えて後ろに余計なものつけたせいで使えなくなったw 直したいけどヒマないな… ttp://jump.5ch.net/?https://github.com/dinosauria123/gcv2hocr Linux用。Bash on Windowsでも使える。 : [] 2017/08/24(木) 19:50:24.14:m5h5ZsxQ 素のWindows環境なので試せませんが、 検索可能PDFはいい考えですね。 高級言語を何も知らないので、標準のPowershellで フロントエンド部分のスクリプトを作ってみたら、 Google Cloud Vision、結構いいかも。 文庫本一冊あたり数分でテキスト化できるようになった。 : [sage] 2017/08/24(木) 20:11:01.05:mY06hxQc Google Cloud VisonのOCR, いいですよね。 古いカメラ好きで、戦前戦中期のカメラ広告のデータベースを作ろうとしてるのですが、 他のOCRよりかなり良くて重宝してます。 全てが読めるわけではないですが、ものによっては広告の見出しのロゴなども読み取れます。 ちなみにテスト中のサーバーはこちらです。 縦書きがひっくり返ったり、画像が出なかったりとまだうまくいかないのですがw ttp://jump.5ch.net/?http://104.197.98.173/ スクリプトは公開されますか?興味ありますw : [sage] 2017/08/24(木) 20:51:11.80:mY06hxQc Google Cloud Visionを使ったOCRソフトが1480円だそうです。いいかも。 ttp://jump.5ch.net/?http://n.shop.vector.co.jp/service/catalogue/ppocr/ : [sage] 2017/08/24(木) 21:10:00.64:mY06hxQc すまん、これTesseractベースらしいw : [sage] 2017/09/21(木) 15:18:37.11:oeq2WaFN Googleドライブのサービスが終わることが決まったらしい てことはOCR民に重宝されていたGoogleドライブを経由して上げたjpgから文字化するあのシステムも失われてしまうのだろうか : [sage] 2017/09/21(木) 15:29:09.54:oeq2WaFN と思ったけど機能発展かなんかの流れで推移して仕組みが変わるだけでそういったシステムが無くなるわけではないのかな よくわからんね : [sage] 2017/09/26(火) 18:13:31.59:L30pb7J/ 手書きOCRの記事をよく読むけど、手書きであの精度がでるなら、活字は100%近い精度が得られそうな気がするけど、どうなんだろうね? : [sage] 2017/09/27(水) 16:30:29.45:kyhjOBdx 記事のための : [sage] 2017/12/30(土) 01:13:36.18:vWdc5/Pn ☆ 私たち日本人の、日本国憲法を改正しましょう。現在、 衆議員と参議院の両院で、改憲議員が3分の2を超えております。 『憲法改正国民投票法』、でググってみてください。国会の発議は すでに可能です。平和は勝ち取るものです。お願い致します。☆☆ : [] 2018/01/12(金) 08:46:36.99:OG0vqAvx 電子書籍のように無料で稼げる方法 グーグル検索⇒『稲本のメツイオウレフフレゼ Z9GSY : [sage] 2018/02/28(水) 23:51:50.98:pigZ9q4r Google Cloud Vision APIで透明テキストのPDF作ってみたんだけど、abbyy finereaderとか、e-typist、読み取り革命とか、捨ててもいいレベルですね。 何万も掛けて買って、精度の悪さにがっかりしていたのがバカバカしくなるレベル。 Google Cloud Vision APIのOCRはマジでおすすめ。 : [] 2018/05/29(火) 15:55:16.34:20k4ukZr IDSP8 : [sage] 2018/09/30(日) 02:03:47.28:7yJ8ed3M ttps://imgur.com/7FjSs7h.jpg : [sage] 2019/04/22(月) 13:32:08.24:S+OQcRwJ LINEの新機能がOCR機能を搭載してたようだよ(現在PC版とAndroid版のみの機能) Googleやtesseractと比べてどうなのかな? こうなるとLINEの友達にOCR変換投げつけ用アカウントの人をどこかで用意しなきゃならん
凡例:
レス番
100 (赤) → 2つ以上レスが付いている
100 (紫) → 1つ以上レスが付いている
名前
名無しさん (青) → sage のレス
名無しさん (緑) → age のレス
ID
ID:xxxxxxx (赤) → 発言が3つ以上のID
ID:xxxxxxx (青) → 発言が2つ以上のID
このページは2ch勢いランキング が作成したキャッシュです。元のページはこちら 。削除についてはこちら 。