2013年、最強のOCRは?
: [] 2013/07/31(水) NY:AN:NY.AN:wsG9QjLf 読取革命 e.typist Adobe Acrobat PDF Xchange Viewer 読んde!!ココ ScanSnap Organizer とか 電子化する大きなメリットとなる検索可能な自炊本にするためのOCR情報スレdeath : [] 2013/07/31(水) NY:AN:NY.AN:XDrfmrh7 漫画厨しかいない板 : [] 2013/08/01(木) NY:AN:NY.AN:Ikf8/0ZZ 読取革命の一択です ありがとうございました。 : [sage] 2013/08/01(木) NY:AN:NY.AN:bVze+roW 読取革命ってルビを意図的に削除してない? 設定でもルビ関連の項目無いしさ あれがなければNo1なんだが… というか他のソフトが糞過ぎ 「言」を「ニニ口」とか認識しやがる 一文字の大きさにちゃんと切り分けてから認識してくれよ : [sage] 2013/08/03(土) NY:AN:NY.AN:8CRoUIAl 検索pdfにすることを考えると、第二水準漢字に対応しているのが絶対条件だな。 自分は読取革命を使ってるけど、結果の編集をしてると、すぐに画像と認識結果 の位置がずれておかしな事になったり、画像を開いてファイル保存しようとすると、 ファイル名が空欄になっているので、上書き保存するのが面倒だったり、アンドゥ が直前の操作しか対応していなかったりと、いろいろ不満があるけど、さんの 言うとおり、他のソフトが糞すぎて、比較対象になるのは、e.Typistぐらいか。 : [sage] 2013/08/10(土) NY:AN:NY.AN:IGtVviNL 10万とか超えるようなソフトでルビまできっちり認識してくれるOCRはないもんかのう。 : [] 2013/08/13(火) NY:AN:NY.AN:aOL/NH1U 日本語がローマ字じゃないことが諸悪の根源 皆さんの大嫌いな中国の文字とそれを崩した文字は コンピューターには最も不適合な文字になるからな 漢字変換している時間は単なるハンディキャップ 戦後の中途半端な略字化とつまらない現担ぎで昔の 字体もしっかり残って更なる追い討ち 横文字が戦後左から右にならなかったら最悪だったな : [sage] 2013/08/16(金) NY:AN:NY.AN:Oep/GP1S jpegをまとめてOCRに変換できるフリーのソフトでおすすめあります? : [] 2013/08/21(水) NY:AN:NY.AN:DrranbK9 JPEGをどのようにコンパイルすればOCRソフトになるのか俺も知りたい : [sage] 2013/08/22(木) NY:AN:NY.AN:GJenhDot え? : [sage] 2013/08/22(木) NY:AN:NY.AN:jJVQUHVN OCRに変換するとは書いてあるが OCRソフトに変換するとは書いてないぜ? : [] 2013/08/22(木) NY:AN:NY.AN:kTfy9wUl ソフトウェアではなくハードウェアってことか 3Dプリンターを駆使しても難しそうだよ ttp://jump.5ch.net/?http://e-words.jp/w/OCR.html : [] 2013/08/28(水) NY:AN:NY.AN:0hYpHMie 1 : [] 2013/08/28(水) NY:AN:NY.AN:vx12jJVs で、実際どうなの 今のところ読取革命が一番てことでいい? : [sage] 2013/08/28(水) NY:AN:NY.AN:ZcyrYfNw 他よりマシ : [sage] 2013/08/28(水) NY:AN:NY.AN:M83mG89C 精度的にはRealReaderとかも何気にええで 連続処理が出来ない劣化品だが : [sage] 2013/08/28(水) NY:AN:NY.AN:vx12jJVs サンクス : [sage] 2013/08/28(水) NY:AN:NY.AN:F9J3IfKj 読取革命とe.typistの体験版比較したが、精度はe.typistの方が良さそうだった ただ500ページ制限があるみたいだから、長編は一手間掛かりそうだ e.typistはフリガナも認識できるみたいだから青空形式作成に役立つかと思ったけど、フリガナの精度はイマイチ。 あと両方とも「――」が上手く認識できない。 あくまでScansnapで読み込んだ小説の自炊本での比較だから、レイアウト複雑な本とかは分からんけどね。 : [] 2013/08/29(木) NY:AN:NY.AN:oqlTsQta OCRかけるつもりで吸う時は最高画質にしてやらないとやっぱり識字率下がる? SS1500でエクセレントでやるとやたら時間がかかるんだが それを補って余りある識字率ならエクセレントでやる意味があると思って聞いてみた : [sage] 2013/08/29(木) NY:AN:NY.AN:QUAQNAPN 有名なのがこの2つだよね(読んdeココは犠牲になったのだ…) e.Typist v.14.0 体験版(5日間試用) ttp://jump.5ch.net/?http://mediadrive.jp/products/et/index11.html 読取革命Ver.15 体験版(10日間試用) ttp://jump.5ch.net/?http://panasonic.co.jp/avc/pstc/products/yomikaku/demo.html 他にも無料で使えるOCRソフト 一発!OCR Pro7 体験版(10日間試用)←内部の処理は読取革命と一緒 ttp://jump.5ch.net/?http://www.justsystems.com/jp/download/trial/ocr/ RealReader Lite 8(14日間試用)←個人的に一番精度がいいと思う ttp://jump.5ch.net/?http://data-digital.sakura.ne.jp/RealReaderLitePrice.html ABBYY FineReader 11 (15日間試用)←英語のOCRはここが一番有名らしい ttp://jump.5ch.net/?http://finereader.add-soft.jp/ その他 Evernote(画像を上げるとOCR処理してくれる) Google Document(結構精度が高い。ただし横書きのみ) Adobe Acrobat(高い。埋め込みPDF用) Microsoft Word(一応OCR機能が付いている。それなりの精度) : [sage] 2013/08/31(土) NY:AN:NY.AN:fJWlTzxw どっかのブログで「スーパーファインとエクセレントはほとんど違いが無い」って言ってた : [sage] 2013/09/01(日) 21:40:54.11:2MtpbY6l ttp://www.asahi.com/and_M/information/pressrelease/AUT201308300113.html クラウドやモバイル連携に対応した活字OCRソフトウェア「e.Typist v.14.0」リリースのご案内 どうみても15.0の間違いだと思う…… 2013年9月27日(金)発売だってさ。 8月29日移行の購入は無償バージョンアップ出来るみたい。 グダグダと体験版比較してたのが功を奏したわ。 : [sage] 2013/09/01(日) 22:37:37.76:zSi/rdem 8月29日以降というのは29日を含めるのか? 俺29日にアップグレードのダウンロード版買ったんだけど 前のバージョン持ってないからインストール出来ねーw どうなんだコレ : [sage] 2013/09/01(日) 22:49:29.40:2MtpbY6l ttp://mediadrive.jp/topics/2013/20130927et15.html 国内スタンダード活字OCRソフトウェア「e.Typist v.15.0」の販売開始 ttp://mediadrive.jp/campaign/201308/freeupg_et15.html 「e.Typist v.15.0」無償アップグレードキャンペーン オフィシャルのキャンペーンページは<titile>が13.0になってるって…… 29日からだから良いんじゃないの? アップグレード版だけからアップグレード出来るのかは知らんけど。 俺は日本語・英語以外はいらないからNEO買うわ : [sage] 2013/09/02(月) 00:19:50.05:hL48KyBb おーありがとう ダメもとで聞いてみるわw : [sage] 2013/09/02(月) 00:37:09.82:rJqe37In >認識結果の文字をしおり(目次など見たいページにリンクを貼る機能)として設定し、PDFやEPUBファイル内に出力できるようになりました。設定したしおりは目次として活用できますので、ページ数の多い原稿を電子化する時などに便利です。 どゆこと? : [] 2013/09/04(水) 12:35:44.42:XCpczO8P プログラム言語が含まれる本だと e.Typist(欧州言語対応)と e.Typist NEO(日英のみ)で違いがあるのだろうか 双方の体験版がほしいところだな : [sage] 2013/09/04(水) 12:57:09.52:SR9IhJcA 下のようなのは多言語版だと逆に精度落ちるのかね ---------------- 「 ツンドク」という本棚を作って未読、読書中の本をつっこむsql ReadStatus の条件を変えれば、未読と読書中を分けるのも可 BEGIN TRANSACTION; DELETE FROM ShelfContent WHERE ShelfName = ' ツンドク'; DELETE FROM Shelf WHERE Name = ' ツンドク'; INSERT INTO Shelf SELECT STRFTIME('%Y-%m-%dT%H:%M:%f','now'),' ツンドク', ' ツンドク',STRFTIME('%Y-%m-%dT%H:%M:%f','now'), ' ツンドク','custom','false','true','false'; INSERT INTO ShelfContent SELECT ' ツンドク',Content.ContentID, STRFTIME('%Y-%m-%dT%H:%M:%f','now'),'false','false' FROM Content WHERE ContentType = 6 AND Accessibility <= 1 AND ___ExpirationStatus <> 3 AND content .___UserID <>'' AND SUBSTR(ContentID,1,18) <> 'file:///usr/local/' AND IFNULL(content.___FileSize,0) > 0 AND ReadStatus < 2 COMMIT TRANSACTION; : [sage] 2013/09/04(水) 13:04:25.87:0YTpY6gD さすがにソフト内で認識言語の指定はできるでしょ : [sage] 2013/09/04(水) 22:14:43.89:boHrLVpG いや、ページごとに手作業でやるならともかく、 自動でやる場合は「欧文混在の日本語認識」みたいな メッセージになるので、NEOと変換結果が異なると思われる。 そもそもこういうプログラミング系の本の需要こそ高いと思うので、 プログラム言語と認識して変換するOCRソフトがあってもよいはず : [] 2013/09/05(木) 12:51:58.66:wVbjdFQv 日本語と韓国語が混ざった本を e.Typist v.14.0で埋込PDFに自動変換したらできたけど 韓国語はローカルの文字コードをフォントで色づけして日本語のPDFファイルに 含めているだけなので検索用にはつかえないようだ v15もUnicode対応はうたってないしな しかしこれって普通の日本語文書でも一部を簡体字、繁体字、ハングルの ローカル文字コードにされ検索不能になる危険性があるってことだよな NEOのほうがいいのかな : [] 2013/09/17(火) 17:47:40.01:KoLRjPXm 帳票OCR Ver.7以外でラスター画像の一部を読み取って そのファイルのファイル名にしてくれるフリーソフトはないですか? : [sage] 2013/09/28(土) 14:21:55.21:PF73lf9u そういやe.Typistは27日に発売だっけ 体験版はv14のままだったわ : [sage] 2013/09/29(日) 16:58:22.04:nQs5vSMP この週末、無償アップグレード版が来たらレビューしようかと思ってたけど、まだ来ないわ>etypist15 : [] 2013/10/01(火) 12:55:18.26:OKVRTVRr 今日FAXしようとしていた自分に来るのは相当先か : [sage] 2013/10/06(日) 14:18:41.10:B27w76Sl アップグレード来たけど、あんまり代わり映えしないな PDFの画質も改善しないし : [] 2013/10/12(土) 13:12:52.36:N99zQYZG 英文の本をマルチ言語で翻訳したら単語間のスペースが全てなくなる 英語固定にすると若干含まれているアクセント記号付きの文字がグチャグチャ 多言語対応と全くいえないバグだらけ、むしろ14の方がいいのかな : [sage] 2013/10/12(土) 17:01:08.68:YskYNxxU etypist15で行頭の認識結果文字列削除すると、文字カーソルが巨大化した後、 認識ウィンドウの文字に対するマウス操作効かなくなる。どう報告したものか…体験版で試してから購入するんだったorz 認識精度は個人的にあまり変わり映えなし。epub出力やPDFしおり出力云々のせいだと思うけどOCR作業ファイルの後方互換無くなった : [sage] 2013/10/20(日) 12:46:19.43:YgdX2skn 全体的に下火な感じ 需要がそんなにないのかなー : [sage] 2013/10/20(日) 12:55:13.97:YgdX2skn 一発!OCR Pro7というのもあるんだな ジャストシステムから発売されているやつ : [sage] 2013/10/20(日) 20:26:22.16:V4Fsd2ph epub出力ないのかー いらない ルビつきのepubが普通に出力できるOCRは出ないのかな マンガは自炊して処分できたけど、小説がEPUB化できないといつまで経っても捨てられない : [sage] 2013/11/10(日) 00:24:54.73:Ithcb/il e.typistでは駄目なの? 個人的にはルビまで修正の手が回らないから、ルビ出力はオフにしてるけど : [] 2013/11/13(水) 20:02:10.42:NS/oNFUe ハードオフに行って、ジャンクのプリンタを買って読取革命Liteを手に入れるのが一番コストが安いな。 500円くらいで買えたもの。 : [sage] 2013/11/23(土) 07:21:08.48:O8RWMPBP OCRソフトだけは、俺が作ったほうが良い物がでける。 その自信がある。 てなことを思うほど これほどイライラする類のソフトも無い。 俺ならまず、そのPCに存在する文書ファイルの語彙チェックから始めるな。 : [sage] 2013/11/23(土) 09:02:34.89:hhzb+qNK 今のOCRソフトは手書き向けの精度向上にむけたアルゴリズムをアプデしてるからな 小説のような固定レイアウトで、文字も綺麗にスキャンされてる画像からOCRするのには向いてないんだね : [sage] 2013/11/23(土) 23:39:04.77:cxU5qNz+ 同感だよな・・・ 一番いいと言われている読取革命にしても、不具合多すぎるし。 : [sage] 2013/11/24(日) 21:46:08.18:ExxE4Cmc おめー絶対にわざと間違えてんだろ? って突っ込みたくなることが多い。 95年初めてOCRに出会った頃と比べてほとんど進化してない。 新発売の洗濯洗剤のごとく バージョンうpのたびに制度が向上とか もっと凄くなってないとオカシイやろって思う。 ペロペロペロペロペロペロッって 認識が終わるのも腹が立つ もっとじっくりやれよって ベローォォォォォォ、ベロッーーーーーーーーーーーんっ?ペロッ くらいでいいからさ 早く認識終わったって 間違いが多けりゃ意味ねえんだよ。 : [sage] 2013/11/24(日) 22:03:39.28:h61DYoc5 「つ」と「っ」の違いくらいはしっかり認識してほしいよな 文字の大きさを何で考慮しないんだろ 「間」「問」「聞」の間違いくらいなら大目に見るから : [sage] 2013/11/24(日) 23:38:25.08:PsSyF8PF いくら日本語には半角全角かなカナ漢字数字アルファベットがあるといっても 漢字と漢字の間に一文字半角カナとか記号とかねえだろって思うんだよね。 単純に似た形の文字を持ってくるだけじゃなくて 人間の脳内補正みたく文脈から文字の種類を推定したり熟語のデータベースと照合したりそういうのでOCRの精度あげられないのかね。 : [sage] 2013/11/25(月) 00:11:10.13:fMf3+OeP ttp://jump.5ch.net/?http://vtns.wordpress.com/2011/02/22/ebook3/ 数ヶ月程度で作った(らしい)画像認識でこんだけ絞り込めるんだから、OCRメーカーさんにはもっと頑張ってほしいところ さすがに「言」が二二口とか洒落にならん : [sage] 2013/11/25(月) 01:47:55.12:ILF0Qk7C 縦書きの漢数字なんかまともに認識してくれないしな。 個人的には読んでココが一番良かったな。 文字の種類によって色分けしてたり、改行コードがわかるようになってたから、 誤変換した後の修正がしやすかったし。 これで第二水準漢字に対応していてくれさえすれば良かったのに。 : [sage] 2013/11/25(月) 01:56:28.91:41WAN4fr インスコするときに、 「このPC内の文書ファイルの単語をデータとして使用する」 はい、いいえ させるとかしたらええと思う。 そのうちgoogleがっクラウド型OCR作ったら、他のメーカー壊滅やろね。 そういうの得意そうやし ネット上単語データベース利用して、推測認識。 案外、「この文書の元ネタはこのページです。まるごとコピペした方が早いです。」とか言って来たりして。 イラつく例もう一つ 表認識で、数字が4,000、3,000、1,000と並んでるのに次のセルで「2、CO日。」とか認識しやがんのね。 : [] 2013/12/09(月) 16:57:57.89:sxshqx1w e.typistのpdf出力の画質って設定で変えられるのね。 使えないと思ってたのが使えるようになったわ。 まったく、何でデフォルトが最低画質なんだか、、、 : [sage] 2013/12/09(月) 19:59:41.86:YK1q4d3s e.typist使ってるけど、ルビまでいい感じで読み取るけど? そのまま青空形式でルビを書き込むようにしてる。 : [sage] 2013/12/09(月) 21:40:25.53:nWZ+r3Cm え、それほんと? 初耳 電子インクの電子書籍端末がいい感じで普及してきたのに、ルビつきのepubが簡単に自炊できるソフトがないことが最大のネックになってた : [sage] 2013/12/10(火) 00:11:47.09:ZC2PoFMy e.typist neoの出荷メール来た 読取と両方試用版試したけど決め手はルビ出力の可否 認識率は本文より低い感じだけど二重山カッコでくくってくれるので 底本参照の校正がはかどるのではないかと思いまして とは言え認識率が100パーで無い限り底本突合せで間違い探しする訳で根気ないと無理ですねこれは どうしても残したく且つ電書化の可能性が限りなく低そうな手持ちの本限定…って感じです : [sage] 2013/12/10(火) 00:22:53.69:u4muTkK4 青空形式のルビ《 》もルビ開始位置の|も指定できるけど、本文でさえ校正が大変なのにルビまでは出来んわ : [] 2013/12/20(金) 19:26:33.98:YWA5PXvs 未だにsmartOCRをDLできる国外サイトいっぱいあるけど あれって英数字だけだと月並み。 結局利用者は大概日本人か : [sage] 2013/12/23(月) 20:43:32.27:c3bY1Jmf OCRは、高圧縮pdfを吐かせるためで 誤認識は気にしない、だいたい認識してくれれば検索も役には立つ と割り切って無修正で使っている : [sage] 2014/01/28(火) 12:26:31.55:ncWCbP7Q google docsが最強だろjk しかも無料だし : [sage] 2014/04/21(月) 21:56:35.66:FL5+PVqW OCRするとき、下準備やった方が良いのかな? ChainLPでレベル補正とガンマ補正したら認識率上がるような? : [sage] 2014/06/01(日) 13:41:10.19:gZHlEIFi 上がるよ、フォトショで背景全部飛ばして文字の太さやらも調整する : [sage] 2014/06/01(日) 13:44:08.20:4XblVqBZ ホントにホントに? : [sage] 2014/06/05(木) 10:44:39.50:5NUrKheB 書籍は画像で保存していて、 OCRかけて検索可能PDFにするのは自分は諦めてるんだけど、 画像内の文字列をちょこっと選択して、 Google検索だけしたいとはよく思う。 : [sage] 2014/08/07(木) 08:08:09.99:nQfWpHNh ビューアでそんなの出てほしいな 手動で範囲選択してそこだけOCRかけてweb検索やら辞書検索やらする : [sage] 2014/12/25(木) 21:01:09.03:5hKxSpYV 読取革命のアクチベーションはどのバージョンからですか? : [sage] 2015/03/24(火) 00:36:12.86:4AGjMhFZ うちの文鳥は特別に可愛い たぶん他のところのより可愛い そうとしか思えないくらい可愛い でもそう思っている飼い主ってけっこう多い? : [sage] 2015/05/01(金) 05:36:53.74:iCfLgs4D 読んde!!ココ パーソナル(エプソン版) 画像の読み込みは白黒でしか対応していないため、 モノクロビットマップに変換してやる必要がある。 ※元ファイルを消してしまわないため、コピーを別ディレクトリに保存した方が安全。 とりあえず光学文字認識をしてしまい、あとは愛用のエディタを用い、 元ファイルの画面を参照しながら手作業で直していく。 自動文章認識機能に頼りきっていては、なめらかな文字認識ができないため、 きめ細かな修正はやはりオペレーター(ユーザー)が行うしか無いのだ。 Google翻訳で日本語から英語へ翻訳する際、長文のニュースサイト、 論文とかは翻訳にあたってのコツはいちいち使えませんよね。 そこで、Google翻訳ツールセットを用い、おかしな翻訳は ユーザーが手作業で修正する。それと同じ。 : [sage] 2015/05/17(日) 21:46:03.08:tp97P1Sy パナソニックの体験版ずっと前に使ったらしく テスト出来なかったので とりあえず体験版で上手くいったんでe.Typist NEO買っちゃった。 パナのばか野郎 ちゃんと段落指定しないと文字間にスペースが入ったりするからめんどくさいけど ルビもしっかり読み取るし 右クリックですぐ検索できて素敵なPDFライフ送ってます スキャンしたjpgファイルのゴミの山が宝の山に化けたぞ! : [] 2015/11/11(水) 15:39:24.99:CAbtX60K 2010年購入image scanner CanoScan 5600F付属の読取革命Lite v.1.09。 Web pageにあるJPEGなどの画像表示、つまりそのままテキスト文でcopy&paste できないものをテキストデータに変換したい時がたまにある。 画面キャプチャ(snipping tool)によるclip boardを入力データとして読み 込んで、文字認識させてテキスト文にする。 最近5年ほどでOCR softwareの文字認識能力が格段に向上したというけど、 私の使っているものは読み間違えが多い。 画数の多い漢字は正確に認識しにくいが、英字などで"i"&"l"&"1", "o"&"0" などは必ず間違っている。 : [sage] 2016/01/19(火) 15:11:19.09:mq3Mk8xh etypistがえらい勢いで良くなってるな 読取はルビ読み取れないが eは読む : [sage] 2016/02/02(火) 12:46:48.20:8rKEDg16 etypist15の発売日2013年やないか : [] 2016/04/06(水) 20:44:12.53:0vG9P8H4 ☆ 日本の核武装は早急に必須です。☆ 総務省の、『憲法改正国民投票法』、でググってみてください。 日本国民の皆様方、2016年7月の『第24回 参議院選挙』で、日本人の悲願である 改憲の成就が決まります。皆様方、必ず投票に自ら足を運んでください。お願い致します。 : [sage] 2016/07/29(金) 17:23:08.48:chwtCP1b etypist、性能はいいんだが 読み込み時にいちいちウインドウがアクティブになるので 他の作業が出来なくなるのがうざい 別にアクティブになる必要ないだろ : [sage] 2016/08/02(火) 21:34:27.65:xQSe+qqJ OCRソフトで、原稿のフォントを指定すると 認識精度が上がる機能があればいいのにな ゴシックと明朝、フトコロの大小だけでも だいぶ精度が上がりそうなのに : [sage] 2016/08/13(土) 09:58:07.95:cdpMErTk 活字なら文字の大きさも一定だし、フォントとか認識できれば、言偏が分解されたりせずに済みそうだよね : [] 2016/09/22(木) 00:19:47.24:ZZVNIQT0 認識率98.66%?!たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた ttp://jump.5ch.net/?https://bita.jp/dml/reactive_int : [sage] 2016/10/06(木) 14:45:13.21:skZ2qPPb 体験版で精度をチェックしたいのに製品版と性能が違うのもあるらしいから困る : [sage] 2016/10/07(金) 09:30:18.61:jp9s72R4 FineReader買ったけどいいね。 : [] 2016/10/07(金) 23:42:03.50:F621ToTQ 学習が日本語対応してないのが痛い : [sage] 2016/10/10(月) 07:22:47.51:xE3A06X4 実質、英文のOCR専用でしょう 日本のOCRソフトで英文OCRやってもグダグダなのと同じだと思う 洋書を電子化するにはなかなか良いソフトだと思う : [sage] 2016/10/10(月) 13:04:37.24:MNrX4hom ホームページ見ると英語なら読取革命もABBYY社製エンジンだね ちなみにe.typistはNuance社製 : [sage] 2016/10/11(火) 01:30:01.21:eksnS3tm 俺はttp://jump.5ch.net/?http://monomania.sblo.jp/article/55737163.htmlで↓を読んでFineReaderを買うことにした。 >>読取革命は英語の部分はFine Readerという英語圏では最も信頼性が高いOCRを採用していますが、エンジンを上手く生かし切れていません。 : [] 2017/07/08(土) 18:41:50.55:xQlgvdQ3 eTypistは認識中にウィンドウがアクティブになるのを防げんのかね : [] 2017/07/09(日) 16:06:20.21:iESi7AYh 確かに。読取革命とは対照的に、処理中はPCを 事実上専有されてしまい困るね。 googleのAPIを試してみたら、認識精度は相当良かった。 今は(たぶん)アプリがないので敷居は少し高いが、 将棋といい、今後はAIの方向性になっていくのかな。 : [sage] 2017/07/11(火) 00:20:04.02:EO4izff5 パナソニックがすでにAIとかディープラーニングを投入した手書き文字 対応の帳票OCRソフトを発売しています ttp://news.panasonic.com/jp/topics/148335.html お値段もいいっすね。 ・帳票OCR Ver.8 クライアント版:398,000円(税抜) : [] 2017/07/12(水) 19:51:06.12:yQE9Ft7A お値段張りますね。個人にはちょっと手が出ません。 個人的にはGoogle cloud visionで満足ですが、 誤認識のフィードバックや学習機能はないですね。 : [sage] 2017/08/20(日) 10:04:39.07:2KZZB/L/ Google Cloud Vision OCR使って検索可能なpdf作るコマンド昔作ったけど、Googleがjsonの形式変えて後ろに余計なものつけたせいで使えなくなったw 直したいけどヒマないな… ttp://jump.5ch.net/?https://github.com/dinosauria123/gcv2hocr Linux用。Bash on Windowsでも使える。 : [] 2017/08/24(木) 19:50:24.14:m5h5ZsxQ 素のWindows環境なので試せませんが、 検索可能PDFはいい考えですね。 高級言語を何も知らないので、標準のPowershellで フロントエンド部分のスクリプトを作ってみたら、 Google Cloud Vision、結構いいかも。 文庫本一冊あたり数分でテキスト化できるようになった。 : [sage] 2017/08/24(木) 20:11:01.05:mY06hxQc Google Cloud VisonのOCR, いいですよね。 古いカメラ好きで、戦前戦中期のカメラ広告のデータベースを作ろうとしてるのですが、 他のOCRよりかなり良くて重宝してます。 全てが読めるわけではないですが、ものによっては広告の見出しのロゴなども読み取れます。 ちなみにテスト中のサーバーはこちらです。 縦書きがひっくり返ったり、画像が出なかったりとまだうまくいかないのですがw ttp://jump.5ch.net/?http://104.197.98.173/ スクリプトは公開されますか?興味ありますw : [sage] 2017/08/24(木) 20:51:11.80:mY06hxQc Google Cloud Visionを使ったOCRソフトが1480円だそうです。いいかも。 ttp://jump.5ch.net/?http://n.shop.vector.co.jp/service/catalogue/ppocr/ : [sage] 2017/08/24(木) 21:10:00.64:mY06hxQc すまん、これTesseractベースらしいw : [sage] 2017/09/21(木) 15:18:37.11:oeq2WaFN Googleドライブのサービスが終わることが決まったらしい てことはOCR民に重宝されていたGoogleドライブを経由して上げたjpgから文字化するあのシステムも失われてしまうのだろうか : [sage] 2017/09/21(木) 15:29:09.54:oeq2WaFN と思ったけど機能発展かなんかの流れで推移して仕組みが変わるだけでそういったシステムが無くなるわけではないのかな よくわからんね : [sage] 2017/09/26(火) 18:13:31.59:L30pb7J/ 手書きOCRの記事をよく読むけど、手書きであの精度がでるなら、活字は100%近い精度が得られそうな気がするけど、どうなんだろうね? : [sage] 2017/09/27(水) 16:30:29.45:kyhjOBdx 記事のための : [sage] 2017/12/30(土) 01:13:36.18:vWdc5/Pn ☆ 私たち日本人の、日本国憲法を改正しましょう。現在、 衆議員と参議院の両院で、改憲議員が3分の2を超えております。 『憲法改正国民投票法』、でググってみてください。国会の発議は すでに可能です。平和は勝ち取るものです。お願い致します。☆☆ : [] 2018/01/12(金) 08:46:36.99:OG0vqAvx 電子書籍のように無料で稼げる方法 グーグル検索⇒『稲本のメツイオウレフフレゼ Z9GSY : [sage] 2018/02/28(水) 23:51:50.98:pigZ9q4r Google Cloud Vision APIで透明テキストのPDF作ってみたんだけど、abbyy finereaderとか、e-typist、読み取り革命とか、捨ててもいいレベルですね。 何万も掛けて買って、精度の悪さにがっかりしていたのがバカバカしくなるレベル。 Google Cloud Vision APIのOCRはマジでおすすめ。 : [] 2018/05/29(火) 15:55:16.34:20k4ukZr IDSP8
凡例:
レス番
100 (赤) → 2つ以上レスが付いている
100 (紫) → 1つ以上レスが付いている
名前
名無しさん (青) → sage のレス
名無しさん (緑) → age のレス
ID
ID:xxxxxxx (赤) → 発言が3つ以上のID
ID:xxxxxxx (青) → 発言が2つ以上のID
このページは2ch勢いランキング が作成したキャッシュです。元のページはこちら 。削除についてはこちら 。