(function() {function signalGooglefcPresent() {if (!window.frames['googlefcPresent']) {if (document.body) {const iframe = document.createElement('iframe'); iframe.style = 'width: 0; height: 0; border: none; z-index: -1000; left: -1000px; top: -1000px;'; iframe.style.display = 'none'; iframe.name = 'googlefcPresent'; document.body.appendChild(iframe);} else {setTimeout(signalGooglefcPresent, 0);}}}signalGooglefcPresent();})();

Daily Archive: 5月 25, 2021

電子文書化、完了

代行業者に依頼していた書籍の電子化が終了した。

特急便は早かった

当Blogで、書籍の電子化について代行業者に依頼する、と記事にしたが、その電子化が終了した、と業者より連絡があった。

スキャンピー
https://scanb.jp/

Screenshot of scanb.jp

頼んだのが5月21日で、その翌日の22日に23日着で書籍を送付しているので、実質書籍到着から2日で電子化作業が終了している。
つまり、オプションで付けた「特急便」は実施された事になる。ホントに2日以内に終わるんだね…。
思った以上に早い対応だったので、個人的には代行業者を使うのはアリだな、と思うワケだが、当然それらは納品物を見ての判断になる。
実際、納品後のデータはどのような状態なのか、確認してみた。

スキャン品質

実際にスキャンされたデータを確認したところ、思いの外良好な結果だった。
しかもOCR処理も頼んでいたので、テキストを選択すればコピー&ペーストも可能である。
テキスト化が簡単という事は、Ankiによる問題作成はすこぶる捗る事になる。
わざわざ手打ちしなくても良いので、必要な箇所を転記し、数学記号を追加したり画像を追加したり表を作成したりすれば、Ankiの問題はそれだけで作れる。
ただ、これはOCRの常識的な問題なのかもしれないが、背景に色がついているところの文字はOCR処理されていないようである。
この画像は今回依頼した電子化書籍の一部を切り取ったもので、テキストが反転しているところは文字選択が出来ているので、コピーができる事を指している。背景に色が付いている部分は画像として処理されているためか、テキストとして選択できない事がコレでわかるだろう。
これは、OCR処理の設定の問題かもしれないので何とも言えないが、元々背景に色が付いているもののみであれば、おそらくOCR処理はその内容で実施されるのではないかと思う。
それと、モノによっては若干ながら傾いているものもある。但しこれは元々の規定で一定の角度以上の傾きがなければ傾いているとされないので、よほど酷いものでないかぎりは許容するしかない。
また落丁に関しても全体の3%以上あれば再スキャンが可能であるが、元々落丁そのものが発生する確率は60,000冊に1冊という確率だそうで、ほぼあり得ない品質とされている。
なので、納品物を一通り確認して問題がなければ、ほぼ問題ない、と考えて良いだろう。

Continue reading…

Desktop Version | Switch To Mobile Version