(function() {function signalGooglefcPresent() {if (!window.frames['googlefcPresent']) {if (document.body) {const iframe = document.createElement('iframe'); iframe.style = 'width: 0; height: 0; border: none; z-index: -1000; left: -1000px; top: -1000px;'; iframe.style.display = 'none'; iframe.name = 'googlefcPresent'; document.body.appendChild(iframe);} else {setTimeout(signalGooglefcPresent, 0);}}}signalGooglefcPresent();})();

Tagged: 自炊代行

電子文書化、完了

代行業者に依頼していた書籍の電子化が終了した。

特急便は早かった

当Blogで、書籍の電子化について代行業者に依頼する、と記事にしたが、その電子化が終了した、と業者より連絡があった。

スキャンピー
https://scanb.jp/

Screenshot of scanb.jp

頼んだのが5月21日で、その翌日の22日に23日着で書籍を送付しているので、実質書籍到着から2日で電子化作業が終了している。
つまり、オプションで付けた「特急便」は実施された事になる。ホントに2日以内に終わるんだね…。
思った以上に早い対応だったので、個人的には代行業者を使うのはアリだな、と思うワケだが、当然それらは納品物を見ての判断になる。
実際、納品後のデータはどのような状態なのか、確認してみた。

スキャン品質

実際にスキャンされたデータを確認したところ、思いの外良好な結果だった。
しかもOCR処理も頼んでいたので、テキストを選択すればコピー&ペーストも可能である。
テキスト化が簡単という事は、Ankiによる問題作成はすこぶる捗る事になる。
わざわざ手打ちしなくても良いので、必要な箇所を転記し、数学記号を追加したり画像を追加したり表を作成したりすれば、Ankiの問題はそれだけで作れる。
ただ、これはOCRの常識的な問題なのかもしれないが、背景に色がついているところの文字はOCR処理されていないようである。
この画像は今回依頼した電子化書籍の一部を切り取ったもので、テキストが反転しているところは文字選択が出来ているので、コピーができる事を指している。背景に色が付いている部分は画像として処理されているためか、テキストとして選択できない事がコレでわかるだろう。
これは、OCR処理の設定の問題かもしれないので何とも言えないが、元々背景に色が付いているもののみであれば、おそらくOCR処理はその内容で実施されるのではないかと思う。
それと、モノによっては若干ながら傾いているものもある。但しこれは元々の規定で一定の角度以上の傾きがなければ傾いているとされないので、よほど酷いものでないかぎりは許容するしかない。
また落丁に関しても全体の3%以上あれば再スキャンが可能であるが、元々落丁そのものが発生する確率は60,000冊に1冊という確率だそうで、ほぼあり得ない品質とされている。
なので、納品物を一通り確認して問題がなければ、ほぼ問題ない、と考えて良いだろう。

Continue reading…

書籍電子化、頼んでみた

お試しという感覚で、代行業者に頼んでみた。

とりあえずお試しで

先日、当Blogで本の電子化に関して記事にしたが、その時考えていた書籍を電子化するため、実際に業者に依頼してみた。
選んだ業者は以下の業者。

スキャンピー
https://scanb.jp/

Screenshot of scanb.jp

ホントはBOOKSCANという所にお願いしたいところだったが、やはり納期が今からで9月以降になるというのはあまりにも時間がかかりすぎ。依頼する書籍は試験の過去問題集なのだが、その試験は9月上旬。時期的に全く届かない。
というわけで、納期がもっとも早いとされるスキャンピーに依頼してみた。
スキャンピーの基本価格は、1冊300ページまで88円(税込)という事。300ページを超える場合は、200ページ毎に+88円が加算されるという仕組み。
その基本料金に、各種オプションを追加していく事になるが、各種オプションは基本料金と異なり、実際の冊数分だけ価格が上乗せされる。
具体的に自分が頼みたい料金が幾らになるかは、料金シミュレータがあるので、それで試算する事ができる。

スキャンピー 料金シミュレータ
https://scanb.jp/estimate

私の場合、380ページ前後の書籍2冊を依頼しようとしているので、基本料金は(88円+88円)×2=352円という事になる。これに追加したいオプションを追加していく事になる。

オプションいろいろ

まず付けられるオプションは以下になる。
料金表「表紙のみカラースキャン」「フルカラースキャン(全ページ)」「おまかせ便」「パーフェクトスキャン」はカラースキャンやスキャンする場所に関するオプションである。「おまかせ便」というのはスタッフが依頼された書籍を見て、カラーページのみカラースキャンしてモノクロページモノクロスキャンをするという、必要に応じたカラースキャン対応の事である。また「パーフェクトスキャン」とは、表紙、裏表紙、表紙裏、裏表紙裏、背表紙といったところまでもカラースキャンするサービスである。価格は「パーフェクトスキャン」のみ100円/冊で、それ以外はどれを選んでも50円/冊となっているので、もし背表紙等が不要なら「おまかせ便」を選ぶのが電子化後のデータサイズを考えれば一番よいかも知れない。
「OCR処理」は、スキャンしたページの文字をOCRでテキスト埋め込みしてくれるサービスである。ただ、これは機械的にOCR処理をするという事になるハズなので、テキスト精度は完璧というには遠いと言える。ま、それでも最近はOCR処理の精度も上がってきているので、こればっかりは試してみて結果をみないと何とも言えない。金額的には80円/冊。ページ数は無関係で依頼する実際の冊数分だけかかる。
「特急便」は、依頼後に依頼する書籍が業者に到着してから2日以内に作業に入る、というオプション。急いでいる時には便利なオプションである。100円/冊という料金なので、依頼数が少ない時は積極的に付けたいオプションである。
「各種電子書籍端末最適化」は、タブレット、スマホ、電子書籍端末など、対応させる端末に合わせてデータを調整してくれるサービス。カラー液晶を搭載したタブレットやスマホでは、元PDFデータでもおそらく何ら問題はないが、E-ink端末であるKindleやkoboなどは、タブレットやスマホの液晶とは見え方が異なるので、それらへの調整をしてくれる。ちなみに元PDFデータとは別でデータ納品してくれるので、このオプションを頼んだからといって他では使えないという事はない。80円/冊という料金。
「JPGファイル化」は、ページ毎に1枚のJPGデータにしてくれるオプション。これは…正直PDFさえ手元にあれば、自分でもできるので、そうした手間を省きたい人向けのサービスである。80円/冊という価格をどう取るかで価値が変わる。
また、大量の書籍を依頼した場合に役立つのが「DVD-Rでの納品」オプションである。通常はダウンロードページがメールで送られてきて、そこからダウンロードする形を取るのだが、もし段ボール単位で依頼する場合は、そのダウンロードも結構大変になるので、こうした物理メディアに保存して納品してもらえるサービスが役に立つ。料金は送料込みで800円と固定費。
これらのオプションを前述の基本料金と組み合わせて、最終的な金額になる。

Continue reading…

本の電子化

今更ながら、紙の本を電子化したいという欲求が出てきた。

必要から生まれた欲求

今更ながら、紙の本を電子化したいという欲求が出てきた。
いや、別に自分が所蔵している本を電子化したい、という事ではなく、先日当Blogの記事にも書いた、資格取得の為の問題集を電子化したいと考えたからである。
何故電子化なのかというと、問題集をAnkiというアプリケーションに落とし込む際、紙の本では都合が悪く、もし電子化されていれば、画面にテキストを表示しながらAnkiで問題を作れるし、もし電子化した本がOCRでテキスト化されていればはコピー&ペーストできるからである。
OCRも、以前から比べれば認識率も相当に高くなってきているので、誤字が少なくなっているのもポイントである。
なので、こうした問題集を冊子として発売されているものを利用する場合、実は紙の本よりも電子書籍の方がありがたいわけである。
だが…もし発売されている問題集が、電子書籍ではなく紙の本でしか発売されていない場合、この電子化をなんとか自分でするしかない。
自炊は自分でやるのは効率がよくない?しかし、実際本を自炊(自分で作業する場合は自炊というらしい)するとなると、実はものすごくハードルが高い。
やり方はいろいろで、自炊したい本を解体してスキャンする方法と、解体せずにスキャンする方法がある。
解体する場合は、大きな裁断機などで背表紙を一気に切り落とし、1枚1枚スキャンしていく方法になる。この方法だと比較的綺麗にスキャンできるが、問題は裁断機などの機材を必要とするところである。
解体しない場合は、フラットベッドスキャナなどで本を見開き、1ページずつスキャンしていくのだが、素人がやると本のページとページの間に影ができるので、そこでスキャン制度が落ちるし、その処理が大変である。
スキャン後の事を考えれば、そもそも電子化してしまった後にその本は不要になる事から、裁断(解体)しても問題はないのだが、物理的に本が残る方法が良い、と考える人もいるだろう。
どちらにもメリット、デメリットがある。

もっとも良い方法

解体する、しないを選ぶ事も迷うが、そもそも自分でちゃんと自炊できる環境が整えられない、という場合もある。
そうなると、もっと良い方法がないか? と考えた時、業者に頼むという答えが出てくる。
私の最終的判断としては、この業者に頼む、というのが最もベストな回答になる。
但し、この業者に頼む場合は、いくつか注意する必要がある。
業者は、電子化した後の書籍は基本的に依頼者に返送しない。全て溶解処分する事になっている。何故かというと、もし返送すると電子化した後に書籍が古本市場に流れ、再販売されてしまい、結局本の売り上げに影響が出てしまうからである。なので業者に頼む時点で、その本のオリジナルはデータ化された納品物のみが残る、と考える事になる。
また、この電子化に賛同しない著作者もいるので、そうした賛同しない著作者の書籍は電子化できない。そこは基本的な所なので知っておく必要がある。
これら基本的な事を知った上で、私的には業者を使う事がベストと判断した。
ただ、業者に依頼するにしても、この自炊代行業者というのも数多く、どの業者に依頼する野が良いのか? という話になる。
そこで自炊代行業者のいくつかを調べて見た。

Continue reading…

Desktop Version | Switch To Mobile Version