サンプル原稿から作業中

先週にやっと伝統鍼灸学会50周年記念誌のサンプル原稿をもらったものの、色々と調べて今回のファイルについてはテキストデータが取り出せることはわかったもののそこからまだ点訳処理に必要な加工に勧めていませんでした。
昨日に色々やっていたならやっとエッジからPDFのテキスト部分を取り出すことができました。クロームでは無理であり、PDFビューワとしてはエッジのほうがやはり使いやすいです。
しかし、スクリーンリーダーがいちいち息継ぎをしているような発音をしていたので細かく見ると、やはり半角スペースが入りまくっていました。高機能エディタを使わないと、半角スペースを取り除くだけでも何時間もかかってしまいそうな量でした。
そして見た目はいいのでしょうけど、物理業で開業されてしまっているので、これを改行マークまでくっつけ直す果てしない作業をやり始めたところです。読んでいると面白いのですけど、単純作業なのでものすごく疲れてしまいます。