PDFから強引にテキストデータを吸い出してきている続きですが、文字コードという問題はあまり考えてきていませんでした。でも、滋賀漢方鍼医会公式テキストを執筆してきて、ユニコードで最初から作業をしてしまう重要性がわかります。
XPの時代から内部的にユニコードを扱えるようになっていましたが、日本語としては今でもそうですがShift JISのほうが便利であり、「にき鍼灸院」のホームページもShift JISの指定になっています。
メモ帳が何故かグレーアウトしているらしく、同じテキストエディタですからマイエディットで保存してもらいましたが文字コードを改めて確認すると自動認識。これは元々あったファイルを編集していくのが前提なので、MMエディタでも同じでしたから仕方ありません。もう少し文字コードの勉強をせねばです。