WinMergeのインストール
同じ意味、同じ読みで違う漢字がある。
「言う」と「云う」などだ。
厳密には違う。
語感が違うし、意味も完全に同じであるわけではない。
使い分けてもよい。
例えば伝聞や風評を「~と云う」などと記述し、発言の場合の「~と言う」と分けてもよい。
日本語の表現に拘り抜くことは文芸を志す者にとり必要なことだ。
例えそれが誰にも理解されなくとも。
しかしそんな高尚な拘りとは無関係にIMEの機嫌次第で両者が混在することもある。
これは良くない。
今までは気付かなかったが気付いてしまった。
Grepしてみると結構な数の「言」と「云」の混在がある。
よし、一括変換しよう。
サクラエディタで「Ctrl+R」とし「置換」ウインドウを開く。
「置換前(P)」に「云」と、「置換後(N)」に「言」と入力する。
そしておもむろに「全て置換(A)」をクリックする。
百近く置換されたと結果がでる。
これで品質がまた上がった。
後日読み直してみて「言言」や「言々」なる摩訶不思議な単語を見て首を捻る。
そして「云云」や「云々」という言葉を誤変換してしまったことに気付くわけだ。
一括置換を行う際にやってしまいがちなミスであろう。
「Grep置換」で大量のファイルに対して置換を行うと被害はより深刻なものになる。
変換の前にgrepして確かめるべきだろう。
しかし不思議なことに変換前には気付きにくいものでもある。
とは言うものの、数が多くなってくると一つひとつ確認しながら置換するのも事務的ではない。
やはり一括して変換したい。
ならばバックアップを取ろう。
そして一括置換した後にバックアップと比較をとればよい。
そのためのツールが差分抽出ツールだ。
差分抽出ツールはWinMergeがメジャーだ。
「WinMerge日本語版」のサイトに行き、インストーラーを取得する。
最新のインストーラーはWinMerge-2.14.0-jp-135-x64-Setup.exe.zipであるようだ。
インストール自体は特に問題ないだろう。
置換の例として青空文庫から夏目漱石先生の「吾輩は猫である」を使わせていただく。
この小説は十一章からなる。
章ごとに分割し以下のディレクトリに格納する。
C:\repo\bungou\neko\work
これを以下のようにバックアップを取る。
C:\repo\bungou\neko\20170622_1
サクラエディタを開く。
注意事項としては「Grep置換」する対象のファイルは閉じていなければならない。
「検索(S)」から「Grep置換」を選択する。
私は「Alt+G」に登録してある。
「置換前(P)」に「猫」、「置換後(N)」に「犬」とする。
既にバックアップを取っているので「バックアップ作成(K)」のチェックボックスは外しておく。
付けておくと*.skroldというバックアップファイルが同じフォルダに作成される。
「置換(F)」をクリックするとGrep置換が実行される。
「猫」という語が「犬」に置き換えられるわけだ。
WimMergeで確かめてみよう。
WinMergeを実行すると灰色の画面が表示される。
そこにC:\repo\bungou\nekoディレクトリ上のworkディレクトリと20170622_1ディレクトリを一緒にドラッグする。
するとディレクトリ内のファイルの差分が表示される。
これを上から順にクリックするとファイルごとの差分が表示される。
テキストファイルの場合は「表示(V)」で「行を右端で折返す(R)」を選択した方が良いだろう。
「Alt+↓」で差分位置に飛ぶ。
これで次々に置換後のテキストファイルを確認していくのだ。
差分が表示されるので確認の品質をあげることができる。
「ESC」キーで差分表示画面を閉じることができる。
複数差分ファイルがあれば上下カーソルキーで選択して[ENTER]キーで開ける。
複数のファイルがあっても素早く変換後のファイルを確認することができるわけだ。
WinMergeはかなり多機能なツールである。
テキストエディタとしての機能もあり、直接比較ファイルを更新できたりもする。
怪しげな変換を行ってしまっている箇所は変更前のファイルからコピーして戻すこともできる。
WimMergeは有名なツールだから諸先生方も使われていると思う。
しかしもし使っていないのならば、使われてみてはいかがだろうか?
毎日バックアップをとり、一日の執筆の後に前日のバックアップと比較をとる。
一日の仕事の結果が色分けされて表示されるので満足感を得られると思う。