本ソフトが対応している漢字コードは、シフトJIS、JIS、EUC、UTF-8、UTF-8N、Unicode、Unicode(Big
Endian)の7種類です。UnicodeはUTF-16LE、Unicode(Big Endian)はUTF-16BEと同じです。UTF-8のBOMを付加しない変換がUTF-8Nです。
入力ファイルの漢字コードは自動的に判定しますが、半角カタカナやアルファベットが最初の方に多く続くファイルは正しく判定できない場合があります。その場合は、入力ファイルの漢字コードを指定するようにしてください。
Unicode、Unicode(Big Endian)の入力ファイルには、BOM(Byte Order Mark)が必要です。BOMがあれば、100%正しく漢字コードを判定します。Unicode、Unicode(Big
Endian)の出力ファイルには、BOMが必ず付加されます。
JISコードで対応しているのは下記の通りです。これ以外の制御コードには対応していません。なお、新JIS・旧JIS等も一切考慮していません。
|
漢字IN |
漢字OUT |
半角カナIN |
半角カナOUT |
入力 |
<ESC>$B
<ESC>$@
<ESC>K |
<ESC>(J
<ESC>(B
<ESC>(H
<ESC>H |
0x1E |
0x1F |
出力 |
<ESC>$B |
<ESC>(B |
なし(※) |
なし |
※半角カタカナの出力は、0xA1~0xDFのコードをそのまま出力します。
UTF-8、UTF-8N、Unicode、Unicode(Big Endian)で対応しているのは、UCS-2の範囲(U+0000~U+FFFF)です。また、シフトJIS、JIS、EUCへ変換すると、シフトJISの範囲外の文字は「?」となります。JIS、EUCとの変換は、シフトJISを経由しています。
Unicode、Unicode(Big Endian)のファイルは、テキストモードで転送せず、バイナリモードで転送するようにしてください。ホスト側がUnicodeのファイルに対応していない場合は文字化けしてしまいます。
漢字コードを変換できるのは、テキストファイルのみです。バイナリファイルは変換できません。テキストファイルとは、通常のテキストと、改行、タブのみでできているファイルで、これ以外の特別な制御コードが含まれている場合は、正常に変換できない場合があります。