結論
nkf
コマンドの --guess
オプションを使うことで、文字コードが分かる。
フォーマット
nkf --guess ファイル名
利用例
$ nkf --guess sample.csv
UTF-8 (BOM) (LF)
- 文字コードが
UTF-8
である - 改行コードは
LF
なので、\r\n
である
ということが分かる。
表示の見方
名称 | コード | OS |
---|---|---|
CR(Carrige Return) | \r | MacOS(バージョン9まで) |
LF(Line Feed) | \n | Unix, MacOSX以降 |
CR + LF | \r\n | Windows系 |
参考: 📄【Linux】改行コードの確認を行うコマンド3種類
解説
nkf
コマンドは「Network Kanji Filter」の頭文字を取ったコマンドで、他の文字コードへの変換を得意とするコマンドである。
--guess
オプションは文字コードと改行コードを確認するためのオプション。
実は引数に 1
or 2
を取ることができ、デフォルトは 2
。
# --guess=1の場合は文字コードのみ出力
$ nkf --guess=1 sample.csv
UTF-8
# --guess=2(デフォルト)の場合は文字コードと改行コードを出力
$ nkf --guess=2 sample.csv
UTF-8 (BOM) (LF)
$ nkf --guess sample.csv
UTF-8 (BOM) (LF)
Macの場合
Macに標準でこのコマンドは入っていないので、brewを使ってインストールするのが一番かんたんである。
$ brew install nkf