辛夷坞

涧户寂无人,纷纷开且落

By - Christen

带 BOM 的 UTF-8

断舍离之赵鹏:折叠
有的人,总在不断的为明天焦虑,为昨天懊悔,从未认真的思考和面对今天。
延伸阅读:「带 BOM 的 UTF-8」和「无 BOM 的 UTF-8」有什么区别
我其实没有完全搞清楚 UTF 和 BOM,就我的实际体验写一点:
1. 我的Surface Pro 在升级 Windows 10 的时候,手贱选了英文操作系统,虽然也可以正常显示中文、输入中文,但网上下载的 GB2312 编码的文本,中文显示不正常,比如无损音乐的 CUE 文件;

2. 处理方法:

  • 先用 EmEditor 打开文件,发现默认的文件编码是 Western European,双击编码,弹出菜单中选择 GB2312,乱码消失,复制,关闭 EmEditor;
  • 再用 Sublime Text 打开同一文件,会发现也是乱码,删除所有文本,粘贴,文件菜单中选择 Save with Encoding > UTF-8 with BOM;

之后, foobar 等音乐播放器都可以正常识别,记事本打开也无乱码,EmEditor 打开显示的编码是 UTF-8 with Signature。
3. 无效的方法:

  • 修正乱码之后,直接用 EmEditor 另存为 GB2312 编码的文件,再次打开,乱码如故;
  • Sublime Text 存储的时候,未选 with BOM,打开文本无乱码,但是 foobar 显示乱码;

抄录一段话,看能不能辅助理解:
Various ISO-8859 standards that included Eastern and Western European alphabets transformed an extended 8-bit ASCII English language standard to most European and some Middle Eastern languages.

Leave a Reply

Your email address will not be published.
*
*