Java非法字符 'ufeff'

2017/07/19

utf-8+bom比utf-8多了三个字节前缀:0xEF0xBB0xBF,有这三个字节前缀的文本或字符串,程序可以自动判断它为utf-8格式,并按照utf-8格式来解析文本或字符串。

前言

开发过程中,在启动Spring Boot的时候,遇到这样的问题:

Error:(1, 1) java: 非法字符: '\ufeff'

运行mvn compile也是报同样的错误。感觉好奇怪啊,仔细看看对应的行没啥问题啊。我用的工具是IntelliJ IDEA 2016.3(64),同样的代码在Eclipse中是没问题的,Spring Boot正常启动。

问题

在启动服务的时候报错

这里写图片描述

解决方案

下载个文本工具,我用的是Notepad++.打开刚刚出问题的文件看右下角:

这里写图片描述

提示当前编码格式是UTF-8-BOM。菜单栏中也可以看。

这里写图片描述

把当前的内容全部剪切,在菜单栏切换编码格式。

这里写图片描述

格式切换完后,把内容粘贴一下就OK。

这里写图片描述

扩展

UTF-8 不需要 BOM,尽管 Unicode 标准允许在 UTF-8 中使用 BOM。 所以不含 BOM 的 UTF-8 才是标准形式,在 UTF-8 文件中放置 BOM 主要是微软的习惯(顺便提一下:把带有 BOM 的小端序 UTF-16 称作「Unicode」而又不详细说明,这也是微软的习惯)。 BOM(byte order mark)是为 UTF-16 和 UTF-32 准备的,用于标记字节序(byte order)。微软在 UTF-8 中使用 BOM 是因为这样可以把 UTF-8 和 ASCII 等编码明确区分开,但这样的文件在 Windows 之外的操作系统里会带来问题。

参考

UTF8最好不要带BOM,附许多经典评论

「带 BOM 的 UTF-8」和「无 BOM 的 UTF-8」有什么区别?网页代码一般使用哪个?


作者:Wuxinshui
出处:http://wuxinshui.github.io
版权归作者所有,转载请注明出处

Post Directory