properties乱码,Transparent native-to-ascii conversion

1. 遇到的问题

properties中配置的国际化资源引发的乱码问题

2. 乱码产生的原因

默认情况下,项目中的配置文件编码跟随系统。

如下图,配置文件跟随系统为GBK编码,而Java默认是以ISO-8859-1的编码读取配置的,所以会出现乱码。解决方式是勾选Transparent native-to-ascii conversion,将所有字符转成ascii编码保存(实际上就是转成unicode转义序列)

3. 配置编码

官方文档。
https://www.jetbrains.com/help/idea/settings-file-encodings.html

从上图可以看到配置编码的地方有4个:

  1. Global Encoding:UTF-8
  2. Project Encoding: System Default
  3. File/Directory Encoding: UTF-8
  4. Properties files Encoding:System Default

前三个是配置项目中文件的编码,不包括properties配置文件。
这三个选项存在优先级,高优先级的覆盖低优先级的。
可以看到File/Directory Encoding中配置了整个项目的根目录为UTF-8,覆盖了Project Encoding的GBK。
所以一般这三个配置我们一般都不用管,idea会自动配置File/Directory Encoding: UTF-8

另外就是properties文件的单独配置,默认情况下跟随系统。

4. Transparent native-to-ascii conversion

Properties文件后面还跟随着一个复选框Transparent native-to-ascii conversion。直接翻译过来则是透明的将本地编码转成ascii编码,本质上调用的是jdk bin目录下的native2ascii.exe

从官方文档上描述,选择properties编码格式和勾选Transparent native-to-ascii conversion这两个操作是二选一,并且不是特殊情况下,这个复选框都应该勾选。(nmb你就默认不勾选)

如果勾选了复选框,那么前面的properties编码格式就无所谓了,因为Transparent native-to-ascii conversion这个功能会将我们输入的所有字符转换成Unicode序列码保存,例如我们输入“登陆”两个字符,实际上保存到properties时保存的是它的Unicode序列码。

如图,在idea中输显示是中文,用sublime打开之后发现是Unicode序列码。

所以这也是为什么设置properties编码格式无所谓的原因了,因为保存的字符都是ascii码表中的字符。

而当Java去读取properties时,也会将自动将\uxxx的Unicode转成对应的char。

虽然说设置properties编码格式的编码格式是无所谓的,但是我们还是要将他设置成UTF-8以防出现其他意外。
例如文件一开始是以GBK创建的,并没有勾选Transparent native-to-ascii conversion,后面再勾选上这个复选框时,不会自动将中文转成Unicode,而且我们也看不出来这个错误。
但是我们再将编码改成UTF-8时,我们就会发现乱码了,我们就知道其实这些中文并没有转成unicode。所以一般情况下我们需要同时设置文件编码为UTF-8并勾选复选框,或者设置文件编码为ISO-8859-1也是可以的。

但是无论如何,Transparent native-to-ascii conversion是必须勾选的,除非你保证properties中不会出现ASCII以外的字符。

5. 为以后的项目也采用这个编码设置

我们通过setting修改的编码实际上只在当前项目生效,这也是为什么idea默认的.gitignore文件没有忽略.idea目录。
如果需要以后创建的项目也生效,我们需要从other setting中设置。

已标记关键词 清除标记
我在我电脑上的G:\AdobeCQ路径下面有两个相同的项目: BMWPDF PDFGeneration ![图片说明](https://img-ask.csdn.net/upload/201511/19/1447909321_791529.png) 以前我在BMWPDF项目中的POM.xml文件里面加了以下的语句: ``` <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding> <project.reporting.outputEncoding>UTF-8</project.reporting.outputEncoding> <maven.compiler.encoding>UTF-8</maven.compiler.encoding> ``` 并且将这个项目Text file encoding 改为了UTF-8。做这个两个操作的目的是为了让这个项目能够支持在代码中写入中文字符。后来这样编译并没有什么问题,而且中文也能够顺利的输出到相对应的PDF中。 可是,昨天晚上大概11点半左右,我发现打开eclipse的时候出现了错误,提示“error shows in .metadata/.log”。项目打不开,我只好把.metadata文件删掉之后,重新打开eclipse,导入项目之后,用maven进行编译,出现以下的错误: [ERROR] Failed to execute goal org.apache.felix:maven-scr-plugin:1.7.4:scr (generate-scr-descriptor) on project bmwpdf-bundle: Execution generate-scr-descriptor of goal org.apache.felix:maven-scr-plugin:1.7.4:scr failed: syntax error @[861,2] in file:/G:/AdobeCQ/bmwpdf/bundle/src/main/java/com/bmw/pdf/generator/GeneratorProcess.java -> [Help 1] 看了具体的错误信息,我有点懵了。因为提示的错误文件中根本没有861行,最多859行。后来具体的去看错误信息,知道是因为这个文件存在中文引起的,但是我又不能讲中文去掉。于是,我只能想着碰运气,重新创建了一个项目PDFGeneration,代码一样,POM文件也是一样的。但是并没有改动项目配置中的Text file encoding,默认是GBK,这个时候,中文乱码,于是,我直接拷贝这些含有中文的文件内容到对应的新项目中。保存,编译,没有错误。运行包之后,只要是在代码中出现的中文字符,全部乱码。于是,我将Text file encoding改为UTF-8。编译之后同原来的项目一样,出现以下错误: [ERROR] Failed to execute goal org.apache.felix:maven-scr-plugin:1.7.4:scr (generate-scr-descriptor) on project bmwpdf-bundle: Execution generate-scr-descriptor of goal org.apache.felix:maven-scr-plugin:1.7.4:scr failed: syntax error @[861,2] in file:/G:/AdobeCQ/bmwpdf/bundle/src/main/java/com/bmw/pdf/generator/GeneratorProcess.java -> [Help 1] 于是我试着将POM文件中的以下内容去掉: ``` <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding> <project.reporting.outputEncoding>UTF-8</project.reporting.outputEncoding> <maven.compiler.encoding>UTF-8</maven.compiler.encoding> ``` 并将Text file encoding改为GBK。保存,编译,运行,中文正常出现。 以上总结一下就是项目编码的问题导致的,最后改为默认的编码解决了。具体问题是代码中出现了中文字符,如何让这些中文字符输出到PDF中不出现乱码,就出现了要将项目配置中的编译POM文件进行相应的编码改动措施,然并卵,后来又改回去了。只是奇怪的是第一个项目做了两个月左右,一直没出错,从昨天开始就奇怪的出现因为编码出现的问题。 说实话,这个项目的编码问题花了我不少的时间,但终究还是没有弄得太懂,有的时候只能是凭着感觉去具体的解决问题。哎,这种感觉真是不爽。花时间去弄懂这个问题吧,其他的事情又是一大堆;不花时间吧,以后可能又是同样的问题。这也许就是程序员的无奈。
©️2020 CSDN 皮肤主题: 编程工作室 设计师:CSDN官方博客 返回首页