解決java轉義json出現\u0000 等亂碼的問題

今天遇到瞭String亂碼怎麼都去不瞭的問題,最後的解決方法很簡單,也不是方法的問題,是數據過濾之後進行的數據處理,在處理階段生成瞭亂碼,難怪我在過濾階段怎麼去都去不掉- -,不過花時間知道瞭很多處理亂碼的方法,在這裡記錄一下。

在將中文數據轉成json格式的時候,碰到瞭很多char型直接顯示出來的,比如\u0000, \u201d, \u201c

首先我想到的是我的數據篩選出現瞭問題,於是去修改瞭篩選的部分:

title = title.replaceAll(“\\u0000″,””);

title = title.replaceAll(“\u0000″,””);

首先是這種,利用String的replace和replaceAll方法去過濾,這也是大部分亂碼過濾的方法。

在這之後,我使用瞭直接循環處理char的方法,將String變成char型,然後一個一個判斷,雖然比較笨這個方法,但是也算一種吧,誰讓我菜呢。

之後我猜可能是編碼問題導致瞭亂碼,而現在不情況是隻有個別字符串中出現瞭亂碼,大部分還是正確的,所以不存在編碼問題。

後來我是在想是不是String轉Json的時候出現瞭問題,於是,將spring自帶的json換成瞭阿裡的fastjson,解決瞭部分的亂碼問題(\u201d, \u201c),但是\u0000這個東西就是去不掉。

google裡有人說string轉json最好用list也不是string[]

https://stackoverflow.com/questions/36696090/how-to-use-gson-to-encode-string-array-data-into-json-properly

我的解決

最後,我試著在數據處理完成後再刪除\u0000, 結果成功,哎,感覺浪費瞭好幾個小時啊。

補充:Java 中各種空(”、\u0000、null)的區別?

在使用下面的SQL查詢時,發現去不掉空格,而且把limit 去掉以後空格就沒有瞭,琢磨瞭很久才發現問題的關鍵所在。

主要是\u0000在作怪!!!

select id,company_name,username,remarks,address from table_alldata where company_name !=” and remarks is null limit 1000;

結果是這樣的:

回答:從class字節碼的角度來理解吧

1.String s1 = “”的情況,下面是編譯後的字節碼,可以看到,這種情況s1=”aaa”其實沒什麼區別的,都是從常量池推一個字符串到棧頂,並賦給本地變量。

2.String s2=null的情況,這個時候,並沒有在常量池中生成任何的字符串常量,僅僅是將null推送到棧頂賦值給變量。

3.String s3 = “u0000″的情況,會在常量池生成一個表示NUL的一個字符串,也就是所謂的Control Character。

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。

推薦閱讀: