小編給大家分享一下/Java服務(wù)端對emoji支持與問(wèn)題的示例分析,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
問(wèn)題描述
將底層抓取的微博數據存入mysql,有些數據存入失敗,查看Tomcat后,核心錯誤信息如下:
// 拋出字符集不支持的異常
sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x97\xF0\x9F...' for column 'CONTENT' at row 1
原因分析
MYSQL 5.5 之前, utf8 編碼只支持1~3個(gè)字節,即BMP這部分的unicode編碼區(基本就是0000~FFFF這一區)。
Emoji表情是4個(gè)字節,而mysql的utf8編碼最多3個(gè)字節,所以導致數據插不進(jìn)去
5.5之后,mysql加入utf8mb4編碼,可支持4個(gè)字節,即一個(gè)字符最多能有4字符,因此utf8mb4編碼可支持更多的字符集。
因此,如果項目要存儲移動(dòng)產(chǎn)品的用戶(hù)文本,必須將DB字符集從UTF8/GBK等傳統字符集升級到utf8mb4
【注】
utf8mb4兼容utf8,且比utf8能表示更多的字符。所以將DB字符集從UTF8或GBK等傳統字符集升級到utf8mb4時(shí)不用擔心字符的兼容性問(wèn)題
過(guò)濾特殊的表情符
content = content.replaceAll("[\\x{10000}-\\x{10FFFF}]", "");// 簡(jiǎn)單粗暴,不人性化
升級數據庫字符集
1、utf8mb4支持的mysql版本為5.5.3+,若mysql低于該版本請先升級
2、修改database、table和column字符集
3、修改mysql配置文件my.cnf(windows為my.ini),my.cnf一般在etc/mysql/目錄下,找到后在以下三部分里添加如下內容:
[client] default-character-set = utf8mb4
[mysql] default-character-set = utf8mb4
[mysqld] character-set-client-handshake = FALSE character-set-server = utf8mb4 collation-server = utf8mb4_unicode_ci init_connect='SET NAMES utf8mb4'
4、重啟mysql并查看字符集
在mysql命令行輸入:
SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';
重啟之前的字符集
重啟之后的字符集
【注】
必須保證以下字段為utf8mb4
character_set_client
character_set_connection
character_set_database
character_set_results
character_set_server
以上4步完成后,利用mysql客戶(hù)端navicat在表中手動(dòng)加入Emoji表情?,若能保存成功說(shuō)明數據庫已升級成功。
這些字符集配置的具體區別參考 深入Mysql字符集設置
5、檢查端db配置文件
// 配置spring時(shí)使用的鏈接如下: url="jdbc:mysql://localhost:3306/gzhou?allowMultiQueries=true&useUnicode=true&zeroDateTimeBehavior=convertToNull&transformedBitIsBoolean=true&autoReconnect=true&autoReconnectForPools=true&failOverReadOnly=false&maxReconnects=10" // 若characterEncoding=utf8mb4,插入數據時(shí)報錯Caused by: java.sql.SQLException: Unsupported character encoding 'utf8mb4' // 去掉characterEncoding或characterEncoding=utf8
Emoji表情
android系統中,搜狗、百度輸入法自帶Emoji表情。
【注】
如果系統之間Emoji表情符號不兼容,只能看到方塊;
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng )、來(lái)自本網(wǎng)站內容采集于網(wǎng)絡(luò )互聯(lián)網(wǎng)轉載等其它媒體和分享為主,內容觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如侵犯了原作者的版權,請告知一經(jīng)查實(shí),將立刻刪除涉嫌侵權內容,聯(lián)系我們QQ:712375056,同時(shí)歡迎投稿傳遞力量。
Copyright ? 2009-2022 56dr.com. All Rights Reserved. 特網(wǎng)科技 特網(wǎng)云 版權所有 特網(wǎng)科技 粵ICP備16109289號
域名注冊服務(wù)機構:阿里云計算有限公司(萬(wàn)網(wǎng)) 域名服務(wù)機構:煙臺帝思普網(wǎng)絡(luò )科技有限公司(DNSPod) CDN服務(wù):阿里云計算有限公司 百度云 中國互聯(lián)網(wǎng)舉報中心 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證B2
建議您使用Chrome、Firefox、Edge、IE10及以上版本和360等主流瀏覽器瀏覽本網(wǎng)站