[JavaScript] 常用的中文字符匹配js正则表达式 →→→→→进入此内容的聊天室

来自 , 2020-09-22, 写在 JavaScript, 查看 142 次.
URL http://www.code666.cn/view/fd4c2dc6
  1. 普遍使用的正则是[\u4e00-\u9fa5],但这个范围并不完整。例如:  
  2. /[\u4e00-\u9fa5]/.test( '⻏' ) // 测试部首⻏,返回false  
  3.  
  4. 根据Unicode 5.0版编码,要准确的判断一个中文字符要包括:  
  5. 范围            含义                范围               含义  
  6. 2E80-2EFF   CJK 部首补充    2F00-2FDF   康熙字典部首  
  7. 3000-303F   CJK 符号和标点   31C0-31EF   CJK 笔画  
  8. 3200-32FF   封闭式 CJK 文字和月份   3300-33FF   CJK 兼容  
  9. 3400-4DBF   CJK 统一表意符号扩展 A  4DC0-4DFF   易经六十四卦符号  
  10. 4E00-9FBF   CJK 统一表意符号  F900-FAFF   CJK 兼容象形文字  
  11. FE30-FE4F   CJK 兼容形式    FF00-FFEF   全角ASCII、全角标点  
  12.  
  13. 因此,正确的匹配中文字符正则表达式为:  
  14. var rcjk = /[\u2E80-\u2EFF\u2F00-\u2FDF\u3000-\u303F\u31C0-\u31EF\u3200-\u32FF\u3300-\u33FF\u3400-\u4DBF\u4DC0-\u4DFF\u4E00-\u9FBF\uF900-\uFAFF\uFE30-\uFE4F\uFF00-\uFFEF]+/g;  
  15.  
  16. 如果不希望匹配标点、符号,在正则中去掉对应的范围即可:  
  17. 3000-303F   CJK 符号和标点   FF00-FFEF   全角ASCII、全角标点

回复 "常用的中文字符匹配js正则表达式"

这儿你可以回复上面这条便签

captcha