歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux編程 >> Linux編程 >> Java正則表達式識別中文

Java正則表達式識別中文

日期:2017/3/1 10:27:04   编辑:Linux編程
從由漢字,大小寫英文,數字組成的語句中分離漢字:
  1. public static void regxChinese()
  2. {
  3. String source = "桑德斯ABdD3ddd5222字符串轉換健康康可能34f豐富4f成小寫dx5kljfdsljDSknf943立即地方立即的ddd頂頂頂3";
  4. String reg_charset = "([a-z]*)([A-Z]*)([0-9]*)([\u4E00-\u9FA5]*)";
  5. Pattern p = Pattern.compile(reg_charset);
  6. Matcher m = p.matcher(source);
  7. String tag = "demo";
  8. while (m.find())
  9. {
  10. Log.d(tag,"0~~~~~~~~~~~~~~~ " + m.group(0));
  11. Log.d(tag,"1~~~ " + m.group(1));
  12. Log.d(tag,"2~~~ " + m.group(2));
  13. Log.d(tag,"3~~~ " + m.group(3));
  14. Log.d(tag,"4~~~ " + m.group(4));
  15. }
  16. }

以上方法也實現了將大寫英文,小寫英文,數字,中文的互相分離。

Copyright © Linux教程網 All Rights Reserved