Las expresiones regulares solo pueden ingresar caracteres y letras chinos
El modificador de patrón U debe agregarse después de la cadena codificada.
Expresión regular: [\\u4e00-\\u9fa5]*|\\w*|\\d*|_*
El código es el siguiente:
@Testpublicvoidtest1(){// Coincidir con expresión regular Stringstr="[\\u4e00-\u9fa5]*| comfromrunning(STR); //
String StringmStr="howfar_344fjdk"; afuera. println("prueba de cadena:"+mStr); Matcherm=patrón. Matcher (mStr); //
Si (m.ind()) coincide, {system. afuera. println("matchcontent:"+m.group());}}
Resultados de ejecución del programa:
Información ampliada:
Notas:
Coincide con cualquier carácter de palabra que contenga un guión bajo. Similar pero injusto "(Zan——z0-9_)", el conjunto de caracteres Unicode del carácter "esta palabra", que hace uso completo del chino es:
\u4e00——\\u9fa5], hablando Las letras en inglés \w representan el número \d, _, _* son cero o más, | o expresión, por lo que se puede decir que cada empalme coincidente coincide con la expresión regular.