TIL

Articles with the regex tag

[Regex] 특정문자로 시작하지 않는 중국어가 포함된 문자열2017-04-09, Sun

ssslackbot을 개발 중에 regex가 필요하게 되었다. 전각 느낌표()로 시작하지 않는 중국어가 포함된 문자열을 확인해서 걸러내야하는 작업이다.

중국어 자판에서는 전각느낌표를 사용한다. != !

먼저 중국어 문자열의 범위를 살펴보자. 영어에서는 [a-z][A-Z]등을 사용해서 간단히 거를 수 있다. 한글도 마찬가지로 [ㄱ-힇] 정도로 거른다. 하지만 중국어는 유니코드로 걸러내야한다. [\u4e00-\u9fff]로 표현 …

more...