ssslackbot을 개발 중에 regex가 필요하게 되었다. 전각 느낌표(!
)로 시작하지 않는 중국어가 포함된 문자열을 확인해서 걸러내야하는 작업이다.
중국어 자판에서는 전각느낌표를 사용한다.
!
!=!
먼저 중국어 문자열의 범위를 살펴보자. 영어에서는 [a-z]
나 [A-Z]
등을 사용해서 간단히 거를 수 있다. 한글도 마찬가지로 [ㄱ-힇]
정도로 거른다. 하지만 중국어는 유니코드로 걸러내야한다. [\u4e00-\u9fff]
로 표현 …