소개
정규 표현식(regular expression) 혹은 정규식(regex)은 텍스트를 찾고 조작하는 데 쓰는 문자열입니다.
정규 표현식은 텍스트를 조작하는 가장 강력한 도구 중 하나입니다.
정규 표현식을 사용하는 유형은 두 가지로 나뉩니다. 검색와 치환입니다. 유효성 검사도 일종의 검색입니다.
정규 표현식은 정규 표현 언어를 사용해 만듭니다. 정규 표현 언어는 완전한 프로그래밍 언어가 아닙니다. 다른 프로그래밍 언어나 제품에 포함된 작은 언어(mini language)일 때가 많습니다.
메타 문자는 정규 표현식에서 특별한 의미를 가지는 문자입니다.
팁:
정규 표현식으로 예상한 결과를 일치시키는 일은 쉽습니다. 하지만 원하지 않는 결과와 일치하지 않도록, 발생할 수 있는 상황을 모두 예상해 정규 표현식을 작성하는 일은 훨씬 어렵습니다.
정규 표현식에 옳고 그름은 없습니다. 얼마나 엄격하게 패턴을 일치시킬지에 따라 패턴이 복잡해지는 정도가 달라질 뿐입니다.
메타 문자를 순수한 문자로 사용할 때는
\
을 이용해 명시적으로 이스케이프하는 것이 좋습니다.텍스트 형식을 바꿔야 할 때는 해당 텍스트를 여러 조각의 하위 표현식으로 나누는 편이 좋습니다.