챗지피티 출저 태그 일괄삭제 정규식 패턴 일괄 수정 방법
Q. ([People Power 21][2]) , ([서울Pn][3]), ([법률인들][1]) 위에 예를 든 문자열들을 정규식으로 표현해서 일괄 삭제하고 싶어. 어떻게 표현해?
A. 좋은 질문이에요. 지금 보여주신 문자열 패턴 ([텍스트][숫자])
은 Markdown 링크 형식 중 일부로, ()
안에 [문자열][숫자]
형태가 들어가 있죠. 이런 패턴을 정규식(Regular Expression) 으로 일괄 삭제하려면 아래처럼 표현하면 됩니다:
\(\[[^\]]+\]\[\d+\]\)
🔍 정규식 설명
-
\(
: 여는 괄호(
자체를 의미 (특수문자이므로 이스케이프 필요) -
\[
: 여는 대괄호[
-
[^\]]+
: 닫는 대괄호]
가 아닌 문자 1개 이상 → 즉, 내부 텍스트 (People Power 21
,서울Pn
,법률인들
등) -
\]
: 닫는 대괄호]
-
\[
: 다시 여는 대괄호[
-
\d+
: 숫자 1개 이상 (예:[1]
,[2]
,[3]
) -
\]
: 닫는 대괄호]
-
\)
: 닫는 괄호)
즉, ([문자열][숫자])
형태 전체를 탐지해서 삭제합니다.
✅ 예시
원문:
([People Power 21][2]) , ([서울Pn][3]), ([법률인들][1])
Python 예시 코드:
import re
text = "([People Power 21][2]) , ([서울Pn][3]), ([법률인들][1])"
cleaned = re.sub(r'\(\[[^\]]+\]\[\d+\]\)', '', text)
print(cleaned)
출력 결과:
, ,
⚙️ 확장 버전 (공백 포함 정리까지)
삭제 후 남은 불필요한 쉼표나 공백까지 정리하고 싶다면 아래처럼 한 단계 더 후처리하세요:
cleaned = re.sub(r'\s*,\s*', ', ', re.sub(r'\(\[[^\]]+\]\[\d+\]\)', '', text)).strip(', ')
결과:
(빈 문자열)
즉, 핵심 정규식은 다음과 같습니다.
✅
\(\[[^\]]+\]\[\d+\]\)
이 패턴을 텍스트 편집기(예: VSCode, Sublime Text 등)나 Python, JS 등에서 **“정규식 모드(Regex mode)”**로 찾아서 “치환 없이 삭제”하면 됩니다.