E se eu te disser que "ERs são metacaracteres que casam um padrão"? Não entendeu?
Bem, como expressões regulares é um termo muito extenso, daqui adiante, chamarei apenas de ER (ê-érre) para simplificar a leitura. Outras nomenclaturas que podem ser encontradas em outras fontes são expreg, "regexp", "regex" e "RE". Particularmente "regex" é uma boa escolha para usar em ferramentas de busca na Internet.
E como estamos falando de termos, tem mais alguns novos que farão parte de nossa conversa. Lembra que as expressões são formadas por símbolos e caracteres literais? Esses símbolos são chamados de metacaracteres, pois possuem funções especiais, que veremos detalhadamente adiante.
Outro termo que é interessante e às vezes pode assustar um leitor meio distraído é o casar ("match"). Casamento aqui não é juntar os trapos, mas sim o ato de bater, conferir, combinar, igualar, encontrar, encaixar, equiparar. É como em um caixa 24 horas, em que você só retirará o dinheiro se sua senha digitada casar com aquela já cadastrada no banco.
Também temos o padrão ("pattern"), que é nosso objetivo quando fazemos uma ER: casar um padrão. Esse padrão pode ser uma palavra, várias, uma linha vazia, um número, ou seja, o que quer que precise ser encontrado pela nossa ER.
E ainda tem o robozinho, que é uma referência ao compilador e interpretador das expressões regulares, o código que vai ler, checar, entender e aplicar sua ER no texto desejado. Como exemplo, para programas em C
o robozinho é a biblioteca regex
, que faz todo o serviço.