Regex em Python: Aprenda a utilizar expressões regulares na linguagem de programação Python
As expressões regulares são sequências de caracteres que definem um padrão de busca em um texto.
Glossário
O que são expressões regulares?
As expressões regulares são sequências de caracteres que definem um padrão de busca em um texto. Elas são amplamente utilizadas em diversas áreas, como programação, processamento de texto, análise de dados e validação de formulários. Em resumo, as expressões regulares permitem encontrar, extrair e manipular informações de forma precisa e eficiente.
Como utilizar expressões regulares em Python?
No Python, a utilização de expressões regulares é facilitada pelo módulo “re”, que oferece diversas funções e métodos para trabalhar com expressões regulares. Para começar, é necessário importar o módulo utilizando o comando “import re”. A partir daí, é possível utilizar as funções e métodos disponíveis para realizar diversas operações.
Uma das principais funções do módulo “re” é a função “search”, que busca por um padrão em uma string. Por exemplo, para verificar se uma string contém um número de telefone no formato xxx-xxxx, podemos utilizar a expressão regular “\d{3}-\d{4}” juntamente com a função “search”. Se o padrão for encontrado, a função retorna um objeto “Match” que contém informações sobre a correspondência encontrada.
Além da função “search”, o módulo “re” também oferece outras funções úteis, como “match” para verificar se uma string começa com um determinado padrão, “findall” para encontrar todas as correspondências em uma string, e “sub” para substituir correspondências por outro texto.
Principais funções e métodos para trabalhar com expressões regulares em Python
Agora que já conhecemos o básico sobre expressões regulares em Python, vamos explorar algumas das principais funções e métodos disponíveis no módulo “re” para trabalhar com esses padrões.
1. search(pattern, string)
Busca por um padrão em uma string e retorna a primeira correspondência encontrada.
2. match(pattern, string)
Verifica se uma string começa com um determinado padrão.



3. findall(pattern, string)
Encontra todas as correspondências de um padrão em uma string e retorna uma lista com os resultados.
4. sub(pattern, repl, string)
Substitui todas as correspondências de um padrão por outro texto em uma string.
5. split(pattern, string)
Divide uma string em partes utilizando um padrão como separador.
6. compile(pattern)
Compila um padrão em um objeto regex, que pode ser reutilizado em diversas operações.
Exemplos práticos de uso de expressões regulares em Python
Vamos agora ver alguns exemplos práticos de como utilizar expressões regulares em Python para resolver problemas comuns.
Exemplo 1: Validação de e-mails
Uma tarefa comum é validar se um e-mail está em um formato válido. Podemos fazer isso utilizando uma expressão regular que verifica se a string possui o formato adequado. Por exemplo, a expressão regular “^\w+([\.-]?\w+)*@\w+([\.-]?\w+)*(\.\w{2,3})+$” pode ser utilizada para validar e-mails.
Exemplo 2: Extração de dados
Suponha que temos um texto que contém várias datas no formato “dd/mm/yyyy” e queremos extrair todas essas datas. Podemos utilizar a função “findall” juntamente com a expressão regular “\d{2}/\d{2}/\d{4}” para realizar essa tarefa.
Exemplo 3: Substituição de texto
Imagine que temos um texto com números de telefone no formato “(xx) xxxxx-xxxx” e queremos substituir todos os números por “XXXX-XXXX”. Podemos utilizar a função “sub” juntamente com a expressão regular “\(\d{2}\) \d{5}-\d{4}” para realizar essa substituição.
Conclusão
As expressões regulares são uma ferramenta poderosa para buscar e manipular texto em Python. Com o módulo “re”, é possível utilizar funções e métodos para realizar diversas operações, como busca, validação, extração e substituição. Aprender a utilizar expressões regulares em Python é fundamental para qualquer desenvolvedor que trabalhe com processamento de texto e análise de dados. Portanto, pratique e explore os recursos oferecidos pelo módulo “re” para dominar o uso de expressões regulares em Python.
Principais funções e métodos para trabalhar com expressões regulares em Python
O módulo “re” do Python oferece diversas funções e métodos que facilitam o trabalho com expressões regulares. A seguir, apresentaremos algumas das principais funcionalidades disponíveis para manipular e extrair informações de texto utilizando expressões regulares em Python.
search(pattern, string)
Essa função permite buscar por um padrão em uma string e retorna a primeira correspondência encontrada. Ela pode ser útil quando precisamos verificar se um determinado padrão está presente em um texto. Por exemplo, podemos utilizar o padrão “\d{3}-\d{4}” para buscar por números de telefone no formato xxx-xxxx.
match(pattern, string)
Essa função verifica se uma string começa com um determinado padrão. Ela é útil quando precisamos validar se uma string segue um formato específico desde o início. Por exemplo, podemos utilizar o padrão “^[A-Za-z]+\d{2}$” para verificar se uma string começa com letras seguidas de dois dígitos.



findall(pattern, string)
Essa função encontra todas as correspondências de um padrão em uma string e retorna uma lista com os resultados. Ela é útil quando precisamos extrair informações de um texto que seguem um determinado formato. Por exemplo, podemos utilizar o padrão “\d{2}/\d{2}/\d{4}” para encontrar todas as datas no formato dd/mm/yyyy em um texto.
sub(pattern, repl, string)
Essa função substitui todas as correspondências de um padrão por outro texto em uma string. Ela pode ser utilizada para realizar substituições em um texto de forma rápida e eficiente. Por exemplo, podemos utilizar o padrão “\d{4}” para substituir todos os números de quatro dígitos por “XXXX” em uma string.
split(pattern, string)
Essa função divide uma string em partes utilizando um padrão como separador. Ela é útil quando precisamos separar uma string em diferentes partes com base em um determinado padrão. Por exemplo, podemos utilizar o padrão “,” para dividir uma lista de nomes separados por vírgula em uma string.
Exemplos práticos de uso de expressões regulares em Python
Agora que já conhecemos as principais funcionalidades do módulo “re” para trabalhar com expressões regulares em Python, vamos explorar alguns exemplos práticos de uso dessas ferramentas.
Exemplo 1: Validação de CPF
O CPF é um documento importante e possui um formato específico. Podemos utilizar expressões regulares em Python para validar se um CPF está em um formato válido. Utilizando o padrão “\d{3}\.\d{3}\.\d{3}-\d{2}”, podemos buscar por correspondências desse formato em uma string e verificar se o CPF é válido.
Exemplo 2: Extração de domínios de e-mails
Suponha que temos uma lista de e-mails e queremos extrair apenas os domínios de cada endereço. Utilizando a função “findall” juntamente com o padrão “@(\w+\.\w+)”, podemos encontrar todas as correspondências de domínios em uma lista de e-mails.
Exemplo 3: Substituição de tags HTML
Em algumas situações, pode ser necessário remover ou substituir tags HTML de um texto. Utilizando a função “sub” juntamente com o padrão “<[^>]*>”, podemos substituir todas as tags HTML por uma string vazia, removendo-as do texto.
Conclusão
As expressões regulares são uma poderosa ferramenta para buscar e manipular texto em Python. Com o módulo “re” e suas funções e métodos, podemos realizar diversas operações, como busca, validação, extração e substituição de padrões em strings. Aprender a utilizar expressões regulares em Python é fundamental para qualquer desenvolvedor que trabalhe com processamento de texto e análise de dados. Portanto, pratique e explore os recursos oferecidos pelo módulo “re” para dominar o uso de expressões regulares na linguagem de programação Python.
A Awari é a melhor plataforma para aprender sobre ciência de dados no Brasil.
Aqui você encontra cursos com aulas ao vivo, mentorias individuais com os melhores profissionais do mercado e suporte de carreira personalizado para dar seu próximo passo profissional e aprender habilidades como Data Science, Data Analytics, Machine Learning e mais.
Já pensou em aprender de maneira individualizada com profissionais que atuam em empresas como Nubank, Amazon e Google? Clique aqui para se inscrever na Awari e começar a construir agora mesmo o próximo capítulo da sua carreira em dados.


