Python: A Leitura de Arquivos TXT
Neste artigo, vamos explorar técnicas e métodos para ler e manipular arquivos TXT utilizando Python.
Glossário
Como ler arquivos TXT com Python
Introdução
A leitura de arquivos TXT é uma tarefa comum quando se trabalha com programação em Python. Felizmente, a linguagem oferece diversas maneiras de realizar essa operação de forma eficiente e simples. Neste artigo, vamos explorar algumas técnicas e métodos para ler arquivos TXT utilizando Python.
Utilizando a função built-in open()
Uma das formas mais básicas de ler um arquivo TXT em Python é utilizando a função built-in open()
. Essa função permite abrir um arquivo em um determinado modo, como leitura, escrita ou ambos. Para ler um arquivo TXT, devemos utilizar o modo de leitura, representado pelo caractere r
. Veja o exemplo abaixo:
arquivo = open("arquivo.txt", "r")
conteudo = arquivo.read()
print(conteudo)
arquivo.close()
Nesse exemplo, abrimos o arquivo “arquivo.txt” no modo de leitura e atribuímos o objeto arquivo a uma variável chamada arquivo
. Em seguida, utilizamos o método read()
, que lê todo o conteúdo do arquivo e o armazena na variável conteudo
. Por fim, exibimos o conteúdo na tela e fechamos o arquivo utilizando o método close()
.
Utilizando o bloco de código with
Outra forma de ler arquivos TXT em Python é utilizando o bloco de código with
. Esse bloco garante que o arquivo seja fechado automaticamente após a leitura, mesmo em caso de exceções. Veja o exemplo:
with open("arquivo.txt", "r") as arquivo:
conteudo = arquivo.read()
print(conteudo)
Nesse exemplo, abrimos o arquivo “arquivo.txt” no modo de leitura e atribuímos o objeto arquivo ao bloco with
. Dentro desse bloco, utilizamos o método read()
para ler o conteúdo do arquivo e o exibimos na tela.
Outros métodos de leitura de arquivos TXT
Além das formas básicas de leitura de arquivos TXT, Python também oferece outros métodos mais avançados. Podemos utilizar o módulo csv
para ler arquivos CSV, o módulo json
para ler arquivos JSON, entre outros. Esses módulos facilitam a leitura e manipulação de diferentes formatos de arquivos.



Conclusão
Em resumo, a leitura de arquivos TXT em Python é uma tarefa simples e versátil. Podemos utilizar a função open()
ou o bloco with
para abrir e ler o conteúdo do arquivo. Além disso, existem módulos específicos para leitura de outros formatos de arquivos. Com essas ferramentas, podemos manipular e extrair informações de arquivos TXT de forma eficiente e poderosa.
Principais métodos de leitura de arquivos TXT em Python
Ao trabalhar com arquivos TXT em Python, é importante conhecer os principais métodos disponíveis para realizar a leitura e manipulação desses arquivos. Nesta seção, vamos explorar alguns dos métodos mais utilizados para lidar com arquivos TXT em Python.
Método read()
Esse método é utilizado para ler todo o conteúdo de um arquivo e retorná-lo como uma string. Ele lê desde o início do arquivo até o final, e podemos especificar opcionalmente a quantidade de bytes a serem lidos. Exemplo:
with open("arquivo.txt", "r") as arquivo:
conteudo = arquivo.read()
print(conteudo)
Método readline()
Esse método é utilizado para ler uma linha de cada vez de um arquivo. Ele retorna a linha atual do arquivo como uma string e avança o cursor para a próxima linha. Exemplo:
with open("arquivo.txt", "r") as arquivo:
linha = arquivo.readline()
while linha:
print(linha)
linha = arquivo.readline()
Método readlines()
Esse método é utilizado para ler todas as linhas de um arquivo e retorná-las como uma lista de strings. Cada elemento da lista corresponde a uma linha do arquivo. Exemplo:
with open("arquivo.txt", "r") as arquivo:
linhas = arquivo.readlines()
for linha in linhas:
print(linha)
Método seek()
Esse método é utilizado para mover o cursor de leitura para uma posição específica no arquivo. Podemos especificar um deslocamento em bytes a partir do início do arquivo. Exemplo:
with open("arquivo.txt", "r") as arquivo:
arquivo.seek(10) # Move o cursor para a posição 10
conteudo = arquivo.read()
print(conteudo)
Dicas avançadas para a leitura de arquivos TXT utilizando Python
Ao trabalhar com a leitura de arquivos TXT em Python, existem algumas dicas avançadas que podem facilitar e otimizar o processo. Nesta seção, vamos explorar algumas dessas dicas para ajudar você a obter o máximo desempenho ao lidar com arquivos TXT.
Utilize o encoding correto
Em alguns casos, os arquivos TXT podem estar codificados em um formato específico, como UTF-8 ou Latin-1. É importante especificar o encoding correto ao abrir o arquivo, para garantir que os caracteres sejam lidos corretamente. Exemplo:
with open("arquivo.txt", "r", encoding="utf-8") as arquivo:
conteudo = arquivo.read()
print(conteudo)
Utilize o contexto with
O bloco with é uma forma segura e eficiente de lidar com arquivos, pois garante que o arquivo seja fechado automaticamente após o uso, mesmo em caso de exceções. Sempre que possível, utilize o bloco with ao invés de abrir e fechar o arquivo manualmente. Exemplo:
with open("arquivo.txt", "r") as arquivo:
conteudo = arquivo.read()
print(conteudo)
Utilize a compressão de arquivos
Em algumas situações, os arquivos TXT podem ser muito grandes e ocupar uma quantidade significativa de espaço em disco. Para otimizar o armazenamento e a leitura desses arquivos, é possível utilizar a compressão, por exemplo, com o módulo gzip. Exemplo:
import gzip
with gzip.open("arquivo.txt.gz", "rt") as arquivo:
conteudo = arquivo.read()
print(conteudo)
Utilize a biblioteca Pandas
Caso você precise trabalhar com dados estruturados em arquivos TXT, a biblioteca Pandas pode ser uma ótima opção. Ela permite ler e manipular arquivos TXT de forma eficiente, utilizando estruturas de dados como DataFrames. Exemplo:
import pandas as pd
dados = pd.read_csv("arquivo.txt", delimiter="\t")
print(dados.head())
Manipulando dados de arquivos TXT com Python
A leitura de arquivos TXT em Python é apenas o primeiro passo para trabalhar com dados. Após ler o conteúdo do arquivo, é comum que seja necessário realizar manipulações nos dados para extrair informações relevantes ou realizar algum tipo de processamento. Nesta seção, vamos explorar algumas técnicas e métodos para manipular dados de arquivos TXT utilizando Python.
Utilizando métodos de string
Uma das formas mais simples de manipular dados de arquivos TXT é utilizando os métodos de string disponíveis em Python. Podemos utilizar os métodos split()
e strip()
para dividir as linhas do arquivo em partes ou remover espaços em branco indesejados. Por exemplo, se tivermos um arquivo TXT contendo nomes e idades separados por vírgula, podemos utilizar o seguinte código para separar os nomes das idades:



with open("arquivo.txt", "r") as arquivo:
linhas = arquivo.readlines()
for linha in linhas:
dados = linha.strip().split(",")
nome = dados[0]
idade = int(dados[1])
print(f"Nome: {nome}, Idade: {idade}")
Utilizando a biblioteca Pandas
Além dos métodos de string, Python também oferece bibliotecas poderosas para a manipulação de dados, como a biblioteca Pandas. O Pandas é amplamente utilizado para a análise e manipulação de dados tabulares, e possui recursos avançados para trabalhar com arquivos TXT. Podemos utilizar o método read_csv()
do Pandas para ler um arquivo TXT como um DataFrame e realizar diversas operações. Por exemplo:
import pandas as pd
dados = pd.read_csv("arquivo.txt", delimiter="\t")
print(dados.head())
Utilizando expressões regulares
Outra técnica comum na manipulação de dados de arquivos TXT é a utilização de expressões regulares. As expressões regulares permitem buscar e manipular padrões específicos nos dados. Por exemplo, se quisermos extrair todos os e-mails de um arquivo TXT, podemos utilizar o seguinte código:
import re
with open("arquivo.txt", "r") as arquivo:
linhas = arquivo.readlines()
padrao = r"\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b"
for linha in linhas:
emails = re.findall(padrao, linha)
for email in emails:
print(email)
Dicas avançadas para a leitura de arquivos TXT utilizando Python
Quando se trata de ler e manipular arquivos TXT em Python, existem algumas dicas avançadas que podem ajudar a otimizar o processo e facilitar o trabalho. Nesta seção, vamos explorar algumas dessas dicas para a leitura de arquivos TXT utilizando Python.
Utilize o módulo os para trabalhar com caminhos de arquivos
O módulo os oferece diversas funções para manipular caminhos de arquivos, como a função os.path.join()
para juntar caminhos e a função os.path.abspath()
para obter o caminho absoluto de um arquivo. Utilizar essas funções pode evitar problemas relacionados à formatação de caminhos e facilitar a leitura de arquivos em diferentes sistemas operacionais.
Utilize o módulo glob para trabalhar com múltiplos arquivos
O módulo glob permite buscar arquivos em um diretório utilizando padrões de nome, como por exemplo, *.txt para buscar todos os arquivos com extensão TXT. Isso pode ser útil quando você precisa ler e processar vários arquivos de uma só vez.
Utilize a biblioteca numpy para trabalhar com dados numéricos
Se você estiver lidando com arquivos TXT que contêm dados numéricos, a biblioteca numpy pode ser uma ótima opção. Ela oferece estruturas de dados eficientes e operações matemáticas poderosas para trabalhar com arrays multidimensionais. Essa biblioteca pode facilitar a leitura e manipulação de dados numéricos em arquivos TXT.
Utilize o mecanismo de exceções para lidar com erros
Ao ler arquivos TXT em Python, é importante estar preparado para lidar com possíveis erros, como arquivos inexistentes ou permissões de acesso negadas. Utilize os blocos try e except para capturar e tratar essas exceções de forma adequada, garantindo que o seu código seja robusto e confiável.
Conclusão
Python: A Leitura de Arquivos TXT é uma tarefa essencial para trabalhar com dados e realizar análises. Com as técnicas e métodos apresentados neste artigo, você estará preparado para ler e manipular arquivos TXT de forma eficiente e poderosa. Explore essas possibilidades e aproveite ao máximo o potencial da linguagem Python.
A Awari é a melhor plataforma para aprender sobre ciência de dados no Brasil.
Aqui você encontra cursos com aulas ao vivo, mentorias individuais com os melhores profissionais do mercado e suporte de carreira personalizado para dar seu próximo passo profissional e aprender habilidades como Data Science, Data Analytics, Machine Learning e mais.
Já pensou em aprender de maneira individualizada com profissionais que atuam em empresas como Nubank, Amazon e Google? Clique aqui para se inscrever na Awari e começar a construir agora mesmo o próximo capítulo da sua carreira em dados.


