CSV: Como ler e manipular arquivos CSV com Python e Pandas
Neste guia, você aprenderá como ler um arquivo CSV com Python e Pandas, utilizando a função read_csv().
Glossário
Como ler um arquivo CSV com Python e Pandas
Introdução
Ler e manipular arquivos CSV é uma tarefa comum ao lidar com dados em Python. Felizmente, existem várias bibliotecas poderosas disponíveis para facilitar esse processo, sendo o Pandas uma das mais populares e amplamente utilizadas. Neste guia, você aprenderá como ler um arquivo CSV usando Python e Pandas, permitindo que você acesse e manipule facilmente os dados contidos nele.
Importando o Pandas
Para começar, é necessário importar a biblioteca Pandas. Certifique-se de que você tenha o Pandas instalado em seu ambiente Python. Caso não possua, você pode instalá-lo usando o comando pip install pandas
. Após a instalação, você pode importar o Pandas em seu código usando a seguinte linha:
import pandas as pd
Lendo um arquivo CSV
Com o Pandas importado, você pode usar a função read_csv()
para ler um arquivo CSV. Essa função permite que você especifique o caminho do arquivo e outros parâmetros opcionais, como o delimitador, a codificação, entre outros. Por exemplo, para ler um arquivo chamado “dados.csv”, você pode usar o seguinte código:
data = pd.read_csv('dados.csv')
Ao executar esse código, o Pandas lerá o arquivo CSV e armazenará os dados em um DataFrame, uma estrutura de dados tabular do Pandas que facilita a manipulação e análise dos dados. Agora você pode realizar várias operações no DataFrame, como exibir os primeiros registros, verificar a estrutura dos dados e realizar cálculos estatísticos.
Manipulando dados em um arquivo CSV
Uma vez que você tenha lido um arquivo CSV com o Pandas, existem diversas operações que você pode realizar para manipular e analisar os dados. Abaixo estão algumas das principais funcionalidades do Pandas para manipulação de dados em um arquivo CSV:



Selecionando colunas
O Pandas permite que você selecione colunas específicas do DataFrame, permitindo que você trabalhe apenas com os dados relevantes para sua análise. Por exemplo, para selecionar a coluna “idade” do DataFrame “data”, você pode usar o seguinte código:
idade = data['idade']
Filtrando dados
O Pandas permite que você filtre os dados com base em determinadas condições. Isso é útil quando você deseja extrair apenas os registros que atendam a certos critérios. Por exemplo, para filtrar os registros em que a idade seja maior que 18, você pode usar o seguinte código:
maiores_de_idade = data[data['idade'] > 18]
Criando novas colunas
O Pandas permite que você crie novas colunas a partir dos dados existentes em seu DataFrame. Isso é útil quando você deseja realizar cálculos ou transformações nos dados. Por exemplo, para criar uma nova coluna chamada “dobro_idade” que contenha o dobro da idade, você pode usar o seguinte código:
data['dobro_idade'] = data['idade'] * 2
Agrupando e resumindo dados
O Pandas oferece recursos para agrupar e resumir os dados com base em determinadas variáveis. Isso é útil quando você deseja obter informações agregadas sobre seus dados. Por exemplo, para calcular a média da idade agrupada por sexo, você pode usar o seguinte código:
media_idade_por_sexo = data.groupby('sexo')['idade'].mean()
Essas são apenas algumas das funcionalidades do Pandas para manipulação de dados em um arquivo CSV. O Pandas oferece uma ampla gama de recursos poderosos que permitem que você realize análises complexas e manipulações nos dados.
Operações de leitura e escrita em um arquivo CSV
O Pandas não só permite a leitura de arquivos CSV, mas também oferece recursos para realizar operações de escrita nos dados. Nesta seção, vamos explorar como realizar operações de leitura e escrita em um arquivo CSV usando Python e Pandas.
Escrevendo um arquivo CSV
Para escrever um DataFrame em um arquivo CSV, o Pandas oferece o método to_csv()
. Esse método permite que você especifique o caminho do arquivo e outros parâmetros opcionais, como o delimitador, a codificação, entre outros. Por exemplo, para escrever um DataFrame chamado “data” em um arquivo chamado “dados.csv”, você pode usar o seguinte código:
data.to_csv('dados.csv')
Ao executar esse código, o Pandas criará um arquivo CSV chamado “dados.csv” e gravará os dados do DataFrame nele. É importante mencionar que o arquivo CSV será criado no mesmo diretório em que o seu código Python está sendo executado.



Operações de leitura e escrita simultâneas
Além da operação de escrita, o Pandas também oferece recursos para realizar operações de leitura e escrita simultaneamente em um arquivo CSV. Por exemplo, digamos que você tenha um arquivo CSV chamado “dados.csv” e queira adicionar novos dados a ele. Você pode fazer isso lendo o arquivo original em um DataFrame, realizando as alterações desejadas no DataFrame e, em seguida, escrevendo o DataFrame atualizado de volta no mesmo arquivo CSV. Para fazer isso, você pode usar o seguinte código:
data = pd.read_csv('dados.csv')
# Realize as operações desejadas no DataFrame
# ...
data.to_csv('dados.csv', index=False)
Ao definir o parâmetro index
como False
, você evitará que o Pandas escreva o índice do DataFrame no arquivo CSV.
Principais funcionalidades do pacote Pandas para trabalhar com arquivos CSV
O Pandas é uma biblioteca poderosa e versátil que oferece diversas funcionalidades para manipular e analisar dados em arquivos CSV. Abaixo estão algumas das principais funcionalidades do Pandas para trabalhar com arquivos CSV:
- Leitura e escrita flexíveis
- Manipulação de dados
- Agregação e resumo de dados
- Manipulação de datas e horários
- Visualização de dados
Essas são apenas algumas das principais funcionalidades do pacote Pandas para trabalhar com arquivos CSV. O Pandas oferece uma ampla gama de recursos e funcionalidades adicionais que podem ser explorados para atender às suas necessidades específicas de análise e manipulação de dados.
A Awari é a melhor plataforma para aprender sobre ciência de dados no Brasil.
Aqui você encontra cursos com aulas ao vivo, mentorias individuais com os melhores profissionais do mercado e suporte de carreira personalizado para dar seu próximo passo profissional e aprender habilidades como Data Science, Data Analytics, Machine Learning e mais.
Já pensou em aprender de maneira individualizada com profissionais que atuam em empresas como Nubank, Amazon e Google? Clique aqui para se inscrever na Awari e começar a construir agora mesmo o próximo capítulo da sua carreira em dados.


