Facebook pixel
>Blog>Ciência de Dados
Ciência de Dados

CSV: Como ler e manipular arquivos CSV com Python e Pandas

Neste guia, você aprenderá como ler um arquivo CSV com Python e Pandas, utilizando a função read_csv().

Como ler um arquivo CSV com Python e Pandas

Introdução

Ler e manipular arquivos CSV é uma tarefa comum ao lidar com dados em Python. Felizmente, existem várias bibliotecas poderosas disponíveis para facilitar esse processo, sendo o Pandas uma das mais populares e amplamente utilizadas. Neste guia, você aprenderá como ler um arquivo CSV usando Python e Pandas, permitindo que você acesse e manipule facilmente os dados contidos nele.

Importando o Pandas

Para começar, é necessário importar a biblioteca Pandas. Certifique-se de que você tenha o Pandas instalado em seu ambiente Python. Caso não possua, você pode instalá-lo usando o comando pip install pandas. Após a instalação, você pode importar o Pandas em seu código usando a seguinte linha:

import pandas as pd

Lendo um arquivo CSV

Com o Pandas importado, você pode usar a função read_csv() para ler um arquivo CSV. Essa função permite que você especifique o caminho do arquivo e outros parâmetros opcionais, como o delimitador, a codificação, entre outros. Por exemplo, para ler um arquivo chamado “dados.csv”, você pode usar o seguinte código:

data = pd.read_csv('dados.csv')

Ao executar esse código, o Pandas lerá o arquivo CSV e armazenará os dados em um DataFrame, uma estrutura de dados tabular do Pandas que facilita a manipulação e análise dos dados. Agora você pode realizar várias operações no DataFrame, como exibir os primeiros registros, verificar a estrutura dos dados e realizar cálculos estatísticos.

Manipulando dados em um arquivo CSV

Uma vez que você tenha lido um arquivo CSV com o Pandas, existem diversas operações que você pode realizar para manipular e analisar os dados. Abaixo estão algumas das principais funcionalidades do Pandas para manipulação de dados em um arquivo CSV:

Nossa metodologia de ensino tem eficiência comprovada
Nossa metodologia de ensino tem eficiência comprovada Aprenda uma nova língua na maior escola de idiomas do mundo! Conquiste a fluência no idioma que sempre sonhou com uma solução de ensino completa. Quero estudar na Fluency
Nossa metodologia de ensino tem eficiência comprovada

Selecionando colunas

O Pandas permite que você selecione colunas específicas do DataFrame, permitindo que você trabalhe apenas com os dados relevantes para sua análise. Por exemplo, para selecionar a coluna “idade” do DataFrame “data”, você pode usar o seguinte código:

idade = data['idade']

Filtrando dados

O Pandas permite que você filtre os dados com base em determinadas condições. Isso é útil quando você deseja extrair apenas os registros que atendam a certos critérios. Por exemplo, para filtrar os registros em que a idade seja maior que 18, você pode usar o seguinte código:

maiores_de_idade = data[data['idade'] > 18]

Criando novas colunas

O Pandas permite que você crie novas colunas a partir dos dados existentes em seu DataFrame. Isso é útil quando você deseja realizar cálculos ou transformações nos dados. Por exemplo, para criar uma nova coluna chamada “dobro_idade” que contenha o dobro da idade, você pode usar o seguinte código:

data['dobro_idade'] = data['idade'] * 2

Agrupando e resumindo dados

O Pandas oferece recursos para agrupar e resumir os dados com base em determinadas variáveis. Isso é útil quando você deseja obter informações agregadas sobre seus dados. Por exemplo, para calcular a média da idade agrupada por sexo, você pode usar o seguinte código:

media_idade_por_sexo = data.groupby('sexo')['idade'].mean()

Essas são apenas algumas das funcionalidades do Pandas para manipulação de dados em um arquivo CSV. O Pandas oferece uma ampla gama de recursos poderosos que permitem que você realize análises complexas e manipulações nos dados.

Operações de leitura e escrita em um arquivo CSV

O Pandas não só permite a leitura de arquivos CSV, mas também oferece recursos para realizar operações de escrita nos dados. Nesta seção, vamos explorar como realizar operações de leitura e escrita em um arquivo CSV usando Python e Pandas.

Escrevendo um arquivo CSV

Para escrever um DataFrame em um arquivo CSV, o Pandas oferece o método to_csv(). Esse método permite que você especifique o caminho do arquivo e outros parâmetros opcionais, como o delimitador, a codificação, entre outros. Por exemplo, para escrever um DataFrame chamado “data” em um arquivo chamado “dados.csv”, você pode usar o seguinte código:

data.to_csv('dados.csv')

Ao executar esse código, o Pandas criará um arquivo CSV chamado “dados.csv” e gravará os dados do DataFrame nele. É importante mencionar que o arquivo CSV será criado no mesmo diretório em que o seu código Python está sendo executado.

Nossa metodologia de ensino tem eficiência comprovada
Nossa metodologia de ensino tem eficiência comprovada Aprenda uma nova língua na maior escola de idiomas do mundo! Conquiste a fluência no idioma que sempre sonhou com uma solução de ensino completa. Quero estudar na Fluency
Nossa metodologia de ensino tem eficiência comprovada

Operações de leitura e escrita simultâneas

Além da operação de escrita, o Pandas também oferece recursos para realizar operações de leitura e escrita simultaneamente em um arquivo CSV. Por exemplo, digamos que você tenha um arquivo CSV chamado “dados.csv” e queira adicionar novos dados a ele. Você pode fazer isso lendo o arquivo original em um DataFrame, realizando as alterações desejadas no DataFrame e, em seguida, escrevendo o DataFrame atualizado de volta no mesmo arquivo CSV. Para fazer isso, você pode usar o seguinte código:

data = pd.read_csv('dados.csv')
# Realize as operações desejadas no DataFrame
# ...
data.to_csv('dados.csv', index=False)

Ao definir o parâmetro index como False, você evitará que o Pandas escreva o índice do DataFrame no arquivo CSV.

Principais funcionalidades do pacote Pandas para trabalhar com arquivos CSV

O Pandas é uma biblioteca poderosa e versátil que oferece diversas funcionalidades para manipular e analisar dados em arquivos CSV. Abaixo estão algumas das principais funcionalidades do Pandas para trabalhar com arquivos CSV:

  • Leitura e escrita flexíveis
  • Manipulação de dados
  • Agregação e resumo de dados
  • Manipulação de datas e horários
  • Visualização de dados

Essas são apenas algumas das principais funcionalidades do pacote Pandas para trabalhar com arquivos CSV. O Pandas oferece uma ampla gama de recursos e funcionalidades adicionais que podem ser explorados para atender às suas necessidades específicas de análise e manipulação de dados.

A Awari é a melhor plataforma para aprender sobre ciência de dados no Brasil.

Aqui você encontra cursos com aulas ao vivo, mentorias individuais com os melhores profissionais do mercado e suporte de carreira personalizado para dar seu próximo passo profissional e aprender habilidades como Data Science, Data Analytics, Machine Learning e mais.

Já pensou em aprender de maneira individualizada com profissionais que atuam em empresas como Nubank, Amazon e Google? Clique aqui para se inscrever na Awari e começar a construir agora mesmo o próximo capítulo da sua carreira em dados.

Nossa metodologia de ensino tem eficiência comprovada
Nossa metodologia de ensino tem eficiência comprovada Aprenda uma nova língua na maior escola de idiomas do mundo! Conquiste a fluência no idioma que sempre sonhou com uma solução de ensino completa. Quero estudar na Fluency
Nossa metodologia de ensino tem eficiência comprovada
Nossa metodologia de ensino tem eficiência comprovada
Nossa metodologia de ensino tem eficiência comprovada

Aprenda uma nova língua na maior escola de idioma do mundo!

Conquiste a fluência no idioma que sempre sonhou com uma solução de ensino completa.

+ 400 mil alunos

Método validado

Aulas

Ao vivo e gravadas

+ 1000 horas

Duração dos cursos

Certificados

Reconhecido pelo mercado

Quero estudar na Fluency

Sobre o autor

A melhor plataforma para aprender tecnologia no Brasil

A Awari é a melhor maneira de aprender tecnologia no Brasil.
Faça parte e tenha acesso a cursos com aulas ao vivo e mentorias individuais com os melhores profissionais do mercado.