Data Science

O que faz um Cientista de Dados?

Por Luciano Santos, na BIRENE/PAHO/WHO

O que faz um cientista de dados

Origem de Data Science

É realmente enorme o volume de dados gerados atualmente por ações online (curtida em uma foto no Instagram, publicação de um post no Facebook ou um comentário em vídeos do YouTube).

Estima-se que a cada 10 minutos, a quantidade de dados gerados no mundo inteiro é maior que o volume de dados gerados desde a pré-história até o ano de 2003. Desde a década de 1970, nossa capacidade de processamento de dados duplica a cada dois anos. Com esse crescimento de dados e da capacidade de processamento, surgiu o conceito de Big Data.

Com advento do Big Data, houve a necessidade de criar uma ciência capaz de tratar, transformar e responder a problemas complexos baseados nesses dados. Dessa forma, apareceu a Ciência de Dados. 

É claro que, com toda essa evolução, os profissionais da área de TI começaram a se especializar nessa nova ciência, que dá origem a uma nova geração de especialistas, com perfis analíticos e habilidades técnicas para resolver problemas complexos. Para explorar essa mina de ouro (os dados) e extrair informações úteis, o cientista de dados gera valioso conhecimento para tomada de decisões nos negócios.

Há quem diga que o cientista de dados é a evolução do analista de negócio, passando a ser denominado de analista de dados.

Mas o que o cientista de dados realmente faz?

De forma bem resumida, o cientista de dados tem como responsabilidades:

  • Coletar e transformar grandes quantidades de dados; 
  • Entender problemas de negócio;
  • Analisar e formular hipóteses;
  • Realizar testes e experiências;
  • Comunicação e colaboração em equipe.

Principais atribuições

O cientista de dados utiliza dados para encontrar soluções. Por isso, ele precisa saber o que vai procurar e quais são as demandas de uma determinada área a ser contemplada. 

Mas as possibilidades são muitas, por exemplo: 

  • Um e-commerce (loja on-line) solicita a criação de um sistema de recomendação de compras para os clientes; 
  • Uma transportadora deseja calcular rotas mais efetivas para suas entregas;
  • Uma corretora de valores quer um sistema de predições sobre o mercado financeiro;

Após definir o que será resolvido e o objetivo do projeto, chegou a hora de olhar para todos os dados coletados e formular hipóteses para responder a algumas perguntas: 

  • Qual sistema de recomendação pode ser criado a partir de buscas de dados de compras anteriores dos clientes? 
  • Como a logística de transporte pode ser melhorada com a combinação de dados do GPS dos entregadores com a localização dos pontos de entrega?
  • Quais investimentos serão mais rentáveis em curto, médio e longo prazo nos próximos dias, meses ou anos (respectivamente)?

Por isso, o cientista de dados geralmente tem capacitação em áreas como Matemática, Estatística, Ciência da Computação (Programação), Física ou até mesmo Economia (Regras de Negócio). 

É muito provável que esse profissional apresente os resultados necessitando se comunicar com gerentes e executivos sem conhecimento técnico sobre todo o processo, o que exige uma capacidade de síntese essencial para elucidar as descobertas e soluções e propor as ações a serem implementadas corretamente.

Quais são os cargos em um departamento de Data Science?

A Ciência de Dados é muito nova e é normal encontrar instituições combinando funções e exigindo habilidades diferentes de seus profissionais. Dessa maneira, dá oportunidade para criação de futuros cientista de dados.

Mas como podemos verificar a profundidade de competências do cientista de dados? O mercado de trabalho vem cirando equipes de Data Science, com grande variedade de cargos e níveis nas estruturas empresariais. 

Porém, isso pode mudar de acordo com estado/cidade e claro a organização em que pretende trabalhar. 

Por ser uma área de trabalho nova, é normal que os cargos se confundam ou sejam combinados durante os processos seletivos. Então, é bom ficar atento às habilidades exigidas.

Na Ciência de Dados, temos os seguintes cargos: cientista de dados, analista de dados, arquiteto de dados, engenheiro de dados e estatístico.
De forma simples para entendermos as atribuições de um cientista de dados, podemos dividi-las em três missões:

  • Resolver problemas a partir da análise de dados coletados;
  • Identificar tendências para que empresas alcancem bons resultados;
  • Interpretar algoritmos matemáticos utilizados na internet.

Partindo da aplicação desses três princípios, o cientista de dados desenvolve soluções inteligentes para empresas de diversos setores. 

Dessa forma, a interpretação e o levantamento de dados tem um papel importante na tomada de decisão e na prospecção de resultados.

Mercado de trabalho e áreas de atuação

Mercado de trabalho

O cientista de dados está entre os seis profissionais mais requisitados no mercado de TI, de acordo com o site (www.profissionaisti.com.br). 

O alto número de oportunidades (devido à pouca quantidade de profissionais qualificados), salários altos e a satisfação de trabalho nessa área foram os fatores que colocaram essa profissão nessa lista.

Segundo pesquisa da IBM, a demanda por esses profissionais deve subir 28% até 2020 e atualmente, 60% da procura por esses profissionais encontra-se na área de finanças.

Áreas de atuação

Busca na internet

Os principais mecanismos de pesquisa na internet fazem o uso da Ciência de Dados em conjunto com o aprendizado de máquina para encontrar o resultado mais refinado em frações de segundos. A velocidade dos motores de busca atuais só é possível graças à Ciência de Dados.

Propaganda digital

Praticamente todo o conteúdo de marketing digital é escolhido por algoritmos que utilizam Ciência de Dados. Assim, as empresas obtêm um resultado muito melhor do que o marketing convencional, pois os anúncios são montados de acordo com o histórico do usuário.

Sistemas de recomendação

Combinando os dados do perfil do usuário com as informações do seu histórico de buscas, é possível ter melhores insights sobre os tipos sugestões que mais se adequam a cada pessoa. Isso ocorre quando visualizamos novas sugestões de amizades no Facebook ou LinkedIn, bem como as sugestões de filmes e séries no Netflix e até mesmo as indicações de produtos no site da Amazon.

Reconhecimento de imagens

Utilizando algoritmos de reconhecimento de imagens, várias aplicações são possíveis, como QR Code, que permite escanear uma imagem com seu smartphone para utilizar o WhatsApp Web ou até mesmo o recurso automático de tags, para marcar amigos em fotos postadas em redes sociais.

Logística

A UPS, empresa do ramo de logística, desenvolveu um sistema chamado ORION, responsável por gerenciar as rotas de seus caminhões de entrega nos EUA. Esse sistema foi alimentado, a partir de 2008, com informações oriundas de sua frota sobre rotas, tempo de veículos parados e até se os motoristas estavam utilizando o cinto de segurança. 

A partir daí, foi desenvolvido um complexo algoritmo para resolver os problemas de rota dos caminhões. Isso gerou um impressionante código com 1000 páginas, que transforma os dados obtidos em instruções para otimizar as rotas. Atualmente, esse sistema otimiza as rotas em segundos e, rodando em segundo plano, está sempre atualizando a trajetória garantir o melhor caminho para seus veículos.

Saúde

A Walgreens utiliza ferramentas avançadas de Analytics na área de drogarias para o cuidado de pacientes, avaliando melhor as condições do usuário e fornecendo recomendações que fortalecem a saúde e evitem despesas médicas futuras.

E-commerce de viagens

Muitas empresas de e-commerce de viagens (Booking, Trivago, Expedia etc.) utilizam a Ciência de Dados para melhorar os resultados em seus motores de busca, trazendo para o cliente não só os resultados de pesquisas sobre hotéis ou voos, como também sugerindo serviços complementares durante as viagens (reserva de carros, pacotes de passeios no destino, seguro de viagens, entre outros)

Serviços financeiros

A Ciência de Dados auxilia a análise e compreensão dados armazenados sobre gastos passados, concessões de crédito entre outras variáveis. Assim, os bancos podem traçar perfis capazes de projetar a probabilidade de um determinado cliente se tornar inadimplente ou não.

Comparação de preços

Com o imenso volume de dados gerado pela grande quantidade de lojas virtuais, os sites (Buscapé, Bondfaro etc.) utilizam a Ciência de Dados para mostrar os menores preços do produto que o cliente procura.

Algumas etapas para criação de um projeto em Data Science

  • Definição de problema e métrica de sucesso;
  • Definição do dataset analítico a ser utilizado;
  • Transformação e higienização de dados;
  • Modelagem com inteligência artificial;
  • Comunicação dos resultados obtidos em linguagem de negócio.

Conclusão

O cientista de dados geralmente tem formação em áreas como Matemática, Ciência da Computação, Física ou até mesmo Economia. 

Por padrão e necessidade do mercado, esse profissional precisa ter bons conhecimentos de computação, matemática e análise de dados. Além disso, deve ter a capacidade de produzir insights e soluções a partir da análise de um grande volume de dados, com o auxílio de algoritmos de aprendizado de máquina.

Tenha como principal trunfo a curiosidade, para sempre se aprofundar nos assuntos que estuda e trabalha. Isso contribuirá para desenvolver hipóteses e testá-las em busca de soluções que fujam do óbvio. 

Em resumo as habilidades do cientista de dados:

  • Conhecimento em linguagens de programação de análise de dados (R, Python e SQL);
  • Comunicação;
  • Gestão de Dados e Projetos;
  • Mineração e Visualização de Dados;
  • Matemática, Estatística e Álgebra Linear;
  • Algum conhecimento em infraestrutura de Big Data (Hadoop, MapReduce e Spark);
  • Machine Learning;
  • Engenharia de Software;
  • Foco em solução de problemas para o negócio.

Conforme tudo que vimos nesse artigo, acredito que, em início de carreira na área de Data Science, podemos pensar grande, mas iniciar pequeno. Na minha opinião, seria muito difícil inicialmente início adquirir tanto conhecimento e ser um profissional completo para atuar como cientista de dados. Por isso, a dica é se especializar em uma das subdivisões dessa área e se dedicar ao máximo para entrar em uma equipe de Data Science!

Referencias

https://www.profissionaisti.com.br/2019/01/6-profissoes-ligadas-a-ti-que-estarao-em-alta-em-2019/

https://www.pressroom.ups.com/pressroom/Home.page?countrylang=US-English

https://support.google.com/webmasters/answer/70897?hl=pt-BR

https://ecommercenews.com.br/artigos/dicas-artigos/qual-a-influencia-do-marketing-digital-no-e-commerce/

https://help.netflix.com/pt/node/100639

https://aws.amazon.com/pt/rekognition/

https://www.computerworld.com/article/3425741/walgreens-using-social-and-mobile-data-analytics-to-deliver-customer-insights.html

https://buscape.zendesk.com/hc/pt-br/articles/204848959-Como-comprar-

Luciano Santos

Luciano Santos Data Analyst, BIRENE/PAHO/WHO anteriormente em Lojas Riachuelo.

Artigos recomendados: