Data Science

O Que é Necessário para Trabalhar com Data Science?

Por Osvaldo Pereira, Senior Data Scientist na CI&T

O que é Data Science?

Você já deve ter ouvido falar em data science e que essa é uma nova profissão que surgiu devido à Indústria 4.0. Alguns chamam de “a profissão mais sexy do momento”.

A verdade é que esta é uma profissão não tão nova assim. Áreas quantitativas como física, matemática, estatística, economia e engenharia usam bastante a análise de dados em seu cotidiano, para analisar resultados experimentais e acompanhar indicadores de qualidade de processos.

É verdade, entretanto, que data science ganhou notoriedade e virou uma buzzword alguns anos atrás, quando novas empresas de tecnologia demonstraram grande produtividade através da análise quantitativa de informações.

Em termos práticos, data science nada mais é do que a junção entre medotologia científica, análise de dados, métodos matemáticos, estatísticos, e computacionais aplicados à resolução e análise de problemas de negócios. O termo data science foi cunhado por Peter Naur, um pioneiro em ciências computacionais, na década de 1960.

A Estrada para a Realidade

Quem deseja ingressar como profissional na área de ciência de dados deve estar ciente de que é necessário muito estudo e preparação. Existem diversas áreas de especialização para o profissional, desde arquitetura de dados, até engenheiros de machine learning.

Independentemente de qual área o profissional for seguir, é interessante ter em sua formação básica uma graduação em ciências quantitativas, como física, estatística, matemática, ciência da computação e engenharias.

É necessário ter como ferramental básico disciplinas de matemática tais como cálculo diferencial e integral, análise numérica e álgebra linear. Conhecer métodos estatísticos como probabilidade e distribuições, estatística descritiva, regressões lineares, logísticas entre outros métodos. Ter noção de programação e algoritmos.

Conhecer pelo menos uma linguagem de ampla utilização. R e Python são as mais utilizadas entre os analistas de dados que trabalham com análise e machine learning.

Além de entender como funciona o método científico, sendo capaz de criar hipóteses e fazer o design de experimentos capazes de refutar ou evidenciar essas hipóteses, gerando insights para problemas aplicados à áreas de negócios.

Portanto, o conselho que dou, para você que pretende ingressar nessa área é: seja paciente, e não cobre uma velocidade irreal. Dê um passo de cada vez, e procure aprender com as referências da área.

Mixed Martial Data Science

A área de ciência de dados possui diversas vertentes, com diferentes habilidades e competências. Assim como a engenharia possui diversas especialidades, a ciência de dados também possui diversos perfis de atuação na esteira de dados.

Podemos dizer que para que um cientista de dados obtenha um alto grau de competência é necessário que ele aprenda diversas modalidades, assim como um lutador aprende diversas modalidades de artes marciais para se tornar um lutador de mixed martial arts cada vez mais completo.

Vale ressaltar que é muito improvável que alguém obtenha níveis de excelência em todas as modalidades, pois cada uma delas exige anos e anos de estudo e dedicação.

Se você deseja ser reconhecido por suas habilidades e competências, é necessário que você escolha uma das áreas de atuação. Igualmente um médico que faz residência em alguma área. Por exemplo, médicos se especializam em diferentes partes do corpo: cirurgiões de cérebro, coluna, coração, etc. Acontece o mesmo em ciência de dados.

Abaixo citamos alguns dos profissionais que trabalham com dados para que você faça uma avaliação de qual perfil gostaria de se especializar:

Arquiteto de Dados – É o profissional que faz o design de toda a estrutura de dados dentro de uma empresa/organização. Define onde os dados serão gerados, consumidos, integrados e gerenciados por diferentes sistemas e áreas de negócio.

Engenheiro de Dados – É o responsável pela consistência e qualidade dos dados, dentro da estrutura e arquitetura desenhada. Realiza o tratamento dos dados, e distribuição desses dados pelos sistemas e data lakes. É responsável por fazer o deploy (pode ser traduzido livremente como instalação) de dashboards, relatórios automatizados e modelos desenvolvidos pelos analistas. Um dos principais papéis do engenheiro de dados é deixar os dados em um formato acessível e analítico para o consumo dos analistas.

Business Analyst – É o analista de negócios. Analisa os dados para encontrar indicadores de produtividade, rentabilidade, e oportunidade. Cria dashboards, relatórios e apresentações corporativas para demonstrar os indicadores em tempo real ou não para os executivos tomarem decisões arrojadas e eficazes, baseadas em dados e informações quantitativas.

Web Analyst – Possui um papel muito parecido com o do Business analyst, porém sua área de atuação é inteiramente online, utilizando ferramentas e tecnologias digitais para realizar análise de dados em tempo real de frameworks do tipo web, para que executivos consigam acompanhar indicadores de resultado e tomar decisões em tempo real, baseados em dados e informações.

Data Analyst – É o analista de dados. Em geral trata os bancos de dados, fazendo mineração e realizando análises estatísticas, matemáticas e gráficas em busca de respostas para hipóteses levantadas pelos altos executivos. Também é responsável por criar novas hipóteses de negócio. Analista de dados sênior, mais experientes também são responsáveis por criar modelos matemáticos e estatísticos de previsão. São os chamados modelos preditivos. Utiliza seus conhecimentos também para criar algoritmos de machine learning.

Data Science é uma grande área e esta é apenas uma introdução sobre as diferentes posições e desafios. Espero que tenham gostado!

O Curso de Data Science da Awari está com inscrições abertas para quem tiver interesse. Clique aqui para saber mais.

Osvaldo Pereira

Osvaldo Pereira é cientista de dados e possui experiência em bancos, finanças, tecnologia e na indústria de defesa naval. Sua área de atuação é em modelagem, advanced analytics e machine learning. Possui mestrado em Física pela Unicamp.