Características de um Cientista de Dados: quais são e como desenvolver
Não há dúvidas de que Data Science é um campo fascinante! Quando nos deparamos com os resultados trazidos por aplicações baseadas em dados, suas predições e os níveis de assertividade alcançados, a sensação é de estarmos em contato com algo mágico.
Não há dúvidas de que Data Science é um campo fascinante! Quando nos deparamos com os resultados trazidos por aplicações baseadas em dados, suas predições e os níveis de assertividade alcançados, a sensação é de estarmos em contato com algo mágico. Um classificador capaz de obter resultados próximos (ou melhores) aos obtidos por humanos na identificação de doenças através da leitura de imagens é quase inacreditável.
Porém, quando nos deparamos com todo o processo necessário para atingir estes resultados “mágicos” da ciência de dados, é normal surgirem alguns questionamentos. Uma pergunta que eu tenho observado com cada vez mais frequência é: Data Science é para mim?
Especialmente para quem não tem um background de programação ou não possui uma formação na área das exatas, esse questionamento incomoda bastante.
Bom, responder a esta pergunta não é tão simples. Gostaria de frisar que este texto é uma opinião pessoal de alguém que passou por todas essas questões por não ter uma formação comum entre os profissionais da área. Portanto, não espere ao fim do texto um algoritmo capaz de dizer se Data Science é ou não para você, mas sim um esclarecimento sobre alguns dos desafios iniciais, da jornada até se tornar um cientista de dados e sobre dia a dia da área. A decisão ainda continua em suas mãos, combinado? Muitas variáveis estão envolvidas em uma decisão tão complexa quanto essa, mas mantenha isso em mente: grandes desafios são responsáveis por recompensas maiores ainda.
Glossário
Paixão por dados, pelos resultados e pelo processo.
Na ciência de dados, por envolver programação, é comum que o processo de resolução problemas caminhe para algo mais complexo e extenso do que o previsto inicialmente. Por exemplo, caso o problema a ser resolvido não tenha dados facilmente disponíveis, pode ser necessário elaborar uma raspagem de dados dos sites (web scraping), tornando o simples fato de montar uma tabela com os dados a serem utilizados para as análises em uma vitória a ser comemorada.
Um cientista de dados deve estar interessado também pelo processo, e não apenas nos resultados!
Aprenda uma nova língua na maior escola de idiomas do mundo! Conquiste a fluência no idioma que sempre sonhou com uma solução de ensino completa. Quero estudar na Fluency
É claro, você não precisa amar cada detalhe dos projetos. Na verdade, a maior parte deste profissionais prefere uma ou outra fase de um projeto de ciência de dados. Além disso, é muito comum encontrar profissionais que aprenderam a gostar do processo com o tempo, mas é importante manter isto em mente se você está interessado em migrar para esta área apenas pelos altos salários, por exemplo.
Autonomia/lidar com erros
Antes de continuarmos o assunto, decidi levantar algumas características da ciência de dados muito relevantes para este tópico. Acredito, inclusive, que algumas delas trazem a solução para este problema:
- Data Science é uma área muito ampla.
- Data Science é uma área em constante evolução.
- A comunidade de Data Science é muito forte.
Os procedimentos utilizados para fazer uma predição de uma série temporal, de um classificador de imagens ou com dados tabulares apresentam muitas similaridades e um número ainda maior de diferenças. Especialmente na etapa de preparação dos dados, cada um destes processos possuem muitas particularidades. Além disso, Data Science é uma área de alta intercambialidade entre a academia e a indústria. Muitas técnicas desenvolvidas para serem utilizadas em pesquisas avançadas são rapidamente incorporadas por profissionais do mundo inteiro.
Esta quantidade exorbitante de informação e a velocidade destas transformações podem causar uma angústia até nos profissionais mais experientes: como posso ficar sabendo disso tudo? O fato da comunidade ser forte é responsável pelo alto nível de documentação existente para as mais diversas técnicas e ferramentas, basta fazer a pergunta certa no local certo. Assim, introduzimos a característica mencionada acima, e uma das mais importantes para cientistas de dados: autonomia!
Data Science é uma área ampla e em construção. Na prática, isso significa que um único curso de ciência de dados, não importa quão completo ele seja, não será responsável por fornecer todo o conhecimento necessário para sua trajetória completa como cientista de dados. Sendo assim, uma postura autônoma é recomendada em TODOS os passos de sua carreira.
Quando você contrata um curso, você ganha acesso a uma curadoria de informação, transmitida de maneira didática. É claro que seus instrutores e, no caso da Awari, seus mentores, terão o maior prazer em sanar suas dúvidas, mas muitas destas dúvidas podem ser facilmente resolvidas com uma simples pesquisa na internet. Quando você tiver sua posição na área, dependendo do tamanho da empresa em questão, é possível que você seja a única pessoa responsável por todas as etapas internas aos projetos de ciência de dados.
Saber perguntar ou encontrar palavras-chave acaba sendo uma das qualidades mais importantes de um cientista de dados. Google, Stack Overflow, GitHub serão seus maiores aliados. Se você não gosta de buscar respostas, um outro sinal de alerta pode ser acendido.
Colaboratividade
Cuidado com o estereótipo do cientista de dados isolado ou antissocial! Apesar do dia a dia de um cientista de dados envolver muita programação, esta não é uma profissão para quem busca lidar apenas com computadores. Não procure a área para evitar contato humano! Data Science como área requer muita comunicação e trabalho em equipe. E como você pode ver neste artigo, os projetos de Data Science possuem pelo menos duas etapas em que suas habilidades de comunicação serão essenciais: a compreensão do problema e a comunicação dos resultados.
Aprenda uma nova língua na maior escola de idiomas do mundo! Conquiste a fluência no idioma que sempre sonhou com uma solução de ensino completa. Quero estudar na Fluency
Como um cientista de dados, você provavelmente vai trabalhar com várias equipes de uma empresa e tentar utilizar suas habilidades para resolver (com dados) demandas dessas equipes. Acredite, as demandas podem ser bastante complexas e exigirão conhecimento do negócio, dos processos e das pessoas envolvidas. Só assim você poderá compreendê-las de maneira suficientemente profunda para entregar um resultado satisfatório, ressaltando a importância da sua habilidade de se comunicar, por exemplo.
Além disso, qualquer valor extraído dos dados que você analisar ou modelou deverá ser comunicado na forma de insights. É preciso garantir a compreensão destas conclusões por pessoas com pouco ou nenhum conhecimento das técnicas utilizadas. Recursos como matrizes, gráficos e dashboards ajudam nesta etapa, mas nada disso será eficaz sem uma capacidade de comunicação interpessoal clara.
Se desenvolva em Data Science
Não há como negar que experiência com programação ou uma formação com uma base sólida em matemática/estatística sejam facilitadores para o aprendizado de ciência de dados, mas essas variáveis não são necessariamente responsáveis por seu sucesso na área.
Independentemente de sua área de formação, você terá que aprender sobre outros assuntos para uma experiência mais completa, pois ciência de dados é uma intersecção entre diversos campos do conhecimento. Programação, estatística, matemática, comunicação são a base de tudo isso. Porém, intuição e criatividade são cruciais em todas as etapas de um projeto na área. Muitas das melhores formas de aplicação de algoritmos acabaram surgindo por utilizações inusitadas ou acidentais, algo realizado com mais facilidade por pessoas com menos hábitos definidos, por exemplo.
Além disso, a depender de sua motivação (paixão por dados por exemplo), a velocidade do seu aprendizado pode ser exponencial. Convenhamos, estudar multiplicação de matrizes em si pode não ser o assunto mais estimulante do mundo, mas ver uma rede neural que utiliza essa operação, atuando na manipulação de imagens pode tornar todo o processo de aprendizado mais interessante.
Alguns de nossos alunos de maior destaque vêm de áreas a princípio inusitadas, como jornalismo e design, por exemplo. Nas competições do Kaggle, encontramos muitos vencedores que não são estatísticos, engenheiros ou matemáticos. E você? Está disposto(a) e motivado(a) a mergulhar numa carreira em ciência de dados? Não sabe por onde começar ou quer um acompanhamento mais próximo de seus passos para um melhor direcionamento de sua carreira na área? A Awari tem cursos e mentorias capazes de acelerar seu aprendizado e te ajudar no seu futuro como Data Scientist!
Este artigo foi inspirado neste vídeo do cientista de dados Ken Jee.
Aprenda uma nova língua na maior escola de idiomas do mundo! Conquiste a fluência no idioma que sempre sonhou com uma solução de ensino completa. Quero estudar na Fluency