Facebook pixel
Awari

Termos de Data Science

Confira nossa lista dos termos mais comuns dessa área:

Algoritmo

Um algoritmo, basicamente, é o conjunto das regras e procedimentos lógicos perfeitamente definidos que levam à solução de um problema em número finito de etapas.

Leia Mais

Analista de Dados

É reconhecido no mercado como um profissional mestre em SQL (Standard Query Language), uma linguagem padrão para trabalhar com bancos de dados relacionais – e que não exige um profundo conhecimento em programação para ser utilizada.

Leia Mais

Análise Exploratória de Dados (AED)

Pode-se entender a Análise Exploratória de Dados (AED) como o processo de realização de investigações iniciais sobre os dados, de modo a descobrir padrões, detectar anomalias, testar hipóteses e verificar suposições com a ajuda de estatísticas e representações gráficas.

Leia Mais

Análise Preditiva

É o ramo da análise avançada que é usada para fazer previsões sobre eventos futuros desconhecidos em Data Science. A análise preditiva usa especialmente técnicas de machine learning e deep learning para a resolução de problemas de classificação, regressão, clusterização (entre outros) de dados futuros através da extração de padrões de dados passados.

Leia Mais

Aprendizagem Supervisionada

No aprendizado supervisionado, você treina a máquina usando dados que são bem “rotulados”, ou seja, alguns dados já estão marcados com a resposta correta. O método, pode ser comparado a uma aprendizagem que ocorre na presença de um supervisor ou professor.

Leia Mais

Aprendizagem Não Supervisionada

Por outro lado, o ensino não supervisionado é uma técnica de aprendizado de máquina, em que você não precisa supervisionar o modelo. Em vez disso, você precisa permitir que o modelo trabalhe por conta própria para descobrir informações. Ele lida principalmente com os dados não rotulados no universo de Data Science.

Leia Mais

APIs

Interfaces de Programação de Aplicativos, ou APIs, são softwares que ajudam diferentes aplicativos a se comunicarem entre si. Os produtos desenvolvem APIs para permitir que você acesse e leia informações em seu servidor facilmente.

Leia Mais

A.I. (Arquitetura da Informação)

A organização estrutural de sistemas (por exemplo, como estão arranjadas as páginas de um site) para facilitar sua utilização e resultar em uma boa experiência.

Leia Mais

Backlog

Backlog refere-se a um log de acumulação de trabalho num determinado intervalo de tempo. Backlog é uma espécie de estoque de requisições/encomendas relativas a produtos ainda não produzidos. Grosso modo, backlog é uma "pilha de pedidos" em espera.

Leia Mais

Beta Test

A versão beta de um software ou produto é a versão em estágio ainda de desenvolvimento, mas que é considerada aceitável para ser lançada para o uma parte de um segmento do público alvo. Com o objetivo de coletar feedbacks para evoluir até uma versão final que ganhará escala para todos os usuários.

Leia Mais

Big data

Big data, como o próprio nome sugere, é um conceito que descreve o grande volume de dados estruturados e não estruturados que são gerados a cada segundo. Ele é fundamental, por exemplo, para gerenciar as grandes quantidades de dados que são produzidos e processados na atualidade – em dispositivos como celular, TVs, carros, dispositivos vestíveis (wearables).

Leia Mais

Blockchain

Blockchain é essencialmente um banco de dados distribuído descentralizado. A estrutura vinculada do blockchain possibilita rastrear a origem (assim como as mudanças de propriedade) de qualquer ativo digital. Essa capacidade pode fornecer evidências-chave em apoio à autenticidade de um objeto, ativo ou registro.

Leia Mais

Business Intelligence

É a disciplina de análise e transformação de dados para extrair insights de negócios valiosos para permitir a tomada de decisões. Hoje, o BI é normalmente usado para se referir a análise descritiva e relatórios.

Leia Mais

Cientista de Dados

O cientista de dados será o profissional responsável por análises preditivas com algoritmos de machine learning. Esse recurso é utilizado para analisar dados atuais e históricos, a fim de compreender melhor o cenário e identificar riscos e oportunidades potenciais para uma empresa.

Leia Mais

Data Science

É uma combinação de análise de dados, desenvolvimento algorítmico e tecnologia para resolver problemas analíticos. O objetivo principal é a utilização de dados para gerar valor de negócios.

Leia Mais

Data Transformation

É o processo de conversão de dados de um formulário para outro. Isso geralmente é feito em uma etapa de pré-processamento. Por exemplo, substituindo uma variável x pela raiz quadrada de x.

Leia Mais

Data Fabric

É uma arquitetura e um conjunto de serviços de dados que fornecem recursos consistentes, integrando o gerenciamento de dados na nuvem e no local para acelerar a transformação digital. Gartner diz que o tecido de dados permite acesso e compartilhamento de dados sem atrito em um ambiente de dados distribuídos. (Ref: NetApp, Gartner)

Leia Mais

Database

É uma coleção estruturada de dados. A informação recolhida é organizada de forma a ser facilmente acessível pelo computador. Os bancos de dados são construídos e gerenciados usando linguagens de programação de banco de dados. A linguagem de banco de dados mais comum é o SQL.

Leia Mais

Dataframe

DataFrame é uma estrutura de dados rotulada bidimensional com colunas de tipos potencialmente diferentes. Você pode pensar nisso como uma planilha ou tabela SQL, ou um dicionário de Series Objects.

Leia Mais

Dashboard

É uma ferramenta de gerenciamento de informações que é usada para rastrear visualmente, analisar e exibir indicadores-chave de desempenho, métricas e pontos-chave de dados. Os painéis podem ser personalizados para atender aos requisitos de um projeto. Ele pode ser usado para conectar arquivos, anexos, serviços e APIs que são exibidos na forma de tabelas, gráficos de linhas, gráficos de barras e medidores.

Leia Mais

Data Visualization

Ela se enquadra na disciplina de design de informações. Refere-se à representação gráfica de informações usando elementos visuais, como gráficos, gráficos e mapas. A intenção é possibilitar a tomada de decisão com a representação adequada de insights.

Leia Mais

Data Warehouse

É um repositório central de informações que podem ser usadas para analisar e tomar decisões mais informadas. (Ref: Amazon)

Leia Mais

Deep learning

Deep Learning é uma técnica de Machine Learning que é especializada em um algoritmo denominado Rede Neural e tem como principal highlight a possibilidade de que computadores aprendam através de dados não estruturados, como imagens, textos, etc. O Deep Learning é uma tecnologia chave por trás dos carros sem motorista – como os Teslas, criados por Elon Musk – permitindo-lhes reconhecer um sinal de pare ou distinguir um pedestre de um poste de luz. É a chave para o controle de voz em dispositivos de consumo, como telefones, tablets, TVs e alto-falantes viva-voz.

Leia Mais

Dataset

Um Dataset (ou conjunto de dados) é organizado em algum tipo de estrutura de dados. Em um banco de dados, por exemplo, um Dataset pode conter uma coleção de dados comerciais (nomes, salários, informações de contato, números de vendas e assim por diante). Várias características definem a estrutura e as propriedades de um conjunto de dados. Isso inclui o número e os tipos de atributos ou variáveis e várias medidas estatísticas aplicáveis a eles, como desvio padrão e curtose.

Leia Mais

Design de Informação

É a prática de apresentar informações de uma maneira que promova uma compreensão eficiente e eficaz da informação. (Ref: Wikipedia)

Leia Mais

Decision Tree

A árvore de decisão é um tipo de algoritmo de aprendizado supervisionado (com uma variável de destino predefinida) que é usado principalmente em problemas de classificação. Ele funciona para variáveis de entrada e saída categóricas e contínuas. Nesta técnica, dividimos a população (ou amostra) em dois ou mais conjuntos homogêneos (ou subpopulações) com base no divisor / diferenciador mais significativo nas variáveis de entrada.

Leia Mais

Dependent Variable

É o que você mede e que é afetado por variáveis independentes / de entrada. É chamado de dependente porque “depende” da variável independente. Por exemplo, digamos que queremos prever os hábitos de fumar das pessoas. Então a pessoa fuma “sim” ou “não” é a variável dependente.

Leia Mais

Descriptive Statistics

É composta por aqueles valores que explicam a propagação e tendência central dos dados. Por exemplo, a média é uma forma de representar a tendência central dos dados, enquanto o IQR é uma forma de representar a dispersão dos dados.

Leia Mais

Differentiation

É a capacidade que um produto tem de se diferenciar de outros produtos similares e concorrentes no mercado.

Leia Mais

Engenheiro de Dados

É o profissional que desenvolve, constrói e mantém uma arquitetura e infraestrutura de um sistema para ser utilizada por cientistas e analistas de dados na área de Data Science. Ele é reconhecido como um especialista em software que projeta, cria, integra e gerencia o fluxo de diversos dados.

Leia Mais

Engenharia de Dados

É uma disciplina que se concentra em aspectos como a identificação de fontes de dados, coleta, curadoria e armazenamento dos dados. Este é um precursor de todas as outras disciplinas que ajudam a obter valor dos dados.

Leia Mais

Engenheiros de Machine Learning

estão na interseção de software e da ciência de dados no universo de Data Science. Eles aproveitam as ferramentas e estruturas de programação para garantir que os dados brutos coletados das pipelines de dados sejam utilizados por modelos prontos. Na prática, eles são responsáveis por pegar modelos teóricos de ciência de dados e ajudar a dimensioná-los para modelos de nível de produção que podem lidar com terabytes de dados em tempo real.

Leia Mais

End-to-End

Refere-se a cada etapa do processo, do início ao fim.

Leia Mais

Feature

Trata-se de um aspecto de seu produto que agrega valor ao atender a uma exigência de seu cliente. Ou seja, uma funcionalidade.

Leia Mais

Feature Audit

É um mapa com todas as funcionalidades que devem ser desenvolvidas para acompanhar se os resultados estão sendo entregues.

Leia Mais

Fundamentally New Product

Produto verdadeiramente novo, que nunca foi visto antes no mercado. Uma versão realmente inovadora e disruptiva.

Leia Mais

Governança de Dados

É uma estrutura e um conjunto de práticas para ajudar todas as partes interessadas em uma organização a identificar e atender às suas necessidades de informação. (Ref: Instituto de Governança de Dados)

Leia Mais

Hard Skills

São as habilidades técnicas que podem ser desenvolvidas por meio de cursos, capacitações, workshops, etc.

Leia Mais

Inteligência artificial

Inteligência Artificial é a habilidade de um computador – ou robô, controlado por computador – de realizar tarefas comumente associadas a seres humanos. A Inteligência Artificial está aplicada a projetos que desenvolvem sistemas dotados dos processos intelectuais característicos dos humanos, como a habilidade de raciocinar, descobrir significados, generalizar ou aprender com a experiência passada.

Leia Mais

Implicit Requirement

Trata-se de uma funcionalidade que não é explícita pelo cliente, mas é identificada pelo contexto.

Leia Mais

Incremental Product

É um processo de melhoria no produto, que traz uma versão sucessora sem que a anterior deixe de ser funcional.

Leia Mais

KPI: Key Performance Indicator

É uma métrica usada para medir o desempenho de um produto. Pode ser traduzido, mas não recomendo.

Leia Mais

Lifetime Value

É uma métrica que define o valor do ciclo de vida do cliente, ou seja, o quanto de dinheiro ele gera para o produto/empresa.

Leia Mais

Machine learning

Machine Learning ou, em português, aprendizagem de máquina, é o processo de ensinar a um sistema de computador como fazer previsões precisas quando alimentado com dados. Na prática, essas previsões podem responder, por exemplo, qual é a probabilidade de um cliente realizar uma nova compra em uma determinada plataforma

Leia Mais

Mineração de dados

A mineração de dados é o processo de análise de grandes volumes de dados para descobrir ações inteligentes que possam ajudar as empresas a resolver problemas, mitigar riscos e aproveitar novas oportunidades.

Leia Mais

Mind Map

Trata-se de uma ferramenta visual, numa espécie de diagrama, usada para organizar ideias, pensamentos e conteúdos.

Leia Mais

MVP: Minimum Viable Product

É a versão mais simples de um produto que pode ser lançada com uma quantidade mínima de esforço e desenvolvimento.

Leia Mais

Mockup

Representação visual de uma interface, usando um nível avançado de fidelidade (ou seja, próximo do resultado final). Veja um exemplo de Mockup.

Leia Mais

Needfinding

Trata-se do processo de descoberta sobre usuários e clientes em potencial, bem como dos problemas enfrentados por eles e das prováveis soluções.

Leia Mais

NPS

É uma métrica usada para medir a satisfação dos clientes no pós-venda.

Leia Mais

OKR: Objectives & Key Results

Metodologia de gestão usada para que o produto/empresa consiga estabelecer uma direção clara de onde chegar.

Leia Mais

Persona/User Persona

É uma representação do seu cliente ideal com características demográficas e comportamentais. Eles não são necessariamente um indivíduo real, mas são construídos usando informações e dados reais com base em usuários reais. Os espectros de Persona são uma interação mais recente em personas de usuário tradicionais e ajudam a projetar de forma mais inclusiva.

Leia Mais

Pipeline de dados

Pode-se entender o conceito de pipeline de dados como um conjunto de ações que muda os dados brutos de várias fontes (pesquisas, feedbacks, lista de compras, votos, etc.) para um formato compreensível para que possamos armazená-los e usá-los para análise.

Leia Mais

Priorization

Refere-se à capacidade de definir o que é mais importante em uma escala.

Leia Mais

Processamento de Linguagem Natural (NPL)

Processamento de Linguagem Natural, do inglês Natural Language Process (NPL), é um campo da Inteligência Artificial que dá às máquinas a habilidade de ler, entender e interpretar significado de linguagens humanas. Neste processo, é possível entender o significado por trás das palavras e identificar nuances como ironia ou análise de sentimentos.

Leia Mais

Protótipo de Alta-Fidelidade

Um protótipo que está próximo do produto final em termos de fidelidade visual. Possui uma grande quantidade de detalhes, tanto visuais quanto funcionais, e no geral é uma excelente representação de qual será a proposta final. É muito comum que esse protótipo seja utilizado para Testes de Usabilidade

Leia Mais

Product Owner

É a pessoa que centraliza e orienta a equipe, as tarefas e todo o direcionamento relacionado ao produto.

Leia Mais

QA - Quality Assurance

Garantia de qualidade (QA) é qualquer processo sistemático de determinar se um produto ou serviço atende aos requisitos especificados.

Leia Mais

Roadmap

Uma ferramenta visual e descritiva que ajuda a planejar o futuro do futuro.

Leia Mais

Sitemap

Representação (em sua maioria, visual) de todas as páginas em um produto (site ou aplicativo), que mapeia a arquitetura geral e identifica a relação entre as diferentes seções.

Leia Mais

Scrum

É uma das principais metodologias ágeis utilizadas no mundo todo, que proporciona grande flexibilidade e autonomia no desenvolvimento do produto.

Leia Mais

Ship

Refere-se à entrega do produto com sucesso, dentro do prazo e do orçamento ideais.

Leia Mais

Soft Skills

São habilidades comportamentais, ou seja, estão relacionadas a atributos pessoais.

Leia Mais

Storyboard

É uma representação visual da experiência de um usuário com um produto ou espaço problemático. Eles são uma técnica cinematográfica que adotamos e se parecem muito com histórias em quadrinhos.

Leia Mais

Sprint

É um período determinado em que há uma meta definida de um produto incremental para ser cumprida.

Leia Mais

Stakeholder

É um público de interesse do produto, e não necessariamente um usuário. Um investidor, por exemplo, pode ser um stakeholder. Embora traduzível, não recomento.

Leia Mais

Sistemas de Apoio à Decisão (DSS)

É um sistema de informação que suporta atividades de tomada de decisão organizacional. Este campo viu muita pesquisa na década de 1970, e viu um rápido crescimento nas próximas décadas. (Ref: Wikipedia)

Leia Mais