Não por acaso, cumpre papel importante na sua análise e na transformação em informações que qualificam a tomada de decisão em um projeto ou empresa.
Para entender melhor do que se trata, podemos recorrer a uma analogia.
Você deve concordar que é um pouco frustrante, ao pesquisar no Google, receber respostas longe daquilo que busca.
Isso acontece quando você precisa de uma resposta específica, mas parte de uma pesquisa genérica e abrangente.
A granularidade de dados, de certa forma, remete a uma ideia parecida: refinar os dados para que, ao serem acionados, tragam retornos conforme a intenção de quem busca.
Por envolver um minucioso trabalho conjunto entre engenheiros de dados, programadores e especialistas em TI, a área da gestão que trata da granularidade de dados é uma das mais desafiadoras.
Siga a leitura para saber o que significa o conceito e de que maneira ele pode ser aplicado em seu negócio.
Granularidade de dados é a concepção em tratamento e gestão de dados segundo a qual eles são armazenados e tratados em unidades maiores ou menores. Portanto, diz respeito à escala pela qual um sistema deverá alocá-los para posteriores pesquisas, entre outros usos.
Digamos, por exemplo, que temos um banco de dados com cadastro de clientes.
Cada perfil pode conter uma unidade de dados em que constam endereço, idade, sexo, estado civil e se a pessoa tem filhos.
Nessa situação, temos um conjunto de dados que poderiam ser ainda mais granulares, caso cada informação dessas fosse armazenada e acessada de forma independente.
Em outra analogia, poderíamos pensar em uma oficina.
Nela, cada veículo pode ser considerado como um conjunto de dados que, por sua vez, podem ser “granulados” pelo seu desmonte.
Agora, imagine isso em termos de armazenamento.
Se cada carro fosse desmontado, provavelmente, a oficina teria problemas, já que a demanda por espaço aumentaria.
Do contrário, com veículos inteiros, essa demanda é menor, mas, por outro lado, pode ser mais trabalhoso encontrar uma peça.
Por essa mesma lógica, a granularidade de dados é essencial para definir o quanto de espaço de armazenamento em um data warehouse será necessário.
Por isso, lembre-se: quanto mais granulares, mais espaço demandado e mais precisão.
Em contrapartida, uma granularidade menor equivale a menos demanda por espaço, mas, por outro lado, o acesso aos dados se torna mais restrito.
Definir uma relação que contemple os interesses e necessidades de uma empresa quanto ao uso dos seus dados pode ser comparado também com uma “arte”.
Sendo assim, o cientista de dados que se propõe a definir um tipo de granularidade é um verdadeiro “artista” no sentido de encontrar a proporção mais adequada.
Se ele errar a mão e formatar um sistema de gestão de dados pouco granular, vai prejudicar as rotinas da empresa ao dificultar o acesso às informações.
Porém, se os dados forem demasiadamente granulares, o prejuízo será sentido ao utilizar mais espaço de armazenamento do que seria normalmente exigido.
Desse modo, a granularidade na medida certa é fundamental, porque traz consigo algumas garantias, como destacamos a seguir.
Considere um sistema ERP integrado às vendas.
Nesse sistema, pouco granular, os dados comerciais estão agrupados de forma bastante genérica.
Assim, utilizando a pesquisa, você apenas poderá saber informações básicas, como a data de uma venda ou o nome do vendedor que a fez.
No entanto, você tem que calcular o ticket médio por vendedor e, para isso, precisará fazer um grande esforço para buscar as informações venda a venda.
Com a granularidade correta, todo esse trabalho poderia ser poupado, já que os dados poderiam estar armazenados de maneira a favorecer pesquisas mais detalhadas.
Considerando o exemplo anterior, um conjunto de dados granulados na medida certa não só pouparia tempo e trabalho, como garantiria resultados mais precisos.
Em vez de buscar os números de cada venda “no olho”, seria possível pesquisar diretamente pelos dados necessários para calcular o ticket médio, ou mesmo fazer esse cálculo diretamente.
Nem precisamos ir muito longe para perceber que processos de Extract, Transform and Load (ETL) dependem diretamente da definição da granularidade correta.
Afinal, eles se destinam justamente a buscar em um data warehouse por dados para posterior tratamento e carregamento.
Você também já deve ter percebido que o conceito de dados granulares tem tudo a ver com sua análise e com o conceito de big data.
Nesse caso, é necessário considerar algumas questões elementares para relacioná-los da maneira certa:
Portanto, a granularidade é o ponto de partida para você saber o que deverá extrair do big data e, com isso, definir processos de análise de dados adequados aos seus objetivos.
Se para você é muito difícil responder às questões do tópico anterior, não tem problema.
Você pode começar vendo na sequência quais erros devem ser evitados na hora de definir o tipo de granularidade dos dados para o seu negócio e, assim, ter um ponto de partida.
Confira!
A inteligência de negócios precisa ter critérios claros e diretos para ser acionável.
No entanto, ao simplificar demais, pode se perder o aprofundamento necessário para o bom uso dos dados.
Nesse caso, o risco de desperdiçar informação valiosa é iminente e, assim, a tendência é perder também insights importantes.
Em outras palavras: quando a granularidade dos dados é muito baixa, você só vê grandes padrões superficiais, arriscando-se a abrir mão de dados críticos.
Você já ampliou acidentalmente o zoom em um mapa online?
É uma experiência desagradável, porque não se consegue distinguir nenhuma informação, já que não há contexto.
Isso também acontece com os dados.
Se eles forem muito granulares, você se perderá, não conseguindo se concentrar o suficiente para encontrar um padrão dentro de dados desconexos.
Os erros de granularidade de dados mais comuns estão relacionados a intervalos de tempo, ou seja, variáveis de medição em uma base horária, diária, semanal, anual e por aí vai.
Erros de granularidade temporal geralmente ocorrem por uma questão de conveniência, já que boa parte das empresas tem formas padronizadas de relatar variáveis temporizadas.
Na maioria delas, exigiria muito esforço mudá-las, então, elas simplesmente não mudam, sujeitando-se ao tratamento impreciso dos dados disponíveis.
Não seria exagero dizer que a granularidade de dados, além de uma arte, é uma disciplina à parte dentro do universo de TI.
Definir o quão granulares seus dados devem ser, como vimos, é uma tarefa de relativa complexidade e, portanto, de fundamental relevância.
Por isso, é igualmente importante contar com a parceria certa ao formatar sistemas de coleta, tratamento e gestão de dados.