Data quality é a soma de requisitos, técnicas e processos usados para garantir que um negócio tenha dados úteis a seu serviço.
Quantidade não é qualidade, já diz o conhecido ditado popular.
Mais do que isso, ao promover cortes e contar com informação qualificada, evita-se a perda de um dos ativos mais valiosos: o tempo.
Pense bem: na sua empresa, quando é necessário consultar algum tipo de registro, os resultados são facilmente obtidos ou é preciso realizar uma verdadeira caça ao tesouro?
Ou, ainda, será que parte das reclamações recebidas têm ligação com um banco de dados defasado ou que não está preparado para suportar a demanda dos clientes?
O que fazer nesses e em outros casos? É o que mostramos neste conteúdo.
Acompanhe!
Data quality é o conjunto formado pelas estratégias, políticas, tecnologias e, claro, pessoas que cuidam para que os dados armazenados sejam confiáveis.
Você pode até entendê-lo como uma “faxina” constante – e, de certo modo, é.
Por outro lado, isso não quer dizer que parte desse trabalho de limpeza não possa ser evitado ou, pelo menos, otimizado.
Vamos supor que, em um formulário de cadastro de clientes, está lá o tradicional campo “CPF”.
Seja por descuido, seja deliberadamente, um usuário insere um número que não existe.
Acontece que o CPF é formado por uma sequência lógica e, portanto, não há como inventar um.
Então, não seria melhor se a sua empresa estivesse preparada para isso, evitando que números inválidos sejam enviados?
Pois esse tipo de problema tem tudo a ver com as rotinas de data quality, que servem fundamentalmente para assegurar que o seu banco de dados esteja sempre limpo e disponível.
Mas como fazer data quality, considerando desde a parte que antecede a definição dos dados a serem utilizados?
É isso que vamos ver a seguir.
Alguns “sintomas” indicam que a qualidade dos dados de uma empresa está deixando a desejar.
As perguntas do tópico de abertura deste texto, por exemplo, podem indicar que os seus dados não estão atendendo às necessidades do negócio – pelo menos não como deveriam.
Então, se as consultas realizadas em seus arquivos não geram respostas ou levam tempo demais para dar resultados, é sinal de que a situação não caminha bem.
Ou, em outro sentido, você até tem dados, mas eles raramente são utilizados, porque você e os profissionais da empresa nem lembram que eles existem.
Isto é, eles são irrelevantes.
Sabe por que isso acontece? Porque não foi implementada uma política de data quality, tampouco foram definidas metas vinculadas ao uso dos dados.
O bom é que essa situação pode ser revertida com relativa tranquilidade, desde que as ferramentas certas sejam utilizadas.
Acontece que, em alguns casos, é muito difícil detectar inconsistências em um banco de dados, considerando suas dimensões, seu formato e as maneiras de acessá-lo.
Nesse momento, o profissional de dados precisa ter ferramentas que permitam fazer varreduras que, por sua vez, servirão para identificar eventuais erros.
Uma delas é o Alteryx, com a qual você se habilita a fazer pesquisas de padrões e implementar recursos para avaliar a qualidade dos seus dados.
Em alguns casos, é possível que a sua empresa tenha que começar do zero para mudar o panorama da gestão dos dados a fim de melhorar a sua relevância.
E ainda que não seja necessário, vale sempre conhecer as etapas básicas em um processo de gestão de qualidade de dados para otimizar o que já tem sido feito.
Acompanhe!
Para começar, a empresa pode definir o que ela espera dos dados captados pelas suas mídias, eletrônicas ou não, por meio de uma política, conforme os princípios da governança de dados.
De nada adiantaria inserir uma janela pop-up em seu site solicitando e-mails para envio de newsletter se você não usa e-mail marketing, certo?
Ou, em um formulário de cadastro, pense se é realmente necessário poluir seu banco de dados com informações de pouca utilidade.
O número de CPF, por exemplo, pode ser dispensável em alguns casos.
Siga essa linha de raciocínio e vá definindo regras, objetivos e padrões até que a empresa tenha uma política para tratar e utilizar os seus dados.
Na sequência, é hora de analisar os dados já disponíveis pelo processo conhecido como profiling, que nada mais é do que escanear uma base de dados para saber em que estado eles se encontram.
Imagine, por exemplo, que uma planilha de cadastro de clientes tenha um campo em que a pessoa insere a sua data de nascimento.
Acontece que, em alguns deles, há respostas como 01/01/2020. É impossível que isso seja real, já que esse usuário seria recém-nascido, concorda?
Ao detectar esse tipo de inconsistência, é preciso realizar a correção do formulário ou inserir novas funções e regras de preenchimento.
Na idade, por exemplo, você pode definir uma norma que impeça a pessoa de preencher a data de nascimento caso tenha menos de 18 anos.
O trabalho do profissional e das equipes de data quality, como foi possível perceber, é ininterrupto.
É algo bastante parecido com o que faz um time responsável pela limpeza, mas, neste caso, há muito mais questões estratégicas envolvidas.
Por isso, não deixe de reavaliar constantemente a qualidade dos seus dados e, se perceber que eles estão deixando de ser relevantes, siga as etapas descritas aqui para sua otimização.
O Alteryx é uma das chamadas data quality tools mais eficazes, porque permite que o seu negócio faça análises com um fluxo intuitivo para data blending e advanced analytics.
Com ele, você faz check-ups profundos em poucas horas, em vez das semanas demandadas pelas ferramentas tradicionais.
Não é uma ótima maneira de garantir a qualidade dos dados para alcançar as metas mais arrojadas?
Os métodos de data quality exigem a aplicação de técnicas e ferramentas avançadas de data analytics.
Portanto, é fundamental contar com o apoio de especialistas.
Nesse sentido, a consultoria da FiveActs é sua melhor escolha na hora de qualificar a gestão dos dados.
Seja quais forem os seus desafios, nós podemos ajudar você a superá-los com as nossas soluções analíticas.
Faça contato e descubra como!