Conheça as 5 melhores práticas de gestão de dados

 

gestão de dadosSeja qual for o seu negócio, tem, com certeza, alguns dados importantes “pendurados” fora da organização. De facto, provavelmente tem muitos dados importantes armazenados em diferentes locais – interna ou externamente. O que lhe pode faltar são as melhores práticas de gestão de dados que o poderiam ajudar a alcançar todos os dados e a observá-los de perto. Fazendo apenas isso poderia dar-lhe um vislumbre de uma visão que poderia empurrar o seu negócio num novo mercado ou fazer disparar os lucros para além de todas as expectativas.

Mas o quê e onde estão todos os dados que são relevantes para o meu negócio? Pode aceder a eles quando quer? Sabe quão precisos, actuais e “limpos” e completos são? Pode, facilmente, juntá-los todos, independentemente do seu formato ou quantas vezes mudam?

A grande questão é: os seus dados estão prontos para apoiar o Business Analytics? Uma verdade muitas vezes ignorada é que antes de se conseguir fazer coisas interessantes com as analíticas é preciso “fazer” os dados primeiros. Isso é que é a gestão de dados.

Melhores práticas de gestão de dados = melhores análises

É claro, muitas empresas fizeram análises em dados que não estavam realmente preparados para as analíticas. Os dados podiam estar incompletos – talvez a infra-estrutura da empresa não conseguia acomodar alguns dos novos formatos dos dados, como os não estruturados, das mensagens de texto. Ou talvez estivessem a trabalhar com dados duplicados, corruptos ou fora de prazo.

Até que essas empresas encontrem uma melhor forma de gerir os seus dados os resultados das suas análises vão ser um pouco… bem, menos de óptimo. Então quão difícil é gerir dados não filtrados e torná-los prontos para análise? Pergunte aos Data Scientists. Para muitos deles só a preparação dos dados ocupa entre 50 a 80 porcento do seu tempo aquando do modelo de desenvolvimento.

5 boas práticas5 melhores práticas de gestão de dados para preparar os seus dados para análise

  1. Simplificar o acesso aos dados tradicionais e emergentes. Mais dados normalmente significa melhores previsões. Então “maior” é geralmente melhor quando se trata da quantidade de dados a que os analistas e os cientistas de dados acedem. Com acesso a mais dados é mais fácil (e rápido) determinar quais os melhores dados para prever um resultado. O SAS ajuda ao oferecer uma abundância de capacidades de acesso a dados que tornam mais fácil trabalhar com uma variedade de dados de um conjunto crescente de fontes, formatos e estruturas.
  2. Fortalecer o arsenal dos cientistas de dados com técnicas avançadas de análise. O SAS disponibiliza capacidades sofisticadas de análise estatística no flow ETL. Por exemplo, a análise das frequências ajuda a identificar outiers e valores em falta que podem distorcer outras medidas como significado, média e variação. O resumo das ajuda os analistas a compreender a distribuição e variação – porque os dados nem sempre são distribuídos equitativamente, tal como assumem muitos métodos estatísticos. As correlações mostram quais as variáveis ou combinação de variáveis será mais útil, baseada na força da capacidade preditiva – à luz das quais as variáveis podem influenciar umas às outras, e em que grau.
  3. Misture os dados para embutir qualidade nos processos existentes. Até 40% de todos os processos estratégicos falham devido à má qualidade dos dados. Com uma plataforma de qualidade de dados, projectada em torno das melhores práticas de gestão de dados, pode incorporar a limpeza dos dados directamente no fluxo de integração de dados. “Empurrar” o processamento para as bases de dados aumenta o desempenho e remove os dados inválidos, com base no método analítico que esteja a utilizar. Ao mesmo tempo enriquece os dados através do binning (ou seja, agrupa dados que, originalmente, estava em intervalos menores).
  4. Modele os dados usando técnicas flexíveis de manipulação. A preparação dos dados para análise requer a fusão, transformação, de-normalização e, algumas vezes, agregação das fontes de dados, de várias tabelas, numa única, muitas vezes chamada de tabela base analítica (ABT). O SAS simplifica a transposição dos dados com interfaces gráficos e intuitivos. Adicionalmente permite que use outras transformações modelares, como a análise das frequências, anexando, particionando e combinando dados e multiplicando várias técnicas de resumo.
  5. Partilhe os metadados pela gestão dos dados e pela análise de domínios. A camada comum de metadados permite repetir, constantemente, os processos de preparação dos dados. Promove a colaboração, disponibiliza informação sobre o fluxo do processo de preparação dos dados e facilita a implementação de modelos, de ciclos mais rápidos, proporciona dados mais flexíveis, transparentes e auditáveis.


Dados: a base das decisões.

As analíticas podem ser um dos tópicos de TI mais “quentes” nos dias de hoje – é, sem dúvida, uma tecnologia muito sexy. Mas há medida que sonha com a magia das analíticas lembre-se disto: subjacente à análise estão os dados. Não subestime o quão importante é tê-los da forma adequada.

Pode obter mais informação no white paper “Thirsting for Insight? Quench It With 5 Data Management for Analytics Best Practices.”

Artigo de Cindy Turner
originalmente publicado no SAS Insights

Deixar uma resposta