As organizações costumavam ser impulsionadas por processos, agora são movidas por dados.

Data Management

A qualidade dos dados tem sido um problema desde que a primeira base de dados foi criada. E foi um tema que durante muito tempo recebeu pouca atenção, pela simples razão de que a eficiência do processo foi sempre mais importante do que a integridade e a exactidão dos dados. Os dados eram um subproduto do processo. Isto originou bases de dados com um número considerável de erros e omissões. Para lidar com isto os dados eram sempre validados antes de alguém os usar. Se se descobrisse uma grande quantidade de dados incorrectos todos os esforços eram, subitamente, alocados em fornecer os dados em falta, em corrigir os dados incorrectos e/ou em limpar as bases de dados contaminadas. Foi sempre exigida a intervenção humana.

Este é um dos 11 artigos do eBook Future Bright – A Data Driven Reality


Os dados iniciam, automaticamente, os processos

Este método operacional está-se a tornar problemático, dado que agora as fontes dos dados estão cada vez mais interligadas e os processos podem começar a qualquer momento. Se antes o início de uma campanha de email marketing era determinada pelo marketer hoje estas têm início mal os triggers são activados pelo consumidor a que se pretende responder. Quanto mais se compreende o processo de compra, a viagem do consumidor, mais fácil será responder a esses trigers e mais relevante será a organização para os seus clientes. Isto obriga-o a definir políticas que indiquem como a empresa irá responder quando o seu cliente ou prospecto solicitar determinada informação ou subscrever uma newsletter.

O processo prossegue de forma totalmente automática, sem intervenção humana e, portanto, sem a validação que anteriormente ocorria. Isto obriga a que a exactidão dos dados seja verificada automaticamente, através de serviços que podem ser implementados ao longo do processo. Aqui podemos fazer uma distinção entre a validação de dados (correcção técnica dos dados num fluxo de dados físico) e qualidade de dados (verificação da exactidão funcional).

Dados impulsionam realidade

As organizações costumavam ser impulsionadas por processos mas hoje são “movidas” pelos dados. Isto significa que qualquer falha em identificar um erro pode ter um grande, e imediato, impacto. A correcção manual já não é possível pelo que o erro irá aparecer em múltiplas localizações. Isto faz com que a monitorização dos dados seja ainda mais importante. E também explica porque a compliance, as regras e regulamentos estão a impor novos requisitos à qualidade dos dados. Hoje em dia os supervisores querem dados e não relatórios. Isto requer uma organização direccionada aos dados. Estamos a dirigirmo-nos, a grande velocidade, a uma realidade orientada pelos e para os dados.

O problema não é a tecnologia mas sim a falta de supervisão central da consistência das definições dos dados – governação de dados. Essa é, tipicamente, a tarefa do Chief Data Officer, função ainda inexistente para muitas organizações.

A era do Consumidor e da Internet das Coisas são essenciais

É hora de agir porque na Era do Consumidor é preciso responder, de forma flexível, aos trigers dos clientes. Isto exige uma visão 360º do consumidor. Já falamos disto há alguns (muitos) anos mas ainda não a temos porque os dados do consumidor estão espalhados por vários sistemas. E a falta de supervisão das definições de dados impossibilitam o agregar dos dados.

O desenvolvimento resultante da Internet das Coisas (IoT) é outro dos drivers que irá gerar um novo fluxo de dados que quereremos usar para optimizar e automatizar os processos. E que também requer uma boa visão sobre gestão de dados.

Combinação de diferentes tipos de dados

Independentemente de qual das duas realidades seja o seu driver principal, em ambas as situações é cada vez mais importante combinar dados 100% fiáveis com dados que tenham algum grau de incerteza. As previsões meteorológicas e as análises de comportamento/sentimento das redes sociais são dois exemplos. Mas como é que é possível combinar, de forma adequada, estes dados não estruturados, na maioria das vezes, armazenados em clusters Hadoop, com dados estruturados, 100% exactos, tais como o planeamento de rotas para os transportes ou dados sobre o processo de compra?

De um ponto de vista económico não é viável armazenar todos os dados na mesma base de dados. Mas esta decisão é, igualmente indesejável, do ponto de vista organizacional, como explica Ronald Damhof no seu livro. Afinal há uma grande diferença entre os dados supervisionados e os que utiliza para experiências, à procura de ideias para inovar. Mesmo assim essas diferentes formas de usar os dados devem ser combinadas sem juntar fisicamente todos os dados.

Esta complexidade exige um modelo lógico de dados e definições de dados claras. Sem estas definições e uma boa gestão de dados é impossível explorar as oportunidades que surjam no mercado e às quais os concorrentes vão responder em massa. Assim a questão já não se prende com se vai começar mas quando. O meu conselho: actue já, hoje. Os dados são o seu maior trunfo. Aja em conformidade e de faça algo com eles (os dados) antes que a concorrência ou um novo player lhe passe à frente.

Jeroen DijkxhoornJeroen Dijkxhoorn
Director Analytical Platform Center of Excellence no SAS
@JeroenDijkx

É um dos autores do eBook Future Bright – A Data Driven Reality

Deixar uma resposta