Dicas para visualizar grandes quantidades de dados

New Picture (6)A visualização de dados é “a”, ou pelo menos “uma das”, ferramentas “quentes” que estão hoje no mercado. É ela que permite mostrar, de forma imediatamente perceptível, os dados trabalhados por uma empresa ou entidade. Mas será que a visualização de dados pode ser utilizada em todos os cenários? Será que poderá acontecer que a dimensão dos dados a mostrar seja tão extensa e complexa que seja impossível recorrer a esta ferramenta?

Felizmente há técnicas de visualização de dados que permitem explorar e interagir com grandes volumes de dados.

Primeiro que tudo há que filtrar os dados. Se apenas necessito de analisar dados referentes à região de Lisboa porque estar a trabalhar com a base europeia? Os filtros são uma excelente forma de refinar a informação necessária. Outra possibilidade é o recurso a histogramas. Estes providenciam uma distribuição visual dos dados, juntamente com sugestões de como os dados mudarão se os filtrar numa determinada categoria. Isto permite, por exemplo, ver, num mesmo gráfico, a distribuição de dados por duas regiões diferentes, duas faixas etárias,… O que permite poupar (muito) tempo.

Outra forma é a de apresentar os dados de uma forma condensada e apresenta-los em gráficos. Para tal é utilizada a técnica do binning ou agrupamento de dados. Um exemplo? Apresentar os dados por anos e não por meses. E isso é possível “mexendo” em ambos os eixos dos gráficos.

E depois há os autocharting. Em caso de dúvida dê uma hipótese ao sistema. Deixe-o apresentar uma visualização que ele considera ser a mais adequada à quantidade e tipo de dados. São os chamados gráficos inteligentes. O sistema analisa os dados e define o tipo de gráfico mais adequado aos dados (independentemente da quantidade) utilizados e à necessidade do utilizador. Quem sabe? Pode ser a escolhida. Senão sempre pode alterar.

Os gráficos de barras são dos mais utilizados dado que permitem uma avaliação visual imediata. No entanto quando se trata de conjunto de dados está provado que não são os mais indicados. A solução passa por usar gráficos (de barras) que condensem os dados mas que, simultaneamente, disponibilizem uma barra com uma visão geral, que permita “escavar” nas várias barras e ter acesso a dados mais detalhados. Uma espécie de gráfico de gráficos.

Mas nem sempre isso é suficiente. O que fazer quando o que se pretende é analisar dados de vários países? Em que se utiliza dados estruturados e semi-estruturados? Em que é necessário saber as várias ligações e obter ilações? Aqui a sugestão vai para que se utilize os diagramas de rede. Estes vêm as relações em termos de “nós” e “vínculos”. Com o primeiro a representar os indivíduos na rede e o segundo as relações entre os indivíduos, quer sejam, de amizade, parentesco ou de negócio. Estes diagramas são especialmente bons para compreender as relações e a influência entre consumidores ou grupos de consumidores. Isto no caso dos departamentos de marketing ou das agências de comunicação. Uma outra utilização, a ser usada pelas autoridades é o de conseguir mapear organizações clandestinas (diga-se ilegais).

Por último há as matrizes de correlação. A solução adequada para quando se trabalha com constantes streams de dados, em que a velocidade a que estes são gerados representa um desafio. A matriz de correlações consegue aliar o big data a uma resposta rápida, de forma a identificar quais as variáveis que estão relacionadas (e eliminar as que não interessam). Simultaneamente mostra o quão forte é a relação entre as variáveis. O que ajuda a aumentar a rapidez da análise. Isto porque os modelos analíticos conseguem reduzir as varáveis a trabalhar mais rápida e eficientemente.

Estas são apenas algumas das dicas úteis para quem trabalha com quantidades massivas de dados e que necessita de trabalhá-los e apresenta-los de uma forma visual que seja rápida e facilmente perceptível. Escolha a que melhor se adapte à sua necessidade.

Este é um dos temas que irá ser abordado no SAS Fórum 2014. Poderá obter mais informações na página do evento.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *