Hadoop, o que é e porque interessa

Hadoop

Hadoop

Volta e meia o mundo das TI tem um novo jargão. Actualmente é Hadoop. Mas afinal o que é e para que serve? Numa forma (muito) simples, o Hadoop é “arquitectura de software open-source para armazenamento e processamento de big data numa forma distribuída, em grandes clusters de hardware”. Ou seja, faz duas coisas: armazena grandes quantidades de dados e a uma velocidade de processamento mais rápida.

Mas como é que tudo funciona? No armazenamento o Hadoop consegue armazenar quantidades consideráveis (diga-se mesmo imensas) de dados porque distribui os dados em blocos, que depois são armazenados em clusters, que por seu lado “ficam” em hardware standard low cost. Já no processamento a velocidade é obtida pelo facto de o hadoop recorrer ao processamento paralelo, ligando computadores de baixo custo para resultados mais rápidos.

Isto vai permitir reduzir os custos de armazenamento e de processamento. Veja-se o caso de empresas como a Google, Yahoo, Etsy, Ebay, Twitter, entre outras que há algum tempo que usam o hadoop para se diferenciarem da concorrência. O que está a levar empresas de outras dimensões e sectores a olhar para o hadoop com “novos olhos”.

As vantagens são muito práticas e evidentes: é low cost porque usa software open source; utiliza o poder da computação distribuída – quantos mais computadores ligados maior a capacidade de processamento; fácil escalabilidade; armazenamento flexível; e protecção de dados e capacidade de auto-recuperação inerentes. É por isso que o Hadoop veio para ficar. Os benefícios da sua utilização não permitirão o seu abandono.

Mas, se está curioso e quer saber mais sobe o tema não pode perder o SAS Fórum 2014. O especialista Rui Rosa vai apresentar uma sessão que terá como título: Big Data & SAS Data Loader for Hadoop.

Mais informação em: SAS Fórum 2014.

Deixar uma resposta