top of page

O QUE É BIG DATA?



INTRODUÇÃO

Você já parou para pensar na quantidade de dados que geramos e armazenamos a cada dia? Bancos, companhias aéreas, operadoras de telefonia, serviços de busca on-line e redes de lojas são apenas alguns dos inúmeros exemplos de empresas que convivem diariamente com grandes volumes de informações. Mas apenas gerar dados não basta: O importante é conseguir e saber usá-los. É aí que o conceito de Big Data se apodera.

Neste e-book, você verá o que é Big Data, entenderá o porquê este nome está cada vez mais presente no vocabulário dos ambientes de negócios e verá os motivos que levam o conceito a contribuir para as estratégias e operações das empresas, governos e demais instituições.


ALGUNS CONCEITOS BÁSICOS:

Diferenças e complementariedade de: Dado, informação, conhecimento e inteligência.

DADO pode ser entendido como um elemento da informação (um conjunto de letras ou dígitos) que, tomado isoladamente, não transmite nenhum conhecimento, ou seja, não contém um significado intrínseco.

INFORMAÇÃO é fabricada por indivíduos a partir de uma experiência passada e de acordo com as exigências de determinada situação na qual a informação vai ser usada. A informação precisa possuir algumas características como, por exemplo: responder a uma questão, solucionar um problema, subsidiar uma decisão, auxiliar em uma negociação ou dar sentido a uma situação.

CONHECIMENTO é uma informação contextual, relevante e acionável. Dito de forma simples, conhecimento é a informação em ação.

Já a INTELIGÊNCIA, no caso a competitiva, pode ser definida como um processo de coleta, análise e disseminação de informações dos ambientes interno e externo, das quais farão uso todos os níveis da organização, interagindo estrategicamente no processo de tomada de decisões de acordo com suas necessidades. O processo de inteligencia empresarial é aplicado em ambientes organizacionais, com o propósito de descobrir oportunidades e reduzir riscos, além de conhecer o ambiente interno e externo à organização, visando o estabelecimento de estratégias de ação a curto, médio e longo prazo.


O BIG DATA

Podemos definir o conceito de Big Data como sendo conjuntos de dados de grande volume e grande complexidade e por estes motivos, necessitam de ferramentas especialmente preparadas para lidar com grandes volumes, de forma que toda e qualquer informação nestes meios possa ser encontrada, analisada e aproveitada em tempo hábil.

De maneira mais simplista, a ideia também pode ser compreendida como a análise de grandes quantidades de dados para a geração de informação importante que, em volumes menores, dificilmente seriam alcançadas.

Não é difícil entender o cenário em que o conceito se aplica: trocamos milhões de mensagens por dia, através de e-mail e WhatsApp, por exemplo; milhares de transações bancárias acontecem no mundo a cada segundo; soluções sofisticadas gerenciam a cadeia de suprimentos de várias fábricas neste exato momento; operadoras registram a todo instante chamadas e tráfego de dados do crescente número de linhas móveis no mundo todo; sistemas de ERP coordenam os setores de inúmeras empresas.

Informação é poder, logo, se uma empresa souber como utilizar os dados que tem em mãos, poderá entender e criar inteligencia competitiva de como melhorar um produto, como criar uma estratégia de marketing mais eficiente, como cortar gastos, como produzir mais em menos tempo, como evitar o desperdício de recursos, como superar um concorrente, como disponibilizar serviços para a um cliente especial de maneira satisfatória. Perceba, estamos falando de fatores que podem inclusive ser decisivos para o futuro da empresa. Mas, Big Data é um nome relativamente recente. Isso significa que somente nos últimos anos é que as empresas descobriram a necessidade de fazer melhor uso de seus grandes bancos de dados? Pode ter certeza que não. Há tempos que departamentos de TI contemplam aplicações de Database Marketing. Data Mining, Business Intelligence e CRM (Customer Relationship Management), por exemplo, para tratar justamente de análise de dados, tomadas de decisões e outros aspectos relacionados aos negócios.

A proposta de uma solução de Big Data é a de oferecer uma abordagem ampla no tratamento do aspecto cada vez mais "caótico" dos dados para tornar as referidas aplicações e todas as outras mais eficientes e precisas. Para tanto, o conceito considera não somente grandes quantidades de dados, a velocidade de análise e a disponibilização destes, como também a relação com e entre os volumes.


POR QUE É TÃO IMPORTANTE?

Lidamos com dados desde os primórdios da humanidade. Acontece que, nos tempos atuais, os avanços computacionais nos permitem guardar, organizar e analisar dados muito mais facilmente, mais rápido e com frequência muito maior. Este panorama está longe de ser finito. Basta imaginar, por exemplo, que vários dispositivos em nossas casas - geladeiras, TVs, lavadoras de roupa, cafeteiras, entre outros estarão conectados à internet em um futuro não muito distante. Esta previsão está dentro do que se conhece como Internet das Coisas.

Se olharmos para o que temos agora, já veremos uma grande mudança em relação às décadas anteriores: tomando como base apenas a internet, pense na quantidade de dados que são gerados diariamente somente nas redes sociais; repare na imensa quantidade de sites na Web; perceba que você é capaz de fazer compras on-line por meio até do seu celular, quando o máximo de informatização que as lojas tinham em um passado não muito distante eram sistemas isolados para gerenciar os seus estabelecimentos físicos.

As tecnologias atuais nos permitiram - e permitem – aumentar exponencialmente a quantidade de informações no mundo e, agora, empresas, governos e outras instituições precisam saber lidar com esta "avalanche" de dados. O Big Data se propõe a ajudar nesta tarefa, uma vez que as ferramentas computacionais usadas até então para gestão de dados, por si só, já não podem fazê-lo satisfatoriamente.

A quantidade de dados gerada e armazenada diariamente chegou a tal ponto que, hoje, uma estrutura centralizada de processamento de dados já não faz mais sentido para a maioria absoluta das grandes entidades. Como exemplos, um Boeing 787 Dreamliner, fabricado pela primeira vez em 2007, produz aproximadamente um terabyte de informações por voo. Algumas companhias aéreas já estão colocando sistemas de streaming de dados a bordo de modelos como o próprio 787, tornando a caixa preta, hoje imprescindível, em um acessório de necessidade questionável.O Google possui vários data centers para dar conta de suas operações, mas trata todos de maneira integrada. Este "particionamento estrutural", é bom destacar, não é uma barreira para o Big Data - em tempos de computação nas nuvens.


OS "5V'S" DO BIG DATA: VOLUME, VELOCIDADE, VARIEDADE, VERACIDADE E VALOR

Com a intenção de deixar uma ideia de Big Data mais clara, alguns especialistas passaram a resumir o assunto em dimensões que possibilita descrever a base de conceito nos cincos 'Vs' - volume, velocidade e variedade, com os fatores veracidade e valor aparecendo posteriormente.

Na dimensão volume(volume) estamos falando de quantidades de dados realmente grandes, que crescem exponencialmente e que, não raramente, são subutilizados justamente por terem esta dimensão.

Velocidade (velocity) é outra dimensão que deve estar presente para dar conta de determinados problemas, o tratamento dos dados (obtenção, gravação, atualização) deve ser feito em tempo hábil - muitas vezes em tempo real. Se o tamanho do banco de dados for um fator limitante, o negócio pode ser prejudicado: imagine, por exemplo, o transtorno que uma operadora de cartão de crédito teria - e causaria - se demorasse horas para aprovar um transação de um cliente pelo fato de o seu sistema de segurança não conseguir analisar rapidamente todos os dados que podem indicar uma fraude.

Variedade(variety) é outra dimensão importante. Os volume de dados que temos hoje são consequência também da diversidade de informações. Temos dados em formato estruturados, isto é, armazenados em bancos como PostgreSQL e Oracle, e dados não estruturados oriundos de inúmeras fontes, como documentos, imagens, áudios e vídeos. É necessário saber tratar a variedade como parte de um todo - um tipo de dado pode ser inútil se não for associado a outros.

Na dimensão da veracidade(veracity) também pode ser considerado, pois não adianta muita coisa lidar com a combinação "volume + velocidade + variedade" se houver dados não confiáveis. É necessário que haja processos que garantam o máximo possível a consistência dos dados. Voltando ao exemplo da operadora de cartão de crédito, imagine o problema que a empresa teria se o seu sistema bloqueasse uma transação genuína por analisar dados não condizentes com a realidade, aliás este erro ocorre frequentemente, porque as operadores usam dados amostrais com margem de erro, devido a incapacidade de trabalhar com todos os dados.

Informação não é só poder, informação também é patrimônio. A combinação "volume + velocidade + variedade + veracidade", além de todo e qualquer outra dimensão que caracteriza uma solução de Big Data, se mostrará inviável se o resultado não trouxer benefícios significativos e que compensem o investimento. Este é o ponto de vista da dimensão valor(value).

É claro que estas cinco dimensões não precisam ser tomadas como a definição perfeita. Há quem acredite, por exemplo, que a combinação "volume + velocidade + variedade" seja suficiente para transmitir uma noção aceitável do Big Data. Sob esta óptica, as dimensões da veracidade e do valor seriam desnecessárias, porque já estão implícitas no negócio - qualquer organização sabe que precisa de dados consistentes; nenhuma entidade toma decisões e investe se não houver expectativa de retorno.

O destaque para estes dois pontos talvez seja mesmo desnecessário por fazer referência ao que parece óbvio. Por outro lado, a sua consideração pode ser relevante porque reforça os cuidados necessários a estas dimensões: uma empresa pode estar analisando redes sociais para obter uma avaliação da imagem que os clientes têm de seus produtos, mas será que estas informações são confiáveis ao ponto de não ser necessário a adoção de procedimentos mais criteriosos? Será que não se faz necessário um estudo mais profundo para diminuir os riscos de um investimento antes de efetuá-lo?

De qualquer forma, as três primeiras dimensões 'Vs' - volume, velocidade e variedade - podem até não oferecer a melhor definição do conceito, mas não estão longe de fazê-lo. Entende-se que Big Data trata apenas de enormes quantidades de dados, todavia, você pode ter um volume não muito grande, mas que ainda se encaixa no contexto por causa das dimensões velocidade e variedade.

FINALIZANDO...

Hoje a ideia de Big Data reflete um cenário real: há, cada vez mais, volumes de dados gigantescos e que, portanto, exigem uma abordagem capaz de aproveitá-los ao máximo. Apenas para dar uma noção deste desafio, a IBM divulgou no final de 2012 que, de acordo com as suas estimativas, 90% dos dados disponíveis no mundo foram gerados apenas nos dois anos anteriores. Até o final da década, este volume todo terá aumentado pelo menos vinte vezes. Diante deste ponto de vista, é um tanto precipitado encarar a expressão "Big Data" como uma mero "termo da moda".



 

Para baixar o eBook dessa matéria, clique na imagem abaixo.



27 visualizações0 comentário

Posts recentes

Ver tudo
bottom of page