O que é Big Data?

Rita Carolina - Sep 15 '22 - - Dev Community

Big Data é um conjunto de dados ou dataset grande demais para um banco de dados convencional e que também pode ser definida como um conjunto de dados que precisa ser processado e é gerado em grande volume, velocidade e variedade. Esses dados são usados em processos de tomada de decisão em organizações afim de otimizar processos ou recursos. Esse é um conceito que se popularizou em 2008 com a ascenção das redes sociais.

Big data pode ser gerada por máquinas, humanos e organizações. Máquinas podem gerar uma quantidade enorme de dados com seus sensores, cameras, satélites e rádios. Uma caraterística popular em dados gerados por máquinas é sua necessidade de processamento em tempo real para otimizar a tomada de decisão. Por exemplo um avião gera 2.5 bilhões de terabyte por ano através de seus sensores instalados nos motores.

Humanos podem gerar toneladas de dados através das mídias sociais, subindo suas fotos, postando atualização de status e subindo vídeos. Uma caraterística comum de dados gerados por humanos é que em sua maioria são desestruturados. Já os dados que são gerados por organizações geralmente são informações altamente confiáveis, bem definidas e estruturados. Podem ser geradas por sistemas de gestão como um ERP, produzindo dados como registros e transações.

Fonte: https://www.iosrjournals.org/iosr-jce/papers/conf.15013/Volume%202/1.%2001-05.pdf?id=7556

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .