Dado pode ser definido como sucessões de fatos brutos, que não foram organizados, processados, relacionados, avaliados ou interpretados, representando apenas partes isoladas de eventos, situações ou ocorrências. Constituem as unidades básicas a partir das quais informações poderão ser elaboradas ou obtidas.
Características:
- Facilmente Estruturado
- Facilmente obtido por máquinas
- Frequentemente quantificado
- facilmente transferível
Dados estruturados são aqueles organizados e armazenados em SGBD, geralmente relacional, que possui como características possuir uma descrição sobre os dados, conhecidos como metadados.
Dados semiestruturados. Essa segunda categoria de dados geralmente não é mantida em SGBDs (embora a maioria dos bancos de dados relacionais admita o tipo XML, seguindo a recomendação do padrão SQL). Os dados semiestruturados apresentam uma organização bastante heterogênea o que
pode dificultar as consultas a esses dados.
Dados não estruturados. De forma simples são inclusos aqui os dados que não possuem uma estrutura definida. Podem ser listados como exemplo documentos, textos, imagens e vídeos. Esses, geralmente, não possuem descrição para suas estruturas, nem implicitamente. A grande maioria dos dados disponíveis na Web são classificados dentro destes formatos.