O que é um Data Warehouse?

O que é um Data Warehouse?2
Imagem: reprodução/ Corbis

Devido à atual competitividade do mercado da Tecnologia, não há espaço para decisões baseadas em dados fragmentados e ações passíveis de erro. Por isso, os sistemas de informações estão cada vez mais voltados à organização e análise de dados.

A busca pela integração entre os sistemas tradicionais levou ao desenvolvimento dos Data Warehouse –  armazém ou depósito de dados. Projetados para encontrar informações específicas em sistemas de uma empresa, essa plataforma é capaz de concentrar dados de diversos sistemas estruturados e outras bases de dados.

O que é um Data Warehouse?

O depósito de dados é uma base para processamento de informação que  fornece uma plataforma sólida para análise dos dados referente a uma ou mais atividades de uma empresa de forma consolidada.

Os Warehouses são voltados à tomada de decisões estratégicas nas empresas principalmente pelo fato de possibilitarem a análise de grandes volumes de dados coletados a partir de sistemas transacionais (OLTP – Online Transaction Processing). O conceito surgiu da necessidade de integrar dados corporativos que estavam em diferentes máquinas e sistemas operacionais para facilitar o acesso às informações por parte de todos os envolvidos no processo decisório.

Antes de serem armazenados, os dados são filtrados, normalizados, reorganizados e sumarizados para formarem uma base confiável para os sistemas posteriores. Além de manter um histórico das informações, o Data Warehouse estabelece padrões, corrige os erros e reestrutura os dados para apresentar um modelo final e organizado para a análise.

A estrutura do Data Warehouse

Normalmente, os Data Warehouses possui três componentes, segundo os casos de sucesso da Kimball Group:

O que é um Data Warehouse?
Imagem: reprodução/ Kimball Group

Data Sources – as fontes das quais os dados serão extraídos, tais como o Excel, Access, SQL Server e outros;

Data Staging Area – área responsável pelo armazenamento e pela extração, transformação e Carga (ETL – extract, transformation, load) dos dados. Essa parte é composta por flat files (arquivos textos) ou tabelas de banco de dados em 3ª Forma Normal (Normalizadas);

Data Presentation Area – Aqui, os dados já estão organizados, armazenados e disponíveis para consultas dos usuários em formatos dimensionais. A modelagem dimensional é um modelo que permite a visualização dos dados de forma intuitiva e com altos índices de performance na extração de dados.

Os prós e contras

Sistemas integrados são, geralmente, mais eficazes e vantajosos para o ambiente corporativo. Entre suas vantagens, os Warehouses produzem relatórios de tendências, de exceção e que revelam os objetivos versus desempenho real, contribuindo para processos decisórios e executam a análise e preparam relatórios apenas depois da solução de inconsistências dos dados.

Logicamente, os Depósitos de Dados não são uma solução adequada para o armazenamento e análise de dados não-estruturados e, apesar de seus custos elevados, há uma certa obsolescência verificada, já que a tecnologia evolui rapidamente.

Os Data Warehouse são utilizados nos ambientes corporativos por gestores de qualquer área e nível, pois possibilitam acesso fácil á informações concretas. No mercado de TIC, por exemplo, os sistemas de armazenamento e análise de dados são indispensáveis, assim como a evolução tecnológica desse conceito.

Com isso em mente, o Futurecom, maior e mais qualificado evento de Tecnologia da América Latina, trará diversas discussões com temas como Big Data e Business Intelligence em sua 16a edição. Em 2014, o evento acontecerá no Transamerica Expo, em São Paulo, entre os dias 13 e 16 de outubro.

Confira mais detalhes do Futurecom aqui.

Fontes: Siginificados, EFagundes, Viviane Ribeiro.