Construção de um sistema de Business intelligence para análise de logs de comunicação
Abstract
Nos dias de hoje, o bem de maior valor no mercado é a informação. Esse bem tão precioso, cujo valor cresce a cada dia, tem grande influência entre o sucesso e o fracasso em praticamente todos os aspectos de nossa vida. Tomar um remédio ao qual somos alérgicos pode nos levar a morte, a escolha errada da profissão pode nos levar a decepção, uma decisão de um governo tomada em cima de informações falsas ou imprecisas pode levar seu país a guerra, uma decisão estratégica tomada sem a informação adequada pode levar uma empresa a falência. Mesmo com um valor tão alto, muitas vezes a informação é deixada de lado devido à dificuldade em acessá-la causado pelo seu formato e modelo de arquitetura utilizado para armazenar os dados. Esse trabalho trata de transformar os dados contidos em uma arquitetura de difícil análise e armazena-los em uma arquitetura que permita a fácil leitura e interpretação dessas informações. Para isso, escolheu-se uma base de dados de comunicação e transferência de arquivos, cujos dados estão armazenados em arquivos de texto, e baseando-se nos conceitos, técnicas e ferramentas de Business Intelligence, construiu-se uma arquitetura onde os dados foram disponibilizados de forma que mesmo pessoas com pouco conhecimento técnico consigam manipular e combinar esses dados gerando planilhas e gráficos que representam as informações contidas na base original. Para isso, realizou-se uma pesquisa bibliográfica sobre o assunto e um levantamento dos dados contidos nos arquivos de log, criou-se duas bases de dados no PostgreSQL 8.4, cujas modelagens foram feitas no Enterprise Architect 7.0.813, sendo uma relacional e uma multidimensional. Utilizando-se o Kettle Spoon 3.2.0 da suíte Pentanho criou-se dois scripts ETL, sendo o primeiro para carregar os dados dos arquivos de log para a base relacional e o segundo para classificar e sumarizar os dados contidos na base relacional e inseri-los na base multidimensional. Em seguida, alterou-se o exemplo de um sistema web, distribuído com o Mondrian 3.1.2.13008 da suíte Pentanho para que este acesse a base de dados multidimensional, exiba os dados através de um navegador web onde é possível realizar as operações OLAP com os dados exibidos. Para isso, através do Schema Workbench 3.0.3.11016 da suíte Pentanho, desenvolveu-se um esquema XML que contém os cubos OLAP que mapeiam os fatos, dimensões e medidas da base multidimensional. Foi feito o deploy da aplicação no Tomcat 6.0.20 e em seguida, fizeram-se algumas análises através dos relatórios e gráficos gerados pelo Mondrian, a fim de demonstrar o resultado do trabalho realizado e o valor das informações encontradas.
Keyword
Business intelligenceSuite pentanho
Análise de dados