Pedro Pardal (2006)

BSc Student

in

BSc report: Data-Mining for the Financial Market
Internship at: Novabase Business Intelligence, Lisboa, Portugal
Period: March 2006 — July 2006
Grade: 18/20

Este documento integra-se no contexto da disciplina de Projecto da Licenciatura em Engenharia Informática (LEI) da Faculdade de Ciências e Tecnologia (FCT) da Universidade Nova de Lisboa (UNL). O trabalho realizado decorreu durante cerca de seis meses, de Setembro a Fevereiro, no semestre ímpar do ano lectivo de 2005/2006.
O projecto final de curso tem como objectivo produzir uma aplicação que permita a utilização de técnicas de Data Mining sobre um Data Warehouse de uma organização. Deste modo é possível, a essa mesma organização, descobrir padrões nos seus dados que de outra forma seria quase impossível colocar a descoberto.
A aplicação apresenta uma interface web, expondo um conjunto de funcionalidades que difere consoante o tipo de utilizador, pelo que é possível acrescentar ou remover utilizadores. Possibilita a definição de estruturas multi- dimensionais para agregação dos dados do Data Warehouse, denominados de cubos, e sobre estes o uso de algumas técnicas de Data Mining. O uso destas técnicas é efectuado através de modelos construídos pelo utilizador. As definições dos cubos e modelos são armazenadas de forma persistente numa base de dados. O utilizador pode também aceder a uma visualização gráfica destes dois tipos de estruturas, efectuar pesquisas por modelos e sobre estes realizar previsões. Isto é, com base nos padrões encontrados por um modelo classificar novos dados.
O desenvolvimento da aplicação referida acima tem como objectivo a aplicação a um caso prático, neste projecto foi escolhida a área de negócio da banca. Por este motivo é também considerado parte do trabalho a construção de uma base de dados multi-dimensional. Esta aloja um conjunto de dados fictícios de uma entidade bancária para desenvolvimento de alguns casos de estudo.