|
Exploração de Dados
From IEETA
Objectivo
O data mining é a designação global para o processo de procura de padrões em grandes volumes de informação. Estes objectivos são alcançados utilizando técnicas de pre-processamento que visam a normalização e muitas vezes a redução de dimensão, seguidas de algoritmos que extraem a informação relevante e, finalmente a apresentação da informação de maneira a poder ser interpretada.
Conteúdo
- Modelos de dados multidimensionais
- Data Warehouses e processamento analítico de dados (OLAP)
- Transformação de dados
- Classificação: árvores de decisão, redes neuronais, SVM , KNN (vizinhos mais próximos)
- Agrupamentos: K-médias, Hierárquicos. SOM (self organizing maps) redes de Kohonen e ART
Competências
- Familiarização com técnicas de modelação de informação
- Desenho e implementação de Data Warehouses
- Entender processos de transformação de dados
- Aplicação de técnicas de classificação e agrupamento
- Aplicação das técnicas a problemas comuns
Metodologia
- Aulas teórico-práticas: 3h/semana
Avaliação
- Componente Teórica: exame (60%)
- Componente Prática: trabalhos e apresentações (40%)
- Nota Mínima: 8 valores (em cada componente).
Bibliografia base
- Jiawei Han, Micheline Kamber. Data Mining Concepts and Techniques. (Livro em empréstimo condicionado).
- Pang Ning Tan, M. Steinback , Vipin Kumar. Introduction to data mining. Addison-Wesley, 2006.
- H. Witten, E. Frank. Data Mining: Pratical Machine Learning Tools and Techniques. Elsevier, 2005.
- Inmon, W., Building the data warehouse, John Wiley & Sons, 2005.
Ferramentas
- 4.6 (Latest 4.x Release)
- SQLServer 2008: SQL Server Management Studio, SQL Server Analysis Services,SQL Server Integration Services (SSIS)
Ano Lectivo de 2009/2010
Conteúdos
|