Nesta disciplina, estudaremos a integração
de técnicas de:
banco de dados como
Data Warehousing e OLAP,
inteligência
artificial como a aprendizagem de
mãquina,
e de estatística
computacional para descobrir e
extrair automaticamente conhecimento
a
partir de dados armazenados em banco de
dados ou em páginas na Web
para
fornecer apóio inteligente a:
tomada de decisões
em organizações e gerenciamento de
negõcios (ex, database marketing,
reengenharia de negôcios)
e a formulação e
confimação de hipóteses em pesquisa
ciêntifica (ex, genome, medicina,
metalurgia)
Ementa
Parte I: Contexto da
mineração de dados
- O processo de
descoberta de conhecimento em banco de dados
- Tipologia dos dados
de entrada e conhecimento de saída
- Aplicações
práticas da descoberta de conhecimento
- Arquiteturas de
software e linguagens de consultas para descoberta de
conhecimento
- Apresentação dos
assuntos de projeto
Parte II: Preparação
dos dados
- Problematica geral da
preparação de dados
- OLAP: consultas
analíticas em um data warehouse
- Preparação de dados
por construção de um data warehouse
- Ferramentas de
construção e consultas de data warehouse
Parte III: Técnicas de
mineraçaõ de dados
- Caracterização e
comparação analítica de dados
- Indução de regras
de associação
- Indução de árvores
e regras proposicionais de decisão
- Indução de regras
da 1a ordem
- Classificação
Bayesiana e indução de redes Bayesianas
- Regressão, previsão
numérica e mineração de series temporais
- Classificação e
previsão por similaridade entre instâncias
- Clustering
- Mineração de
exceções e comparação dos métodos de mineração
Parte IV: Interpretação
e operacionalização do conhecimento descoberto
- Validação
estatística do conhecimento descoberto
- Progol: uma
ferramenta de mineração de regras da 1a
ordem
- Weka: uma caixa de
ferramenta Java para associação, classificação,
previsão e clustering
- DBMiner: um ambiente
integrado para OLAM
- Interfaces para
interpretação e divulgação do conhecimento descoberto
Parte V: Assuntos
avançados e avaliação
- Minerar bancos de
dados não-convencionais
- Minerar a web
- Apresentação dos
projetos
Bibliografia
- Livros textos:
- Data
Mining: concepts and techniques, de Han,
J. & Kamber, M., 2001, Morgan Kaufmann
- Data
Mining: practical machine learning tools and
techniques with Java implementations, de Witten,
I.H. & Frank, E., 2000, Morgan
Kaufmann
- Livros de
apóio:
- Advances
in knowledge discovery and data mining, de Fayyad
et al., 1996, AAAI Press/MIT Press.
- Machine
Learning, de Mitchell, T.,
1997, McGraw-Hill.
- Artificial
Intelligence, a Modern Approach, de
Russell, S. & Norvig, P., 1995,
Prentice Hall.
- Microsoft
OLAP unleashed, Peterson, & al..,
1999, Sams.
Links
Avaliação
Peso dos elementos de
avaliação:
- Fichas de leitura (a
entregar antes da aula): 20% da nota final
- Seminário: 20% da
nota final
- Prova de conceitos: 20%
da nota final
- Projeto em dupla: 40%
da nota final
Pontuação das
fichas de leituras:
- ficha entregue depois
da aula: -5pts
- ficha com mais de uma
página por capítulo/seções de livro e/ou por artigo:
-2pts
- relevância (i.e.,
completude dada a restrição de espaço): 4pts
- organização e
clareza: 3pts
- corretude: 2pts
- exemplos
ilustrativos: 1pt
Pontuação dos
seminários:
- estar com o material
lido e as dúvidas prontas com 2 semanas de
antecedências: 1pt
- estar com a
apresentação powerpoint pronta com 1 semana de
antecedências: 1pt
- profundidade da
compreênsão do material: 2pts
- corretude da
apresentação: 1pt
- completude da
apresentação: 1pt
- concisão da
apresentação: 1pt
- clareza da
apresentação: 1pt
- quantidade,
relevância e clareza dos exemplos ilustrativos: 1pt
- desempho oral: 1pt
Calendário
das aulas e das leituras
www.cin.ufpe.br/~compint/aulas-IAS/kdd-011