Mineração de Dados - 00.1
Descrição geral desta (classe
de) disciplina, incluindo ementa, avaliação e material
bibliográfico encontram-se em: www.di.ufpe.br/~compint/kdd.html
Informações Gerais
Professores: Jacques
Robin, Franciso
Carvalho e Paulo
Adeodato
(Esta) Homepage: www.di.ufpe.br/~compint/aulas-IAS/kdd-001/Welcome.html
Newsgroup: depto.cursos.posgrad.taci3
Horários:
- aulas: 2a 10:00-12:00 &
5a 08:00-10:00
- orientação seminários: 2a
12:00-13:00
Local: Sala 3
Turma:
- Graduação:
- Ivan (igcf)
- Luciano (lab)
- Rodrigo (rmsa)
- Simith (stdj)
- Pós-graduação:
- Adrian (ala2)
- Alexandre (algd)
- Frederico (fdf2)
- Ioram (iss)
- Jairo (jco)
- Juliana (jngr)
- Marcelino (mpss)
- Renato (frc)
- Rodrigo (rgls)
Calendário:
Aula 1: Apresentação da disciplina
(24/02)
- Jacques e Chico
- Plano:
- Objetivo da
disciplina
- Metodologia didática
e de avaliação
- Ementa
- Material
bibliográfica
- Roberta
- Ficha de leitura a entregar:
capítulos 1, 2, 3, 11
& 20 (seções 20.5-20.10) do Turban
- Plano:
- Management Support
Systems (MSS)
- Decision Support
Systems (DSS)
- Executive Information
and Support Systems (EIS)
- Técnologias de
desenvolvimento de MSS, DSS e EIS
- Implementação e
integação de MSS
- Transparências: DSS.ppt
Aula 3: Descoberta de conhecimento em
banco de dados (23/03)
- Jacques
- Ficha de leitura a entregar:
-
- Plano:
- O que é
descobrimento de conhecimento em banco de dados?
- A
plurisiciplinaridade de KDD
- O processo
interativo, iterativo e exploratório de KDD
- Transparências: KDD.ppt
Aula 4: Antes da mineração de dados:
preparação e pre-processamento de dados (30/03)
- Chico
- Ficha de leitura a entregar:
capítulos 2, 3 (seção 3.3)
e 4 (seções 4.2 e 4.3)
do Pyle
- Plano:
- Ontologia dos dados
- O processo de
preparação de dados
- Caracterização dos
dados
- Análise
exploratória de dados
- Transparências: Preparation.ppt
Aula 5: Depois da mineração de dados:
avaliação, interpretação e apresentação do conhecimento
(03/04)
- Chico
- Ficha de leitura a entregar:
- capítulo 5
do Mitchell
- capítulo 7
do Turban
- Plano:
- Avaliação da
representatividade dos dados e dos resultados
- Feedback loop no
processo de KDD
- Apresentação e
disseminação do resultados da mineração
- Interpretação dos
resultados
- Incorporação do
conhecimento adquirido no componente de
performance
- Transparências: Interpretation.ppt
Aula 6: Panorama das aplicações da
descoberta de conhecimento em banco de dados (06/04)
- Paulo
- Ficha de leitura a entregar:
-
- Plano:
- Tipologia do
conhecimento adquerido por KDD
- Domínios de
aplicações de KDD
- Estudos de casos
- Transparências:
-
- Jacques
- Ficha de leitura a entregar:
-
- Plano:
- OLTP x OLAP: BD
dimensionais, BD temporais, data warehouses e
data marts
- BD x aplicações: BD
ativos, BD orientado a objetos e BD API
- BD x base de
conhecimento: BD dedutivas e DOOD
- BD x web: BD
multimídia e criação de BD a partir de
informação semi-estruturada
- BD x agentes: BD
federadas, heterogeneidade e interoperabilidade
- Transparências: PosRelDB.ppt
Aulas 8 e 9: Banco de dados com regras: BD
dedutivos e BD ativos (17/04 & 24/04)
- Seminário 1: Fred
- Ficha de leitura a entregar:
-
- Plano:
- Lógica da 1a ordem e
programação em lógica
- Prolog
- Datalog
- Negação e
estratificação
- Semântica e
operadores do ponto fixo
- Aplicações dos BD
ativos
- Dimensões de SGBD
ativos
- Comparação dos SGBD
ativos
- Gatilhos em SQL3
- Problemas abertos em
SGBD ativos
- BD ativos x BD
dedutivos
- Transparências: RuleBasedDB.ppt
Aulas 10 e 11: Banco de dados com objetos:
OO, OR e DOO (27/04 & 04/05)
- Jacques
- Ficha de leitura a entregar:
-
- Plano:
- Motivação e agenda
dos BDOO
- Modelo
Objeto-Relacional
- Modelo Orientado à
Objetos
- Motivação e agenda
dos BDOO dedutivos
- Abordagens para BDOO
dedutivos
- Exemplo de BDOO
dedutivo: FLORA
- Transparências: OODB.ppt
Aula 12: Banco de dados de restrições,
multimídia e sistemas de informação geográficos (08/05)
- Seminário 2:
Jairo
- Ficha de leitura a entregar:
-
- Plano:
- Programação por
restrições
- Programação em
lógica por restrições
- BD de restrições
- BD multimídia
- BD espaciais e
Sistemas de Informação Geográficos
- Restrições para BD
multimídia e especiais
Transparências: ConstraintDB.ppt
Aula 13: Consultar o data warehouse: BD
dimensionais e OLAP (11/05)
- Jacques
- Ficha de leitura a entregar:
-
- Plano:
- OLTP x OLAP
- BD x Data Warehouse x
Data Mart
- Cubos, dimensões,
hierarquias, níveis, membros e celulas
- Drill, roll, slice,
dice, pivot e rank
- DOLAP, ROLAP e HOLAP
- MDX
- Transparências: OLAP.ppt
Aula 14: Criar o data warehouse:
integração de dados e BD temporais (13/05)
- Seminário 3:
Marcelino
- Ficha de leitura a entregar:
-
- Plano:
- Remodelagem de dados
- Carga de dados
- Integração de dados
- Integração de dados
e Data Warehousing
- BD temporais
- BD temporais e Data
Warehousing
- Transparências: DW.ppt
- Chico
- Ficha de leitura:
- Capítulo 18 do
Russell & Norvig
- Capítulos 2, 3 e
seção 10.1-10.3 do Mitchell
- Plano:
- Induzir árvores de
decisões
- Limitações
expressivas e extensões das árvores de decisão
- Obter regras
proposicionais a partir de árvores de decisão
- Induzir regras
propocisionais iterativamente por cobertura
sequencial de exemplos
- Induzir formulas
gerais da lógica proposicional por eliminação
de candidatos no espaço de hipótese:
- Transparências: ID3VS.ppt
Aulas 16 e 17: Tarefas, técnicas e
aplicações de aprendizagem (22/05)
- Jacques
- Ficha de leitura:
- Capítulo 1 do
Mitchell
- pp. 525-531 do
Russell & Norvig
- Plano:
- Agentes Inteligentes,
adaptativos e aprendizes
- Dimensões de tarefas
e técnicas de aprendizagem
- Técnicas e
paradigmas de aprendizagem
- K vizinhos mais
próximos
- Regressão
estatística localmente ponderada
- Raciocínio baseado
em casos
- Classificador
bayesiano ingênuo
- Perceptrões
multi-camada
- Memórias
associativas
- Algoritmos genéticos
- Transparências: Learning.ppt
Aula 18: Classificação não
supervisionada (25/05)
- Chico
- Ficha de leitura:
- Plano:
- Classificação não
supervisionada
- Agrupamento numérico
- Agrupamento
conceitual
- Mapas
auto-organizadoras
Aula 19: Programação em lógica indutiva
(29/05)
- Jacques
- Ficha de leitura:
- pp. 636-644 do
Russell & Norvig
- pp. 283-306 do
Mitchell
- Capítulo 5 do
Fayyad
- Plano:
- Programação em
lógica indutiva x dedutiva
- Características de
ILP
- Induzir regras da 1a
ordem x regras proposicionais
- Algoritmos de ILP:
generalização x especialização
- Operadores de
indução da 1a ordem
- Viés para indução
de regras da 1a ordem
- Aplicações
práticas de ILP
Aula 20: Redes bayesianas (01/06)
- Paulo
- Ficha de leitura:
- Seções 15.1-15.5
e 19.6 do Russell & Norvig
- Capítulo 6 do
Mitchell
- Plano:
- Teorema de Bayes
- Hipóteses MAP e ML
- Princípio de
descrição mínima
- Raciocínio com redes
bayesianas
- Treinar redes
bayesianas
Transparências: BayesNets.ppt
Aula 21:
Apresentações dos assuntos de projetos (05/06)
- Jacques, Chico e Paulo
- Assunto propostos pelos
professores:
- Minerar BD do CNCT
(Cadastro Nacional de Competência em Ciência e
Tecnologia)
- com Redes
Neurais: Adrian & Juliana
(orientação Paulo)
- com Redes
Bayesianas: Renato & Rodrigo Galvão
(orientação Chico)
- Minerar BD do ProDoc
- com Arvores
de Decisão: Ivan & Luciano
(orientação Chico)
- com Redes
Neurais: Rodrigo Arruda & Simith
(orientação Paulo)
- Minerar BD do
ministério da saúde disponível na Web
- Montar data mart para
OLAP de estatísticas de acesso ao site do CIn a
partir de arquivos de log do servidor Web
- Frederico
& Marcelino (orientação Jacques)
- Montar data mart para
OLAP de estatísticas de jogos de futebol de
softbot a partir de arquivos de log do RoboCup
SoccerServer
- Alexandre,
Ioram & Jairo (orientação Jacques)
- Transparências: Projects.ppt
Aula 22: Prova (12/06)
Aula 23: Análise exploratória de dados
com S+ (15/06)
Aula 24: Construir, treinar e executar
redes bayesianas com BNPC (19/06)
- Seminário 5:
Renato e Juliana
- Plano:
Aula 25: Induzir árvores de decisão e
regras proposicionais com Weka (19/06)
- Seminário 7: Ioram ou
Rodrigo
- Ficha de leitura: capítulos
4.3, 4.4, 6.1, 6.2 do Witten & Frank
Aula 26: Minerar a Web com XSB,
InterProlog e FLORA (19/06)
Seminário 6: Rodrigo
ou Ioram
Ficha de leitura:
Aula 27: Data Warehousing e OLAP com o
Microsoft OLAP Server (19/06)
- Ficha de leitura:
- Capítulos 15, 16,
22, 27, 28 do Peterson
Aulas 28 a 32: Orientação dos projetos
(22/06, 26/06, 29/06, 03/07, 06/07)
Aula 33: Apresentação dos projetos
(10/07)
Avaliação das fichas de
leituras:
- Apenas uma
página por capítulo de livro e/ou por artigo
- Relevância (i.e.,
completude dada a restrição de espaço) 4pts
- Corretude 2pts
- Clareza e organização 2pts
- Exemplos 2pts