Mineração de Dados - 00.2
Descrição geral desta
(classe de) disciplina, incluindo ementa, avaliação e material
bibliográfico encontram-se em: www.di.ufpe.br/~compint/kdd.html
Informações Gerais
Professores: Franciso
Carvalho e Paulo Adeodato
(Esta) Homepage: www.di.ufpe.br/~compint/aulas-IAS/kdd-002/Welcome.html
Newsgroup: depto.cursos.posgrad.taci3
Horários:
-
aulas: 4a 14:00-16:00 & 6a 12:00-14:00
-
orientação seminários:
2a 12:00-13:00
Local: Sala M1
Turma:
-
Graduação:
-
Pós-graduação:
-
Ana Carla de Oliveira Santos
-
Ivan Romero Teixeira
-
Leonardo Feitosa de França
-
Luiz Alberto Crispiano Garcia
-
Orlando Campos de Pinho Junior
-
Roberto Angelo Fernandes Santos
Calendário:
Aula 1: Apresentação da disciplina (06/09)
-
Paulo e Chico
-
Plano:
-
Objetivo da disciplina
-
Metodologia didática e de avaliação
-
Ementa
-
Material bibliográfica
Aula 2: Descoberta de conhecimento em banco de dados
(08/09)
-
Chico
-
Leotura
-
capítulos 1, 2 e 23 e apendice
A do Fayyad
-
capítulo 1 do Pyle
-
Plano:
-
O que é descobrimento de conhecimento
em banco de dados?
-
A plurisiciplinaridade de KDD
-
O processo interativo, iterativo e exploratório
de KDD
-
Transparências: aula00_introducao_kdd.
ps
Aula 3: Apresentação
inicial dos Temas de Projeto (13/09)
Aula 4: Antes da mineração de dados: preparação
e pre-processamento de dados (15/09)
-
Chico
-
Leitura: capítulos 2, 3
(seção 3.3) e 4 (seções 4.2 e
4.3)
do Pyle, capitulos 2 e 7 do Witten & Franck
-
Plano:
-
Ontologia dos dados
-
O processo de preparação
de dados
-
Caracterização dos dados
-
Análise exploratória de
dados
-
Transparências: aula02_preparation.ps
Aula 5: Depois da mineração de dados:
avaliação, interpretação e apresentação
do conhecimento (20/09)
-
Chico
-
Plano:
-
Avaliação da representatividade
dos dados e dos resultados
-
Feedback loop no processo de KDD
-
Apresentação e disseminação
do resultados da mineração
-
Interpretação dos resultados
-
Incorporação do conhecimento
adquirido no componente de performance
-
Transparências: aula03_interpretation.ps
Aula 6: Panorama das aplicações da descoberta
de conhecimento em banco de dados (22/09)
-
Paulo
-
Plano:
-
Tipologia do conhecimento adquerido por
KDD
-
Domínios de aplicações
de KDD
-
Estudos de casos
-
Transparências:
Aula 7: OLAP (27/09)
-
Jacques
-
Plano:
-
OLTP x OLAP: BD dimensionais, BD temporais,
data warehouses e data marts
-
BD x aplicações: BD ativos,
BD orientado a objetos e BD API
-
BD x base de conhecimento: BD dedutivas
e DOOD
-
BD x web: BD multimídia e criação
de BD a partir de informação semi-estruturada
-
BD x agentes: BD federadas, heterogeneidade
e interoperabilidade
-
Transparências: olap.ps
Aulas 8: Data Warehouse (29/09)
-
Decio
-
Plano:
-
Transparências:
Aulas 09: Tarefas, técnicas e aplicações
de aprendizagem (04/10)
-
Chico
-
Ficha de leitura:
-
Capítulo 1 do Mitchell
-
Capítulos 3 e 4 do Witten &
Frank
-
pp. 525-531 do Russell & Norvig
-
Plano:
-
Dimensões de tarefas e técnicas
de aprendizagem
-
Técnicas e paradigmas de aprendizagem
-
K vizinhos mais próximos
-
Regressão estatística localmente
ponderada
-
Raciocínio baseado em casos
-
Classificador bayesiano ingênuo
-
Perceptrões multi-camada
-
Memórias associativas
-
Algoritmos genéticos
-
Transparências: Aula04_learning.ps
Aulas 10: Decisão Bayesiana (06/10)
-
Paulo
-
Ficha de leitura:
-
Plano:
-
Transparências:
Aulas 11: k-vizinhos mais próximos e janela de
Parzen (11/10)
-
Paulo
-
Ficha de leitura:
-
Plano:
-
Transparências:
Aula 12: Redes bayesianas (13/10)
-
Paulo
-
Ficha de leitura:
-
Seções 15.1-15.5 e 19.6
do Russell & Norvig
-
Capítulo 6 do Mitchell
-
Plano:
-
Teorema de Bayes
-
Hipóteses MAP e ML
-
Princípio de descrição
mínima
-
Raciocínio com redes bayesianas
-
Treinar redes bayesianas
Transparências: BayesNets.ps
Aulas 13: Perceptron Multi-Camadas (MLP) (18/10)
-
Germano
-
Ficha de leitura:
-
Plano:
-
Transparências:
Aulas 14: Fuzzy (20/10)
-
Patricia Ramos
-
Ficha de leitura:
-
Plano:
-
Transparências:
Aulas 15: Algoritmos Genéticos (25/10)
-
Hendrick Macedo
-
Ficha de leitura:
-
Plano:
-
Transparências:
Aulas 16: Kohonen (27/10)
-
Paulo
-
Ficha de leitura:
-
Plano:
-
Transparências:
Aula 17: Classificação não supervisionada
(03/11)
-
Chico
-
Ficha de leitura:
-
Plano:
-
Classificação não
supervisionada
-
Agrupamento numérico
-
Agrupamento conceitual
Aula 18: Introdução a Abordagem Simbolica
em Analise de Dados (08/11)
-
Chico
-
Ficha de leitura:
-
Plano:
Aula 18: Indução
de árvores de decisão e regras proposicionais (10/11)
-
Chico
-
Ficha de leitura:
-
Capítulo 18 do Russell &
Norvig
-
Capítulos 2, 3 e seção
10.1-10.3 do Mitchell
-
Plano:
-
Induzir árvores de decisões
-
Limitações expressivas e
extensões das árvores de decisão
-
Obter regras proposicionais a partir de
árvores de decisão
-
Induzir regras propocisionais iterativamente
por cobertura sequencial de exemplos
-
Induzir formulas gerais da lógica
proposicional por eliminação de candidatos no espaço
de hipótese:
-
Transparências: ID3VS.ps
Aula 19: Aprendizagem de Regras Proposicionais de
Classificação e Associação (17/11)
-
Jacques
-
Ficha de leitura:
-
pp. 274-282 do Mitchell
-
pp. 63-70, 97-111 e 170-188 do Witten &
Frank
-
Plano:
-
Arvores de Decisão versus regras de
Classificação
-
Algoritmo de Cobertura
-
Cirtérios
-
Qualidade de uma regra
-
Regras com exceção
-
Geração de regras de associação
Aula 20: Prova (22/11)
Aula 21: Apresentações
dos assuntos de projetos (24/11)
-
Chico e Paulo
-
Assunto propostos pelos professores:
-
Transparências:
Aula 22: Análise exploratória de dados
com S+ (29/11)
Aula 23: Construir, treinar e executar redes bayesianas
com BNPC (29/11)
Aula 24: Induzir árvores de decisão e
regras proposicionais com Weka (01/11)
-
Ficha de leitura: capítulos 4.3,
4.4, 6.1, 6.2 do Witten & Frank
Aula 25: Minerar a Web com XSB, InterProlog e FLORA
(01/12)
Seminário 6:
Ficha de leitura:
Aula 26: Redes MLP com o Qnet-97(06/12)
Aula 27: Redes neurofuzzy com o NefClass (06/12)
Aula 28: Analise de Dados Simbolicos com o SODAS (13/12)
Aulas 28 a 32: Orientação dos projetos
(15/12, 20/12, 22/12, 03/01, 05/01, 10/01)
Aula 33: Apresentação dos projetos (12/01)
Avaliação das fichas
de leituras:
-
Apenas uma página
por capítulo de livro e/ou por artigo
-
Relevância (i.e., completude
dada a restrição de espaço) 4pts
-
Corretude 2pts
-
Clareza e organização 2pts
-
Exemplos 2pts