Mineração de Dados - 01.2


 

Descrição geral desta (classe de) disciplina, incluindo ementa, avaliação e material bibliográfico encontram-se em: www.cin.ufpe.br/~compint/kdd.html

Informações Gerais

Professores: Jacques Robin e Paolo Adeodato
(Esta) Homepage:
www.di.ufpe.br/~compint/aulas-IAS/kdd-012/Welcome.html
Newsgroup:
depto.cursos.grad.if131, depto.cursos.posgrad.taci3

Horários:

·         Aulas: 2a 10:00-12:00 & 5a 08:00-10:00

·         Aulas de reposição: 2a 12:00-14:00

·         Orientação seminários Jacques: 2a 14:00-15h30

·         Orientação projetos Jacques: 2a 15h30-17h

·         Orientação seminários Paulo: ??

·         Orientação projetos Paulo: ??

Local: sala 3

Turma:


Calendário:


Caderneta Escolar


Aula 1: Apresentação da disciplina (17/12)


Aula 2: O processo de descoberta de conhecimento em banco de dados (07/01)


Aula 3: Tipologia dos dados de entrada (10/01)


Aula 4: Tipologia do conhecimento de saída (14/01)


Aula 5: Arquiteturas de software e linguagens de consultas para descoberta de conhecimento (17/01)


Aula 6: Aplicações práticas da descoberta de conhecimento em banco de dados (21/01)


Aula 7: Apresentação dos assuntos de projeto (24/01)


Aula 8: Problematica geral da preparação de dados (28/01)


Aula 9: OLAP: consultas analíticas em um data warehouse (31/01)


Aula 10: Preparação de dados por construção de um data warehouse (04/01)


Aula 11: Construção de data warehouse com Microsoft DTS (Data Transformation Service) (11/03)


Aula 12: Consultas OLAP em data warehouse com Microsoft OLAP Server (11/03)


Aula 13: Orientação de projetos I (18/02)


Aula 14: Caracterização e comparação analítica de dados (21/02 e 21/03)


Aula 15: Indução de regras atributivas de associação (25/02 e 25/03)


Aula 16: Visão geral das técnicas de classificação (28/02 e ??)


Aula 17: Regressão e previsão numérica (14/03)


Aula 18: Mineração de series temporais (18/03)


Aula 19: NeuroMiner: um sistema de mineração de dados híbrido conexionista e simbólico (21/03 e 25/03)


Aula 20: Weka: uma caixa de ferramenta Java para associação, classificação, previsão e clustering (01/04)

Tranparencias: Weka.ppt


Aula 21: Mineração de exceções (01/04)


Aula 22: Validação estatística do conhecimento minerado (04/04)


Aula 23: Medidas de interesse do conhecimento minerado (08/04)

·         Tranparencias: Interestingness.ppt


Aula 24: Comparação e combinação de métodos de mineração (08/04)


 Aula 25: Apresentação de projetos I: preparação de dados (11/04)


Aula 26: Interfaces para interpretação e divulgação do conhecimento descoberto (15/04)


Aula 27: Minerar bancos de dados não-convencionais (15/04)


Aula 28: Minerar a web (18/04)


Aula 29: Apresentação de projeto parte II: resultados da 1a iteração no processo de KDD (22/04)


Aula 30: Prova (25/04)


Aulas 31 e 32: Apresentação de projetos parte III
(06/05)

    1. Introdução: o problema

o      Funcionalidade da ferramenta

o      Utilidade prática e motivação pelo desenvolvimento de tal ferramenta

    1. Projeto e arquitetura de software:

o      Identificação dos componentes do software e motivação por tal decomposição

o      Dados de entrada e saída de cada componente com motivação

o      Fluxo de controle e interação dinámica entre os componentes e sua motivação

o      Dificuldades encontradas durante o projeto e soluções adotadas para superar ou contorna-lás com motivação

    1. Implementação

o      Identificação dos componentes prontos usados com motivação da sua escolha

o      Estruturas de dados usadas por cada o novo componente implementado com motivação

o      Algoritmo usado por cada o novo componente implementado com motivação

o      Linguagens de programação, ferramentas de implementação e plataforma de execução sub-jacente usado para a implementação e implantação de cada componente, com motivção de escolha

o      Dificuldades encontradas durante a implementação e soluções adotadas para superar ou contorna-lás com motivação

    1. Teste e validação

o      Estudo de caso usado para validar a ferramentas

o      Conjunto de entradas e saída de teste usado

o      Dificuldades encontradas durante a validação e soluções adotadas para superar ou contorna-lás com motivação

    1. Limitações da versão atual e desenvolvimentos futuros

o      Identificações da limitações da versão atual da ferramentas

o      Sugestões de modificações e extensões para futuras versões superando essas limitações

    1. Como usar a ferramenta

o      Onde está disponível?

o      Como instalá-la?

o      Onde encontrar o manual do usuário (ou pelo menos o arquivo README)?

o      Onde encontrar arquivos de entrada e saída demo que demonstram o funcionamento da ferramenta?

    1. Introdução: caracterização da tarefa de descoberta de conhecimento

o      Tipos de dados disponíveis em entrada

o      Tipos de conhecimento esperado em sáida

o      Utilidade prática de tal conhecimento: decicões que podem ser tomadas ou alteradas a partir do conhecimento a minerar

    1. Preparação dos dados

o      Descrição funcional, qualitativa, quantitativa e estatística das fontes de dados brutos

o      Seleção dos dados: descrição e motivação das tabelas, campos e registros selecionados para a mineração

o      Limpeza de dados: descrição do estado de limpeza do dados brutos selecionados e do processamento de limpeza efetuado com motivação

o      Transformação de dados: descrição e motivação dos processos de transformação dos dados efetuados, como:

§       agregação ou agrupamento de registros

§       discretização ou categorização de campos

§       derivação de novos campos ou novas tabelas por meio de dedução ou junção

§       construção de hierarquias conceituais de valores de campos

§       reformatação de um modelo de dado para outro

o      Dificuldades encontradas durante a preparação dos dados e soluções adotadas para superar ou contorna-lás com motivação

    1. Mineração dos dados

o      Identificação e motivação das técnicas de mineração usadas

o      Identificação e motivação das ferramentas de mineração usadas

o      Parametrização das tarefas de mineração executadas com motivação dos valores dos parametros

o      Dificuldades encontradas durante a mineração dos dados e soluções adotadas para superar ou contorna-lás com motivação

    1. Validação do conhecimento minerado

o      Identificação e motivação das técnicas de avaliação estatística da confiabilidade e generalidade do conhecimento minerado

o      Interpretação do conhecimento minerado

o      Insights decisionais decorrentes do conhecimento minerado

o      Dificuldades encontradas durante a validação e interpretação dos dados e soluções adotadas para superar ou contorna-lás com motivação

    1. Iterações no processo de descoberta de conhecimento

o      Descrição e motivação das iterações efetuadas no processo de descoberta de conhecimento

    1. Conhecimento descoberto após da conclusão do processo

o      Descrição funcional, qualitativa, quantitativa e estatística do conhecimento minerado


Aula 34: Prova final (09/05)