Análise de Dados Simbólicos

 

 

Objetivo: Estudar métodos para análise de dados simbólicos buscando primordialmente oferecer ao aluno capacitação para aplicação de métodos quantitativos a seus problemas de pesquisa. Dados simbólicos são mais gerais do que os dados usuais pois eles assumem não só um único valor numérico ou categórico, mas são multivalorados, podendo assumir como valor um conjunto, uma lista, um intervalo, um histograma, etc. Dados simbólicos representam agregações de dados usuais, apresentam variação interna e são bem apropriados para a descrição de classes de objetos. O objetivo da Análise de Dados Simbólicos é estender os métodos estatísticos e de inteligência computacional (previsão, regressão, classificação, agrupamento, etc) dos dados usuais para os dados simbólicos.

 

Introdução a Análise de Dados Simbólicos
Motivação e Objetivos
Dados Simbólicos
Variáveis Simbólicas, Tipos de Variáveis Simbólicas, Dados Simbólicos, Tipos de Dados Simbólicos, Dependências entre Variáveis Simbólicas
Estatística Descritiva para Dados Simbólicos

Extensão Virtual, Distribuições de Freqüência, Histogramas, Média, Variância, Co-Variância, Correlação

SODAS- Symbolic Oficial Data Analysis System

Introdução ao Sodas Software

Similaridade e Dissimilaridade entre Dados Simbólicos
Funções de Similaridade, Dissimilaridade e Matching.
Análise de Componentes Principais de Dados Simbólicos
Método dos Vértices, Método dos Centros.
 Regressão para Dados Simbólicos
 Modelos de Regressão para Dados Simbólicos com variáveis multivaloradas, variáveis de tipo intervalo e variáveis modais.  

Aula 01

Aula02

Classificação para Dados Simbólicos

Funções de Kernel para Dados Simbólicos, Métodos de Classificação baseados em Regiões, Árvores de Decisão para Dados Simbólicos

Análise de Agrupamento para Dados Simbólicos

Metodos Hierarquicos Divisivos e Aglomerativos, Métodos de Partição com Distancias Adaptativas, Métodos de Partição Fuzzy  

Aula01

Aula02

Previsão de Séries Temporais de Dados Simbólicos

Técnicas Descritivas, Métodos de Alisamento Exponencial, Métodos de tipo ARMA.

Avaliação da Disciplina

Seminário

Projeto

Especificação

 

Conceitos: 

Obs: Alunos com mais de 30% de faltas no curso tiveram as suas notas penalizadas.

 

Conceito/ %Faltas

 Luiz Carlos D'Oleron - C/48%

Icamaan Viegas - A/28%

Carlos Wilson Almeida - A/24% 

Marcelo Ferreira - A/36%

Roberta Fagundes - A/20%

David José Ribeiro - A/28%

Petronio Braga - (NAO ENTREGOU RELATORIO IMPRESSO)/32%

Flávia Roberta Barbosa - A/32%

Marcel Caraciolo - A/28%

Virgínia Campos - A/36%

Tiago Vinícius - B/40%

Anderson Tenório - B/44%

Bruno Melo - (NAO ENTREGOU PROJETO)/48% (REPROVADO)

Carlos Gadelha - A/12%

Gabriel Soares - A/16%

Breno de Miranda - B/44%

Elaine de Assis A/20%

Victor Braz - (NAO ENTREGOU RELATORIO IMPRESSO)/36%

Cristiano de Melo - A/36%

 

 

 

Notas Importantes:

- Enviar  o arquivo do seminário para dcfq@cin.ufpe.br.

-Data de entrega de relatório impresso:  até as 17:00 horas do dia 14  no escaninho da professora.
-Enviar todo o material referente ao projeto (apresentação, código de implementação completo e conjunto de dados) até as 18:00 horas do dia 14/12 para o login dcfq (Diego Cesar). Peça um aviso de recebimento.  A falta de algum desses itens acarretará penalidade no conceito.

 

 

Referências Bibliográficas

1 - Applied Multivariate Data Statistical Analysis, Richard Johnson and Dean W. Wichern. Third Edition, Prentice Hall, 1992.

2 -  Analysis of Symbolic Data. H.-H. Bock and E. Diday (Eds.), Springer-Verlag, 2000.

3 – Symbolic Data Analysis. Conceptual Statistics and Data Mining. L. Billard and E. Diday, Wiley, 2006

4 -  Symbolic Data Analysis and the SODAS Software. E. Diday and M. Noirhomme-Fraiture, Wiley 2008