580x138xLOGO-CAPA.png.pagespeed.ic.0TTOfb2dnR580x138xLOGO-CAPA.png.pagespeed.ic.0TTOfb2dnR580x138xLOGO-CAPA.png.pagespeed.ic.0TTOfb2dnR580x138xLOGO-CAPA.png.pagespeed.ic.0TTOfb2dnR
  • Avisos
  • Destaques
    • Notícias e Eventos
    • Premiações
    • Calendário de Defesas
  • Ensino
    • Normas e Regulamentos
    • Formulários
    • Disciplinas
      • Catálogo
      • Oferta por Período
      • Instruções para Inscrição em Disciplinas
    • Áreas de Concentração
      • Estruturas e Materiais
      • Geotecnia
      • Mecânica Computacional
      • Petróleo, Gás e Energias Renováveis
      • Recursos Hídricos e Meio Ambiente
      • Sistemas Computacionais
    • Laboratórios
    • Calendário Acadêmico
  • Editais
    • Bolsas PEC
    • PDSE
    • PIPD
    • Capes-PrInt
    • Oportunidades de Bolsas
  • Links Úteis
  • Quem Somos
    • Equipe
    • Docentes
    • Ex-Docentes
    • Biblioteca
  • Acadêmicos
  • Publicações
    • Dissertações de Mestrado
    • Teses de Doutorado
  • Admissões
    • Mestrado
    • Doutorado
    • Pós-Doutorado
    • Docente
    • Sistema Selection
  • Contato
✕

ANÁLISE DE AGRUPAMENTO EM COLEÇÕES DE DOCUMENTOS: UMA ABORDAGEM BASEADA NA DETECÇÃO ESPECTRAL DE COMUNIDADES EM REDES COMPLEXAS

Documento

  • Cristian Klen dos Santos
    Baixar

Informações da Dissertação

Título

ANÁLISE DE AGRUPAMENTO EM COLEÇÕES DE DOCUMENTOS: UMA ABORDAGEM BASEADA NA DETECÇÃO ESPECTRAL DE COMUNIDADES EM REDES COMPLEXAS

Autor

Cristian Klen dos Santos

Resumo

A análise de agrupamento em coleções de documentos é um dos principais temas de pesquisa em mineração de textos e lida com a tarefa de encontrar grupos de documentos com conteúdos similares. Neste trabalho, estuda-se uma abordagem alternativa para a representação de uma coleção de documentos como uma rede de informações baseada no conteúdo, chamada de rede de documentos, cujos elementos representam os documentos e as arestas as similaridades entre pares de documentos. Através desta nova representação, explora-se a aplicabilidade dos métodos espectrais de agrupamento em coleções de documentos. Especificamente, investiga-se a utilização dos métodos de detecção de comunidade como ferramenta de análise de agrupamento através da maximização espectral da função de modularidade, que quantifica a divisão de uma rede em comunidades. Esses métodos, que possuem a característica de conseguir determinar o número de grupos como subproduto do próprio processo, são avaliados através de experimentos em coleções de documentos de benchmark e de casos reais, e são comparados com métodos tradicionais de agrupamento, usando tanto a representação de rede como a representação clássica do Modelo de Espaço Vetorial, apresentando resultados motivadores.

Abstract

Clustering Analysis in document collections is one of the main research topics in text mining and deals with the task of find out groups of documents with similar content. In this work, we study an alternative approach for rendering a document collection as an information network based on document’s contents, named document network, whose elements represent the documents and the edges the similarities between pairs of documents. By means of that new representation, we explore the applicability of spectral clustering methods in documents collections. Specifically, we inquire the utilization of the community detection methods as a clustering analysis tool by way of spectral maximization of modularity function, which quantifies the network partitioning into communities. These methods, that have the feature of get fix the number of clusters as a byproduct of its own procedure, are evaluated by experiments in benchmark and real life document collections, and they are compared with traditional clustering methods, using as much network representation approach as classical representation approach, by means of Vector Space Model, showing motivating results.

Ano

2009

Orientadores

Alexandre Gonçalves Evsukoff

Anexos

Logo-Simplificada-da-Coppe-Negativa-1-scaled

PEC

  • Quem Somos
    • Equipe
    • Docentes
    • Ex-Docentes
    • Biblioteca
  • Acadêmicos
  • Publicações
    • Dissertações de Mestrado
    • Teses de Doutorado
  • Admissões
    • Mestrado
    • Doutorado
    • Pós-Doutorado
    • Docente
    • Sistema Selection
  • Contato

Acadêmicos

  • Avisos
  • Destaques
    • Notícias e Eventos
    • Premiações
    • Calendário de Defesas
  • Ensino
    • Normas e Regulamentos
    • Formulários
    • Disciplinas
      • Catálogo
      • Oferta por Período
      • Instruções para Inscrição em Disciplinas
    • Áreas de Concentração
      • Estruturas e Materiais
      • Geotecnia
      • Mecânica Computacional
      • Petróleo, Gás e Energias Renováveis
      • Recursos Hídricos e Meio Ambiente
      • Sistemas Computacionais
    • Laboratórios
    • Calendário Acadêmico
  • Editais
    • Bolsas PEC
    • PDSE
    • PIPD
    • Capes-PrInt
    • Oportunidades de Bolsas
  • Links Úteis

Contato

Av. Athos da Silveira Ramos, 149 – Bloco B, Sala B-101 Cidade Universitária, Rio de Janeiro – RJ, 21941-909
(21) 3938-7390
academica@coc.ufrj.br

Todos os direitos reservados PROGRAMA DE ENGENHARIA CIVIL - COPPE/UFRJ © 2026

Desenvolvido por Digimaster Informática

  • Não há traduções disponíveis para esta página.