BIO-SUMM – UMA ESTRATÉGIA DE REDUÇÃO DE COMPLEXIDADE DE INFORMAÇÃO NÃO ESTRUTURADA
Documento
Informações da Tese
Título
BIO-SUMM – UMA ESTRATÉGIA DE REDUÇÃO DE COMPLEXIDADE DE INFORMAÇÃO NÃO ESTRUTURADA
Autor
Bruno Vilela Oliveira
Resumo
A crescente quantidade de textos e de informação multimídia disponíveis online nos últimos anos tem motivado várias pesquisas relacionadas a métodos de sumarização automática. A sumarização automática de textos é o processo no qual um sistema computacional simula a habilidade humana de produzir uma versão resumida de documentos de textos, com pouca ou nenhuma intervenção humana no processo. A versão resumida gerada (sumário) deve preservar o conteúdo mais relevante da fonte textual de acordo com os objetivos da utilização do sumário.
Abstract
The growing amounts of available online text and multimedia information in recent years have motivated the intensive research on automatic summarization methods. Automatic text summarization is the process where computer systems simulate the main features of humans to produce a condensed version of text documents with little or even no human intervention in the process. The abridged information that is generated (i.e., the summary) must also preserve the most relevant content of the text source according to the utilization purposes of the summary.
The use of summaries is as diverse as it is important; they are present in the routines of web users, in online information sources, in applications for mobile devices, as well as in corporate knowledge management systems. The approach proposed in this work consists of the formalization of a new methodology, called the Bio-Summ, which is based on the use of a modified version of the bio inspired Particle Swarm Clustering (PSC) algorithm in combination with other strategies to perform automatic text summarization. The effectiveness of the Bio-Summ is evaluated in a case study involving the summarization of 100 texts written in Brazilian Portuguese. The performance measures of the Bio-Summ are calculated automatically by a widely used summarization evaluation software system and are compared to five other summarization approaches.
Ano
2012
Orientadores
Nelson Francisco Favilla Ebecken
