UM SISTEMA DE DISSEMINAÇÃO SELETIVA DA INFORMAÇÃO BASEADO EM CROSS-DOCUMENT STRUCTURE THEORY.
Nome: WALBER ANTONIO RAMOS BELTRAME
Tipo: Dissertação de mestrado acadêmico
Data de publicação: 30/08/2011
Orientador:
Nome | Papel |
---|---|
DAVIDSON CURY | Orientador |
Banca:
Nome | Papel |
---|---|
ALBERTO NOGUEIRA DE CASTRO JÚNIOR | Examinador Externo |
CREDINE SILVA DE MENEZES | Coorientador |
DAVIDSON CURY | Orientador |
ORIVALDO DE LIRA TAVARES | Examinador Interno |
Resumo: Um Sistema de Disseminação Seletiva da Informação é um tipo de Sistema de Informação que visa canalizar novas produções intelectuais, provenientes de quaisquer fontes, para ambientes onde a probabilidade de interesse seja alta. O desafio computacional inerente é estabelecer um modelo que mapeie as necessidades específicas de informação, para um grande público, de modo personalizado. Para tanto, é necessário mediar à estruturação da unidade informacional, de maneira que contemple a pluralidade de atributos a serem considerados pelo processo de seleção de conteúdo. Em recentes publicações acadêmicas, são propostos sistemas baseados em marcação de dados sobre textos (modelos de meta-dados), de forma que o tratamento da informação manifesta-se entre computação de dados semi-estruturados e mecanismos de inferência sobre meta-modelos. Um dos méritos deste trabalho é evidenciar que tais abordagens limitam a capacidade dos sistemas de disseminação quanto ao perfil de interesse. Para aperfeiçoar tal característica, este trabalho propõe a construção de um sistema de disseminação seletiva da informação baseado em análise de múltiplos discursos por meio da geração automática de grafos conceituais a partir de textos, concernindo à solução também os dados não estruturados (textos), doravante automaticamente estruturados. A proposta é motivada pelo modelo Cross-Document Structure Theory, recentemente difundido na área de Processamento de Língua Natural, voltado para geração automática de resumos. O modelo visa estabelecer correlações de natureza semântica entre discursos, por exemplo, se existem informações idênticas, adicionais ou contraditórias entre múltiplos textos. Desse modo, um dos aspectos discutidos nesta dissertação é que essas correlações podem ser usadas no processo de seleção de conteúdo, o que já fora evidenciado em outros trabalhos correlatos. Adicionalmente, o algoritmo do modelo original é revisado, a fim de torná-lo de fácil aplicabilidade.