Concept Maps Mining for Text Summarization

Nome: Camila Zacché de Aguiar
Tipo: Dissertação de mestrado acadêmico
Data de publicação: 31/03/2017
Orientador:

Nomeordem decrescente Papel
Davidson Cury Orientador

Banca:

Nomeordem decrescente Papel
Aline Villavicencio Examinador Externo
Credine Silva de Menezes Examinador Externo
Davidson Cury Orientador
Elias Silva de Oliveira Examinador Interno

Resumo: 8
Resumo
Os mapas conceituais são ferramentas gráficas para a
representação e construção do
conhecimento. Conceitos e relações formam a base para o aprendizado e, portanto, os mapas
conceituais têm sido amplamente utilizados em diferentes situações e para diferentes
propósitos na educação, sendo uma delas a represent
ação do texto escrito. Mes
mo um
gramá
tico e complexo texto pode ser representado por um mapa conceitual contendo apenas
conceitos
e relações que represente
m o que foi expresso de uma forma mais complicada.
No entanto, a construção manual de um mapa conceit
ual exige bastante tempo e esforço
na identificação e estruturação do conhecimento, especialmente quando o mapa não deve
representar os conceitos da estrutura cognitiva do autor. Em vez disso, o mapa deve
representar os conceitos expressos em um texto. Ass
im, várias abordagens tecnológicas
foram propostas para facilitar o processo de construção de mapas conceituais a partir de
textos.
Portanto, esta dissertação propõe uma nova abordagem para a construção automática
de mapas conceituais como sumarização de t
extos científicos. A sumarização pretende
produzir um mapa conceitual como uma representação resumida do texto, mantendo suas
diversas e mais importantes características.
A sumarização pode facilitar a compreensão dos textos, uma vez que os alunos estão
te
ntando lidar com a sobrecarga cognitiva causada pela crescente quantidade de informação
textual disponível atualmente. Este
crescimento
também pode ser prejudicial à construção
do conhecimento. Assim, consideramos a hipótese de que a sumarização de um text
o
representado por um mapa conceitual pode atribuir características importantes para assimilar
o conhecimento do texto, bem como diminuir a sua complexidade e o tempo necessário para
processá
-
lo.
Neste contexto, realizamos uma revisão da literatura entre o
s anos de 1994 e 2016 sobre
as abordagens que visam a construção automática de mapas conceituais a partir de textos. A
partir disso, construímos uma categorização para melhor identificar e analisar os recursos e
as características dessas abordagens tecnoló
gicas. Além disso, buscamos identificar as
limitações e reunir as melhores características dos trabalhos relacionados para propor nossa
abordagem.
9
Ademais, apresentamos um processo Concept Map Mining
elaborado seguindo quatro
dimensões
: Descrição da Fonte
de Dados, Definição do Domínio, Identificação de
Elementos e Visualização do Mapa.
Com o intuito de desenvolver uma arquitetura computacional para construir
automaticamente mapas conceituais como sumarização de textos acadêmicos, esta pesquisa
resultou na
ferramenta pública
CMBuilder
, uma ferramenta online para a construção
automática de mapas conceituais a partir de textos, bem como uma api java chamada
ExtroutNLP
, que contém bibliotecas para extração de informações e serviços públicos.
Para alcançar o objetivo proposto, direcionados
esforços
para áreas de processamento
de linguagem natural e recuperação de informação. Ressaltamos que a principal tarefa para
alcançar nosso objetivo é extrair do texto as proposições do tipo (
conceito, rela
ção, conceito
). Sob
essa premissa, a pesquisa introduz um pipeline que compreende: regras gramaticais e busca
em profundidade para a extração de conceitos e relações a partir do texto; mapeamento de
preposição, resolução de anáforas e exploração de entidad
es nomeadas para a rotulação de
conceitos;
ranking
de conceitos baseado na análise de frequência de elementos e na topologia
do mapa; e sumarização de proposição baseada na topologia do grafo. Além disso, a
abordagem também propõe o uso de técnicas de apre
ndizagem supervisionada de
clusterização e classificação associadas ao uso de um tesauro para a definição do domínio do
texto e construção de um vocabulário conceitual de domínios.
Finalmente, uma análise objetiva para validar a exatidão da biblioteca
Extr
outNLP
é
executada e apresenta
0.65
precision
sobre o
corpus
. Além disso,
uma análise subjetiva para
validar a qualidade do mapa conceitual construído pela ferramenta
CMBuilder
é realizada
,
apresentando
0.75/0.45 para
precision
/
recall
de conceitos e 0.57/
0.23
para precision/
recall
de
relações em idioma inglês e
apresenta
ndo
0.68/
0.38
para precision/
recall
de conceitos e
0.41/
0.19
para precision/
recall
de
relações em idioma português.
Ademais
, um experimento
para verificar se o mapa conceitual
sumarizado
pe
lo CMBuilder tem influência para a
compreensão do assunto abordado em um texto é realizado
, atingindo 60% de
acertos
para
mapas extraídos de pequenos textos com questões de múltipla
escolha e 77% de
acertos para
m
apas extraídos de textos extensos com quest
ões discursivas

Acesso ao documento

Transparência Pública
Acesso à informação

© 2013 Universidade Federal do Espírito Santo. Todos os direitos reservados.
Av. Fernando Ferrari, 514 - Goiabeiras, Vitória - ES | CEP 29075-910