Extractive summarization by aggregating multiple similarities

Olof Mogren; Mikael Kågebäck; Devdatt Dubhashi

Extractive summarization by aggregating multiple similarities
Paper i proceeding, 2015

News reports, social media streams, blogs, digitized archives and books are part of a plethora of reading sources that people face every day. This raises the question of how to best generate automatic summaries. Many existing methods for extracting summaries rely on comparing the similarity of two sentences in some way. We present new ways of measuring this similarity, based on sentiment analysis and continuous vector space representations, and show that combining these together with similarity measures from existing methods, helps to create better summaries. The finding is demonstrated with MULTSUM, a novel summarization method that uses ideas from kernel methods to combine sentence similarity measures. Submodular optimization is then used to produce summaries that take several different similarity measures into account. Our method improves over the state-of-the-art on standard benchmark datasets; it is also fast and scale to large document collections, and the results are statistically significant.

Författare

Olof Mogren

Chalmers, Data- och informationsteknik, Datavetenskap

Forskning Andra publikationer

Mikael Kågebäck

Chalmers, Data- och informationsteknik, Datorteknik

Forskning Andra publikationer

Devdatt Dubhashi

Chalmers, Data- och informationsteknik, Datavetenskap

Forskning Andra publikationer

International Conference Recent Advances in Natural Language Processing, RANLP

13138502 (ISSN)

Vol. 2015-January 451-457

Ämneskategorier (SSIF 2011)

Språkteknologi (språkvetenskaplig databehandling)

Mer information

Senast uppdaterat

2024-11-28

Extractive summarization by aggregating multiple similarities Paper i proceeding, 2015

Författare

Olof Mogren

Mikael Kågebäck

Devdatt Dubhashi

International Conference Recent Advances in Natural Language Processing, RANLP

Ämneskategorier (SSIF 2011)

Mer information

Senast uppdaterat

Extractive summarization by aggregating multiple similarities
Paper i proceeding, 2015