价格面议2020-11-12 14:35:57
摘要已成为21世纪解决数据问题的一种非常有帮助的方法。在本篇文章中,我将向你展示如何使用Python中的自然语言处理(NLP)创建个人文本摘要生成器。
前言:个人文本摘要器不难创建——初学者可以轻松做到!
什么是文本摘要
基本上,在保持关键信息的同时,生成准确的摘要,而不失去整体意义,这是一项任务。
摘要有两种一般类型:
• 抽象摘要>>从原文中生成新句子。
• 提取摘要>>识别重要句子,并使用这些句子创建摘要。
应该使用哪种总结方法
我使用提取摘要,因为我可以将此方法应用于许多文档,而不必执行大量(令人畏惧)的机器学习模型训练任务。
此外,提取摘要法比抽象摘要具有更好的总结效果,因为抽象摘要必须从原文中生成新的句子,这是一种比数据驱动的方法提取重要句子更困难的方法。
如何创建自己的文本摘要器
我们将使用单词直方图来对句子的重要性进行排序,然后创建一个总结。这样做的好处是,你不需要训练你的模型来将其用于文档