分块或浅层语法分析将一个句子分割为一系列语法成分或块,即,根据语言特性将相邻单词的序列进行分组。它通常被称为解析自然语言的有效方法,是全解析的一种流行替代方法,但是在这种情况下,分块将是比全解析更合适的技术。
这无非是我个人的偏见,但是如果由于某种原因您只需要检测名词和/或动词短语,那么分块通常可能会更好。例如,对于文档聚类,主题标记或仅识别关键字,NP或VP分块可能绰绰有余。另外,如果您需要使用不存在任何树库的语言,则可能需要退回到分块。
分块通常具有比深度解析快几个数量级的优势,但是现代(感知器/神经)解析器要比五,十年前的深度解析器快得多。但是,即使是迄今为止,深度解析也可能使长句子塞住。而且,显然,对树库进行注释以训练深度解析器要比对NP / VP短语进行注释甚至只是构建基于规则的分块器更为昂贵-尤其是在您需要检测非英语文本中的短语时。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句