NLP(自然语言处理)分为2类:自然语言理解(NLU)和自然语言生成(NLG)。
自然语言理解(NLU)包括:文本分类、序列标注、信息抽取等任务。
自然语言生成(NLG)包括:机器翻译、对话问答系统、自动摘要等。
NLG应用场景
自动摘要
形式:给定输入的文本,输出包含输入文本关键判决信息的摘要内容。
要点:
1)模型自动生成的内容完整且精确的覆盖了原文关键信息
2)生成的内容通顺流畅
具体应用产生场景如:文章摘要生成,会议纪要生成,法律/金融(专业领域)的长文档摘要生成。
相似问生成
形式:模型针对输入问句,生成多条意思相近的问句。
一般是对有标注的数据进行语义相似度的训练。所以此解决的是“没有相关标注数据”的新场景。
一般有两种方式:1)零样本学习;2)自然语言生成技术扩充标注数据。
可控条件文本生成
对生成文本的感情控制、风格切换。
1)风格切换
形式:通过控制风格标签,模型可以按照原本的标题句式生成出指定语境的标题。
示例:
用新闻标题作为输入,而其对应的新闻分类作为控制条件。
2)感情控制
形式:感情迁移,目标是让模型转换输入文本的感情极性。
示例:
数学表达式生成
除了文本,还可以生成代码、SQL、数学表达式。
看图说话
形式:输入图片,输出一段描述图片的文本内容。
待补充。
学习参考:
NLG技术:文本生成技术多样化应用的探索之路https://mp.weixin.qq.com/s/tQ1dHjNnTQTfy7TyxA5Skg