image
VincentWei

天地间,浩然正气长存,为天地立心,为生民立命,为往圣继绝学,为万世开太平!

Dynamic Seq2Seq在聊天机器人生成式NLG中的应用

首先看下dynamic的概念,即不需要确定的输入长度,以及batch 大小, 都可以动态。但是注意首先每个batch对应所有样本的输入长度还是需要一样的,作为dense数据,否则,不可处理。 dynamic_rnn替代了原来的bucket。 为什么在任务型聊天机器人,加入生成式闲聊端对端聊天机器人的元素呢,因为,当用户输入的message无法识别到具体的高置信度的意图时候,往往这些用户的输入都是无意义的,如果只是吐出不知道您在说什么之类的回复,未免显得不够友好。所以,此时类似这种情况的输入,进入闲聊模式,...

Continue Reading »
分享到:

给“实体抽取”打补丁

在邮箱场景中,光抽取人名是不够的,你要知道对应到具体人名类型的哪个实体,发件人,收件人,还是抄送人,等等 BiLSTM-CRF,就算是BERT-BiLSTM-CRF也不一定能够保证,在语料训练不够充分的情况下,能够精准的识别,这时候,往往要有补救措施,有的时候,最直接直白,简单的方式,在没有很好的办法下,在实践中往往可以尝试采纳,等待新技术有所突破,再替换 现在采用的笨方法,就是根据自然语言依存分析,找到语句结构的dependency,分析主谓宾,以谓语为主要识别点,进行语义识别,应为具体识别,往往是通过...

Continue Reading »
分享到: