【创新实训】问答系统-Question Generation模块-【博客2:评价指标&模型初探】

本文深入探讨了问答系统中Question Generation(QG)任务的评价指标,包括BLUE、NIST、ROUGE-n、METEOR和ROUGE-L。在模型选择上,分析了seq2seq模式、Transformer及MT5模型,并分享了前期尝试T5和Transformer模型的实践经验,指出中文预训练模型的获取与训练挑战。此外,还推荐了相关基础网课。

前面一篇博客主要探究了QG(Question Generation)任务的基本策略:

一、评价指标

我们可以参考机器翻译任务中的评价指标

1.1 BLUE

  • 1)早期的BLUE公式:
    • y y y为文本, y i y^{i} yi为参考文本
    • C ( g , y i ) C(g, y^{i}) C(g,yi)表示 g g g在参考文本中 y i y^{i} yi出现的次数
    • G n ( y ) G_n(y) Gn(y)表示y的n元组集合
      B L U E − n = p n = ∑ g ∈ G n ( y ) C ( g , y i ) ∑ g ∈ G n ( y ) C ( g , y ) BLUE-n=p_n=\frac{\sum_{g \in G_n(y)}C(g, y^{i})}{\sum_{g \in G_n(y)}C(g, y)} BLUEn=pn=gGn(y)C(g,y)gGn(y)C(g,yi)
  • 2)改进精确率后的公式:
    • BP为长度惩罚因子
    • $BP= \begin{cases}
      B L U E − n = p n = ∑ g ∈ G n ( y ) m i n { C ( g , y ) , m a x 1 ≤ i ≤ m C ( g , y i ) } ∑ g ∈ G n ( y ) C ( g , y ) BLUE-n=p_n=\frac{\sum_{g \in G_n(y)}min\{C(g, y), \underset{1 \le i \le m}{max} C(g, y^{i})\}}{\sum_{g \in G_n(y)}C(g, y)} BLUEn=pn=gGn(y)C(g,y)gGn(y)min{ C(g,y),1im
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值