1、一种一种错误敏感的敏感的词对齐评价方法价方法黄书剑 奚宁 赵迎功 戴新宇 陈家骏南京大学计算机系自然语言处理实验室2024/5/22 周三1.提纲2024/5/22 周三2.提纲2024/5/22 周三3.PBSMT基本流程?2024/5/22 周三4.如何评价词对齐质量?2024/5/22 周三5.2024/5/22 周三6.提纲2024/5/22 周三7.2024/5/22 周三8.2024/5/22 周三9.提纲2024/5/22 周三10.人工标注的词对齐2024/5/22 周三11.词对齐错误12024/5/22 周三12.词对齐错误2错误的的严重程度与重程度与错误链接的位置有关接的
2、位置有关2024/5/22 周三13.缺失链接缺失缺失链接的影响接的影响远小于小于错误链接接2024/5/22 周三14.冗余链接错误的的严重程度与冗余重程度与冗余链接的位置和数量有关接的位置和数量有关2024/5/22 周三15.提纲2024/5/22 周三16.错误敏感的词对齐评价标准2024/5/22 周三17.ESAER示例2024/5/22 周三18.提纲2024/5/22 周三19.2024/5/22 周三20.数据集合LDC编号句子数量分词训练集LDC2003E14135,074 LDC2005T10153,037 测试集NIST2002491 机器翻译训练集LDC2006E43
3、1,000 测试集LDC2006E381,082 2024/5/22 周三21.AlignmentAERESAER/50BLEUModel1E2F0.47050.211616.53 F2E0.44170.426513.94 Union0.47120.360215.10 GDF0.34450.265517.63 HMME2F0.43040.214418.66 F2E0.39170.396016.71 Union0.39680.335917.40 GDF0.33790.272218.92 Model4E2F0.36870.179320.16 F2E0.35280.351716.08 Union0.
4、36170.295017.64 GDF0.30230.233019.35 2024/5/22 周三22.2024/5/22 周三23.AlignmentAERESAER/50BLEUModel1E2F0.47050.211616.53 F2E0.44170.426513.94 Union0.47120.360215.10 GDF0.34450.265517.63 HMME2F0.43040.214418.66 F2E0.39170.396016.71 Union0.39680.335917.40 GDF0.33790.272218.92 Model4E2F0.36870.179320.16 F2E0.35280.351716.08 Union0.36170.295017.64 GDF0.30230.233019.35 2024/5/22 周三24.提纲2024/5/22 周三25.2024/5/22 周三26.2024/5/22 周三27.