2020年4月3日,备受瞩目的NLP顶会 ACL 2020 公布了录用论文情况。本届ACL 共收到 3429 篇投稿,相比于去年增加了500多篇,尽管接收论文数量还没有统计,但相比于去年必然将只多不少。作为国内顶尖的自然语言处理团队之一,哈工大社会计算与信息检索研究中心 (HIT-SCIR) 不负所望,延续8篇 EMNLP 2019 ,8篇 AAAI 2020 之后,在这次 ACL 2020 中再次有 8 篇论文录用,且皆为 long paper。国内顶尖,当之无愧!

为促进学术交流,让更多师生及时了解最新前沿研究,AI科技评论联合 HIT-SCIR,重磅推出「ACL 2020 -哈工大系列论文解读」,其中包括两场直播,一场录播,以及多篇文字解读内容。

陈梦在夺冠之后接受采访时说:“(自己)很好地完成了任务,冲击冠军成功。更开心的是把奖金捐献了,这也是赛前主席给我们布置的夺金任务。”

国乒的很多队员身上都伤痕累累,其背后的汗水和泪水可想而知。专业运动员哪有不苦的呢?但想一直保持高水平的状态,一定得练得比别人更苦。

作者:宋皓宇,王琰,张伟男,刘晓江,刘挺

在双打比赛中,王曼昱/朱雨玲3:1战胜日本组合木原美悠/长崎美柚,摘得女双冠军。马龙/许昕3:1战胜英格兰组合皮切福特/金科霍尔,夺得男双冠军。国乒丢掉的唯一金牌,在混双项目,王楚钦/孙颖莎在决赛中1:3不敌日本组合水谷隼/伊藤美诚,屈居亚军。

今年卡塔尔站总奖金达到40万美金,是目前国际乒联职业巡回赛奖金最高的一站比赛。而尽管因伤退出本次比赛,刘诗雯仍主动表示捐出单打冠军奖金等额的善款。

1月24日,是农历的大年三十。这一天马龙在微博晒出球队的合照,他说这是今年最后一趟训练课,“过去一年的遗憾与辉煌都将成为历史。”照片里,球员们脸上都带着笑容。在这一天,有太多欢声笑语,但这样的笑容显得尤其特别。

日前,国际奥委会宣布允许各国代表团在奥运开幕式上派一男一女两名运动员作旗手。网友此前讨论中,女排队长朱婷和男乒队长马龙呼声很高。

早已习惯胜利的国乒在本次比赛虽然也遭遇了一些挑战,但最终结果比较令人满意。而除了金牌之外,他们还给大家带来了许多珍贵的东西。

祝贺国乒在卡塔尔公开赛摘得四金,感谢你们在冬春之交为国人带来的一切。我们终将挥别乍暖还寒,告别疫情,然后继续期待国乒,能在东京迎来一个美丽而圆满的盛夏。(完)

中国体坛有过不少王者之师,可能够长久保持统治地位的不多。近几年来日本乒乓球队的崛起给了国乒不小的压力,这次卡塔尔公开赛虽然结果不错,但也有许多内容需要总结,做“第一”,从来都不是一件简单小事。

ACL 2020原定于2020年7月5日至10日在美国华盛顿西雅图举行,因新冠肺炎疫情改为线上会议。为促进学术交流,方便国内师生提早了解自然语言处理(NLP)前沿研究,AI 科技评论将推出「ACL 实验室系列论文解读」内容,同时欢迎更多实验室参与分享,敬请期待!

即使有过低谷,大多数人对于国乒就是莫名其妙地放心。这种“放心”既源于厚重、辉煌的历史,也源于这支队伍一直以来的稳定发挥。不同于国足、男篮那般,让人把心悬到最后一刻,然后为比赛的胜负而大喜大悲,国乒将胜利收入囊中,换来的通常是一句“果然”。听上去,二者对比似乎不够公平,但细细品味,“果然”两个字却是对一支队伍的最高赞美。

自然,他们也有过年轻人的“气盛”。踢挡板的张继科、摔球拍的王楚钦都立刻遭到了惩罚,陈玘的下乡养猪“变形记”更是通过电视播放给了全国人民。一支运动队,在保持高光成绩的同时能做到令行禁止,彰显出他们的原则和精神面貌。

摘要:在本文中,我们研究了少样本槽位提取问题(Few-shot Slot-Tagging)。与其他广泛研究的少样本问题相比,少样本槽位提取面临着“建模标签间依赖关系”的独特挑战。但是,由于不同领域间存在标签集的差异,我们很难将先前学习的标签依赖应用于新的领域。为了解决这个问题,我们在CRF中引入了折叠的依赖关系迁移机制(Collapsed Dependency Transfer),通过建模抽象的标签依赖关系来实现这种迁移。在小样本和元学习的情景下,CRF的发射概率可以用利用度量学习得到:计算为单词与每个标签类别的相似度。为了计算这种相似性,我们在近期的图像小样本分类模型TapNet基础上,利用标签名称语义来表示标签,提出了一种标签增强的任务自适应投影网络(L-TapNet)。实验结果表明,我们的模型在1-shot实验中以14.14 F1的分数明显优于最强现有相关系统。

扫码关注[ AI研习社顶会小助手(AIyanxishe2) ] 微信号,发送关键字“ACL 2020+直播”,即可进群观看直播和获取课程资料。

乒乓球固然被称为“国球”,但其职业化程度和市场规模都远不如一些热门项目。作为小球项目,却被视作一个国家体育领域的“旗帜”,是因为从容国团、庄则栋、张燮林到邓亚萍、刘国梁、张怡宁……一代代国乒人在大众内心留下的感动渐渐转化成全社会的热爱。

本次卡塔尔公开赛开打之前,马龙将队员召集到一起,最终大家一致决定要将卡塔尔赛获得的全部奖金捐献给武汉抗疫前线。

到了这一代球员,大家叫许昕“大蟒”、叫刘诗雯“小枣”、叫樊振东“小胖”、叫马龙“龙队”。在卡塔尔公开赛的颁奖仪式上,刘国梁为樊振东颁奖时捏了捏他的脸,网络上很多人喊着我也要捏。

摘要:在对话过程中保持一致的角色属性信息对人类来说是很容易的,但对机器来说,这仍然是一项有待探索的任务。近几年,基于角色属性的对话生成任务被提出来,旨在通过在对话生成模型中加入显式的角色文本来解决属性一致性问题。虽然现有的基于角色的对话生成模型在生成类似人类的回复上取得了成功,但是它们的单阶段解码框架很难避免生成不一致的角色词。在这项工作中,我们提出了一个三阶段的对话生成框架。该框架使用生成-删除-重写机制从生成的原型回复中删除不一致的词语,然后进一步将其改写为属性信息一致的回复。我们通过人工评价和自动指标进行了评估。在PersonaChat数据集上的实验表明,我们的方法获得了非常好的性能。

在4月16日,将首先推出一场有关「对话系统」的直播。主讲人为著名青年学者车万翔教授高徒覃立波,他的分享主题为「多领域端到端任务型对话系统」。覃立波目前在西湖大学张岳教授的组里访问,因此这项工作也有张岳教授的指导在。

上述三场直播/录播的论文简介如下:

雷锋网版权文章,。详情见转载须知。

摘要:最近,端到端的任务型对话系统的研究已经取得了巨大的成功。但是,大多数神经网络模型都依赖于大量的训练数据,这些数据往往局限于一些特定的领域,例如导航和查询天气等领域。这使得现有模型很难泛化到标注数据以外的新领域下。并且,如何有效利用源领域的标注数据来提升较少标注数据的新领域,或者是没有标注数据的新领域的性能,这样的工作很少。因此,我们首次在端到端任务型对话系统中提出一个shared-private 框架去显式学习领域特有的和领域共享的知识。此外,我们提出了一种新颖的动态融合网络(DF-Net)来动态探索目标领域与每个领域之间的相关性。在两个公开的数据集上的实验结果表明我们的模型不仅达到SOTA性能,并且,在few-shot的场景下,我们模型的性能要比之前的最佳模型平均高13.9% F1 score,这进一步验证了我们模型的可迁移性。

作者:侯宇泰,车万翔,赖勇魁,周之涵,刘一佳,刘晗,刘挺

紧随其后,也将在4月17日,推出车万翔教授另一名高徒侯宇泰的直播,其工作探究了少样本槽位提取问题(Few-shot Slot-Tagging)。此次直播,他将分享针对few-shot序列预测任务带来的建模序列标签依赖等独有挑战,给出全新的方法。

相比于很多其他项目,国乒的队员们有趣、有梗、有实力。他们像我们普通人一样,有着喜怒哀乐,有着高峰低谷,他们也像普通年轻人一样插科打诨。

除此之外,我们也将通过录播形式展示刘挺教授和张伟男副教授共同指导的博士生宋皓宇的研究工作,主题为「生成、删除和重写:提高对话生成中人物角色一致性的三阶段框架」,听着就很带感。简单来说便是,提出一个全新的三阶段对话生成框架,解决对话过程中角色一致性问题。

在疫情笼罩之下,这支队伍用自己赛场内外的表现传递了振奋人心的内容。这个冬末春初发生的一切,或许会永远印在一些人的记忆里。但假如你看到了国乒,那么这份记忆一定不会全部是灰色的。