当前位置:静雅生活网 > 数码百科 >

清华 OpenAttack 文本对抗工具包重大更新:支持中文、多进程、兼容 HuggingFace

导读: 清华 OpenAttack 文本对抗工具包重大更新:支持中文、多进程、兼容 HuggingFace机器之心发布清华大学自然语言处理实验室OpenAttack

  网友提问:

   清华 OpenAttack 文本对抗工具包重大更新:支持中文、多进程、兼容 HuggingFace

  优质回答:

  机器之心发布

  清华大学自然语言处理实验室

  OpenAttack 覆盖了所有类型的攻击,具备相对较好的扩展性。

  清华 OpenAttack 文本对抗工具包重大更新:支持中文、多进程、兼容 HuggingFace

  Github 链接:https://github.com/thunlp/OpenAttack

  OpenAttack 论文:https://arxiv.org/abs/2009.09191

  文本对抗逐渐成为 NLP 研究的热点之一,根据文本对抗论文列表 TAADPapers 的统计,仅 2021 年 ACL 就有 12 篇相关论文发表(含 Findings)。借助 OpenAttack 这样的文本对抗工具包,你可以方便快速地进行文本对抗相关的研究和开发,具体包括:

  几行代码复现经典的文本对抗攻击基线模型,大大减少实验时复现基线模型的时间和难度;

  基于其提供的全面的对抗攻击评测指标,对自己的攻击模型进行系统地评测 ;

  评测自己的 NLP 模型面对各种类型攻击时的鲁棒性

  利用其中包含的常用攻击模型要素(如替换词生成、句子复述),迅速设计和开发新的攻击模型

  进行对抗训练以提高模型鲁棒性。

  相比于图像领域有一系列对抗攻击工具包(如 CleverHans、Foolbox、ART),文本领域类似的对抗攻击工具包寥寥无几,除 OpenAttack 之外目前仅有 TextAttack 这一个文本对抗攻击工具包。然而 TextAttack 在对抗攻击类型覆盖度、多语言支持等方面有一定的局限性,相比之下 OpenAttack 则弥补了 TextAttack 的不足,并且有一些独特之处。

  具体而言,最新版 OpenAttack 有如下几个特点:

  攻击类型全覆盖。OpenAttack 是目前唯一支持所有攻击类型的文本对抗攻击工具包,覆盖了所有扰动粒度:字、词、句级别,以及所有的受害模型可见度:gradient-based、score-based、decision-based、blind;

  多语言支持。OpenAttack 目前支持英文和中文两种语言的攻击。基于其模块化的文本预处理和攻击流程,它也可以很容易地实现对其他语言的支持;

  多进程。OpenAttack 基于 Python 原生的多进程库实现了对抗攻击的多进程执行,大大加快攻击速度;

  完全兼容 Hugging Face。最新版的 OpenAttack 完全兼容 Transformers 和 Datasets 库,无需自己训练模型或配置数据集,一行代码即可实现对 Hugging Face 已有模型的攻击;

  高可扩展性。除了很多内置的攻击模型以及训练好的受害模型,你可以很容易地对自己的受害模型进行攻击,也可以利用 OpenAttack 提供的各种模块迅速设计开发新的攻击模型,设计新的攻击评测指标。

  清华 OpenAttack 文本对抗工具包重大更新:支持中文、多进程、兼容 HuggingFace

  图 2 OpenAttack 文档主页

  结语

  OpenAttack 工具包将会长期维护并保持更新,欢迎大家使用 OpenAttack 作为文本对抗攻击领域学术研究和应用开发的工具。在使用过程中有任何问题或是意见和建议都欢迎提出。也欢迎大家加入,共同开发、完善 OpenAttack 工具包。

  

  机器之心 · 机动组

  机动组是机器之心发起的人工智能技术社区,聚焦于学术研究与技术实践主题内容,为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动,欢迎所有 AI 领域技术从业者加入。

  关注机动组服务号,获取每周直播预告。

版权声明:本文部分来自互联网,由小编精心所写,本文地址:http://www.zhubian88.cn/smbk/13857.html,如需转载,请注明出处!

联系我们

在线咨询:点击这里给我发消息

微信号:weixin888

工作日:9:30-18:30,节假日休息