清华 OpenAttack 文本对抗工具包重大更新：支持中文、多进程、兼容 HuggingFace-静雅生活网

导读：清华 OpenAttack 文本对抗工具包重大更新：支持中文、多进程、兼容 HuggingFace机器之心发布清华大学自然语言处理实验室OpenAttack

　　网友提问：

　　清华 OpenAttack 文本对抗工具包重大更新：支持中文、多进程、兼容 HuggingFace

　　优质回答：

　　机器之心发布

　　清华大学自然语言处理实验室

　　OpenAttack 覆盖了所有类型的攻击，具备相对较好的扩展性。

　　清华 OpenAttack 文本对抗工具包重大更新：支持中文、多进程、兼容 HuggingFace

　　Github 链接：https://github.com/thunlp/OpenAttack

　　OpenAttack 论文：https://arxiv.org/abs/2009.09191

　　文本对抗逐渐成为 NLP 研究的热点之一，根据文本对抗论文列表 TAADPapers 的统计，仅 2021 年 ACL 就有 12 篇相关论文发表（含 Findings）。借助 OpenAttack 这样的文本对抗工具包，你可以方便快速地进行文本对抗相关的研究和开发，具体包括：

　　几行代码复现经典的文本对抗攻击基线模型，大大减少实验时复现基线模型的时间和难度；

　　基于其提供的全面的对抗攻击评测指标，对自己的攻击模型进行系统地评测 ;

　　评测自己的 NLP 模型面对各种类型攻击时的鲁棒性；

　　利用其中包含的常用攻击模型要素（如替换词生成、句子复述），迅速设计和开发新的攻击模型；

　　进行对抗训练以提高模型鲁棒性。

　　相比于图像领域有一系列对抗攻击工具包（如 CleverHans、Foolbox、ART），文本领域类似的对抗攻击工具包寥寥无几，除 OpenAttack 之外目前仅有 TextAttack 这一个文本对抗攻击工具包。然而 TextAttack 在对抗攻击类型覆盖度、多语言支持等方面有一定的局限性，相比之下 OpenAttack 则弥补了 TextAttack 的不足，并且有一些独特之处。

　　具体而言，最新版 OpenAttack 有如下几个特点：

　　攻击类型全覆盖。OpenAttack 是目前唯一支持所有攻击类型的文本对抗攻击工具包，覆盖了所有扰动粒度：字、词、句级别，以及所有的受害模型可见度：gradient-based、score-based、decision-based、blind；

　　多语言支持。OpenAttack 目前支持英文和中文两种语言的攻击。基于其模块化的文本预处理和攻击流程，它也可以很容易地实现对其他语言的支持；

　　多进程。OpenAttack 基于 Python 原生的多进程库实现了对抗攻击的多进程执行，大大加快攻击速度；

　　完全兼容 Hugging Face。最新版的 OpenAttack 完全兼容 Transformers 和 Datasets 库，无需自己训练模型或配置数据集，一行代码即可实现对 Hugging Face 已有模型的攻击；

　　高可扩展性。除了很多内置的攻击模型以及训练好的受害模型，你可以很容易地对自己的受害模型进行攻击，也可以利用 OpenAttack 提供的各种模块迅速设计开发新的攻击模型，设计新的攻击评测指标。

　　清华 OpenAttack 文本对抗工具包重大更新：支持中文、多进程、兼容 HuggingFace