【速看料】如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》
机器之心发布
作者:之江实验室
(资料图片仅供参考)
当前,生成式大模型已经为学术研究甚至是社会生活带来了深刻的变革,以 ChatGPT 为代表,生成式大模型的能力已经显示了迈向通用人工智能的可能性。但同时,研究者们也开始意识到 ChatGPT 等生成式大模型面临着数据和模型方面的安全隐患。
今年 5 月初,美国白宫与谷歌、微软、OpenAI、Anthropic 等 AI 公司的 CEO 们召开集体会议,针对 AI 生成技术的爆发,讨论技术背后隐藏的风险、如何负责任地开发人工智能系统,以及制定有效的监管措施。国内的生成式大模型技术也正在发展之中,但是同时也需要先对安全问题进行相应的分析以便双管齐下,避免生成式大模型这把双刃剑带来的隐藏危害。
为此,之江实验室基础理论研究院人工智能与安全团队首次全面总结了 ChatGPT 为代表的生成式大模型的安全与隐私问题白皮书,希望能够为从事安全问题研究的技术人员指明方向,同时也为 AI 相关政策的制定者提供依据。
白皮书链接: https://github.com/xiaogang00/white-paper-for-large-model-security-and-privacy生成式大模型的发展与重要应用
这份白皮书首先总结了 ChatGPT 与 GPT4 等生成式大模型的发展历程,以及其带来的各种令人惊叹的能力和社会变革、社会应用等。作者列举了 ChatGPT 和 GPT4 出现之前的 GPT-1、GPT-2、GPT-3、Google Bert 等模型的特点以及缺点,这些缺点与 ChatGPT 和 GPT4 的强大能力形成了对比;并且,ChatGPT 和 GPT4 之后又涌现了一大批的模型,包括 LLaMa、Alpaca、文心一言、通义千问等,它们的出现使得在人机交互、资源管理、科学研究、内容创作等应用领域出现了新的、强有力的工具。但同时也出现了包括数据安全,使用规范、可信伦理、知识产权以及模型安全方面的问题。
数据安全问题
白皮书提出,数据的安全和隐私是 ChatGPT 及 GPT4 等生成式大模型使用和研发过程中一个极为重要的问题,并从「显式」和「隐式」两个方面对其进行了分析。
在显式的信息泄漏中,首先,ChatGPT 等生成式大模型的训练数据在不经意间被转换成了生成内容,其中就包括了敏感和隐私的个人信息如银行卡账号、病例信息等。此外,ChatGPT 的数据安全和隐私隐患还体现在它对于对话框内容的存储,当用户在和 ChatGPT 互动时,他们的信息会以某些形式被记录和存储下来。
白皮书还提出了之前被大家忽略的隐式信息泄漏问题。首先,ChatGPT 体现出的数据安全和隐私的隐患是它可能通过对对话框数据的收集进行广告推荐,以及收集对话框数据进行推荐或者其他的下游机器学习任务,且 ChatGPT 有时候可能也会生成虚假的信息,以此来诱导用户泄漏一系列的数据。
使用规范问题
在白皮书中,作者提到 ChatGPT 和 GPT4 等生成式大模型强大的理解和生成能力虽然为我们的生活和生产带来了很多的便利,但是同时也存在更多的机会被恶意使用。在没有规范约束的情况下,恶意使用将带来很多的社会性问题。
其一,ChatGPT 和 GPT-4 等模型的强大能力使得某些别有用心的人想要将其作为违法活动的工具。例如用户可以利用 ChatGPT 来编写诈骗短信和钓鱼邮件,甚至开发代码,按需生成恶意软件和勒索软件等,而无需任何编码知识和犯罪经验。
其二,ChatGPT 和 GPT4 等生成式大模型没有把不同地区的法律规范考虑在内,在使用和输出的过程中可能会违反当地法律法规,因此需要一个强而有力的当地监管系统来检测其使用是否与当地法律法规相冲突。
其三,对于一些游离于安全和危险之间的灰色地带,ChatGPT 等生成式大模型的安全能力还没有得到增强。例如 ChatGPT 可能会输出一些诱导性的语句,包括跟抑郁症患者沟通时候可能会输出某些语句导致其产生轻生的心态。
可信伦理问题
ChatGPT 等生成式大模型以问答形态存在于社会层面,但其回复往往存在不可信,或者无法判断其正确的问题,会有似是而非的错误答案,甚至对现有社会伦理产生冲击。
白皮书指出,首先 ChatGPT 等生成式大模型的回复可能是在一本正经地胡说八道,语句通畅貌似合理,但其实完全大相径庭,目前模型还不能提供合理的证据进行可信性的验证。例如,ChatGPT 可能会对一些历史、科学、文化等方面的问题回答错误或者与事实相悖,甚至可能会造成误导或者误解,需要用户有自己的鉴别能力。
ChatGPT 等生成式大模型的伦理问题也在白皮书中被详细讨论。即使 OpenAI 等研发机构已经使用 ChatGPT 本身生成了他们的道德准则,但其中的道德准则是否符合我国国情的基本价值观原则,尚未有定论。作者提出其中存在传播有害意识形态、传播偏见和仇恨、影响政治正确、破坏教育公平、影响国际社会公平、加剧机器取代人类的进程、形成信息茧房阻碍正确价值观形成等问题。
知识产权问题
ChatGPT 等生成式大模型凭借强大的语言处理能力和低廉使用成本给社会方方面面带来便利的同时,也存在侵权的问题,对现存版权法体系带来冲击。例如 ChatGPT 生成的作品可能存在著作权争议:ChatGPT 虽然有着出色的语言处理能力,但是即使生成的作品符合知识产权的全部形式要求,ChatGPT 也无法成为著作权的主体,这是因为著作权主体享有权利的同时也要承担对应的社会责任,而 ChatGPT 只能作为用户强大的辅助生产力工具,它无法自主创作,更不要谈享有权利、履行义务的主体要求。
而且 ChatGPT 等生成式大模型仍无法独立创作,更没有自主思维和独立思考的能力,因而,ChatGPT 根据用户的输入生成的内容不符合作品「独创性」的要求。ChatGPT 用于模型训练的数据来自于互联网,不论多么高级的模型训练算法必然涉及到对现有智力成果的引用、分析、处理等,必然存在对他人合法知识产权的侵犯问题。
模型安全问题
从攻防技术角度来看,ChatGPT 等生成式大模型也存在着模型安全的问题。ChatGPT 本质上是基于深度学习的一个大型生成模型,也面临着人工智能安全方面的诸多威胁,包括模型窃取以及各种攻击引起输出的错误(例如包括对抗攻击、后门攻击、prompt 攻击、数据投毒等)。
例如,模型窃取指的是攻击者依靠有限次数的模型询问,从而得到一个和目标模型的功能和效果一致的本地模型。而 ChatGPT 已经开放了 API 的使用,这更为模型窃取提供了询问入口。又比如,ChatGPT 和 GPT4 作为一个分布式计算的系统,需要处理来自各方的输入数据,并且经过权威机构验证,这些数据将会被持续用于训练。那么 ChatGPT 和 GPT4 也面临着更大的数据投毒风险。攻击者可以在与 ChatGPT 和 GPT4 交互的时候,强行给 ChatGPT 和 GPT4 灌输错误的数据,或者是通过用户反馈的形式去给 ChatGPT 和 GPT4 进行错误的反馈,从而降低 ChatGPT 和 GPT4 的能力,或者给其加入特殊的后门攻击。
安全与隐私建议
最后,白皮书中对于安全和隐私等问题都进行了相应的建议,可作为之后技术研究者们的方向和政策制定者们的参考依据。
在保护隐私建议方面,白皮书提出要在增强原始数据中高敏感隐私信息的辨别和传播限制;在数据收集过程中利用差分隐私等技术进行隐私保护;对于训练数据的存储进行数据加密形式的安全保护;在模型训练过程中使用安全多方计算,同态加密以及联邦学习等技术进行数据隐私和安全保护;建立数据隐私评估和模型保护与安全认证体系,并且保护下游应用的隐私。
在模型安全问题的建议上,白皮书提出对安全与隐私信息的检测模型的训练;让不同的模型适用于不同国家的法律条款;以及针对各种对抗攻击进行防御性训练。
在模型合规问题上,白皮书提出进行可信输出的度量,信任值评价,增加模型输出的版权信息的查询功能。
总结来说,AI 生成式大模型的发展离不开安全,因此其安全问题将作为下一个技术点,值得众多研究者去攻克。而安全也是社会稳定的保障,有关部门需要尽快进行政策的制定。
THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
标签:
下一篇:最后一页
- 【速看料】如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》
- 龙舟赛催生旅游热 多彩活动喜迎八方客
- 300772股票_翔港科技股票行情
- 山西长治获中央专项补助资金3亿元|每日精选
- 世界微头条丨珠宝闲置商店好玩吗 珠宝闲置商店玩法简介
- 【世界快播报】中国外汇投资研究院:本轮日元贬值侧重内因
- 赴考满分!送考满分!高考首日,好的故事开头
- 汉语体貌美丑常用词研究_关于汉语体貌美丑常用词研究简述
- 全球快报:外交部:中美保持着必要沟通,美方应当切实尊重中方核心利益和重大关切
- 静海区气象台发布雷雨大风蓝色预警/IV级/一般【2023-06-07】
- 比亚迪新品牌为“方程豹” 对标BBA 新车豪华又硬派
- 暴雪战网国际服app官方下载方法 战网国际服下载加速
- 苏州与北京银行签署战略合作协议 北京银行苏州分行揭牌
- 错误信念任务_儿童理解错误信念的能力在几岁之后开始发展
- 天天观热点:上海物贸3涨停
- 可乐鸡翅的汁子怎么调? 环球热文
- 年轻人涌向寺庙后,代开光、代购成生意
- 英国服装设计专业留学申请攻略详解
- 小文案-世界热讯
- 外交部:日本政府一再为福岛核污染水洗白,事实却一再打脸
- “绵阳”三台县委统战部召开信息宣传暨实践理论创新工作专题会
- 当前焦点!产品包装袋尺寸怎么算_产品包装袋
- 【当前独家】热浪袭击!孟加拉国大面积停电,所有小学停课至8日
- 环球百事通!金融知识万里行|马上消费依托自主科研基因,维护金融消费公平
- 养老院敬老院介绍_敬老院与养老院的区别 焦点热闻
- 说到心坎里的文字 天天新资讯
- 阿优之兔智来了(阿优之兔智来)_每日速讯
- 世界球精选!【收评】菜粕日内下跌1.29% 近5日累计涨幅1.71%
- 独家资金:今日主力买进前10股-焦点热讯
- 视焦点讯!与时俱进的全面升级 试驾全新林肯航海家和冒险家
- 世界报道:小脑袋纳莱迪人举行了最早的葬礼吗
- 全球实时:吉镜头|首场考试结束 考生们面带微笑走出考场
- 直击湖南高考现场:毕业多年!看到班主任,兵哥哥也会紧张|环球新要闻
- 当前快报:鸿博股份(002229.SZ):算力出租业务的目标客户主要是对高质量人工智能算力有大量需求的人工智能产业公司
- 宏观金融日报:A股再度回调,利率债收益率普遍下行 天天短讯
- 暗黑4通用装备无星之空戒指有什么特点
- 民国八年袁大头银元价格(2023年06月07日)
- 海关总署:前5个月我国出口机电产品5.57万亿元 同比增长9.5%
- 深圳城中村统租:有租客拿到补助火速搬离,有房东不愿给补贴
- 观察:伊朗驻沙特大使馆重新开馆
- 我市发布“护苗”倡议书
- 每日时讯!打麦场上的乐趣
- 华宝新能:6月6日融券净卖出300股,连续3日累计净卖出1500股|世界微资讯
- 今日播报!首艘国产大型邮轮出坞,打造船舶工业高质量发展“新样本”
- 隆扬电子:6月6日融资买入252.47万元,融资融券余额4616.89万元
- 【全球热闻】我的会说话的汤姆猫最新版 我的会说话的汤姆
- 网络用语277是什么意思_网络用语271是什么意思|焦点热文
- 【全球播资讯】老福特lofter官网在线观看_b站老福特是什么梗为什么叫老福特
- 2023高考今日开考,1291万考生奔赴考场!
- 环球最资讯丨慕南枝 吱吱好看吗_慕南枝 吱吱
-
今日快看!法拉第常数怎么算出来的_法拉第常数
1、最新数据为96485 3383物理化学计算中用96500即可。本文分享完毕,希
-
兆科眼科-B(06622):美国FDA接纳用于治疗近视加深的 NVK002的新药申请 当前头条
智通财经APP讯,兆科眼科-B(06622)公布,公司的伙伴VylumaInc (Vyluma)
-
沙特太疯狂:本泽马签约,梅西最快今日官宣,给齐达内5千万薪水|今日热门
原本本泽马有意留在皇马继续效力一年,最终被沙特俱乐部的天价合同打动
-
每日速讯:董婷_关于董婷的简介
音频解说1、董婷,现为天津北方食品有限公司工作人员。本文关于董婷的
-
rt三角形的定义_rt|每日快报
1、RT是一个计费重量,计费重量在拼箱里有立方和吨两种。2、如果是OSLO
-
ALCO HOLDINGS(00328):资本重组已生效
智通财经APP讯,ALCOHOLDINGS(00328)公布,资本重组已于2023年5月10日
-
蚌埠农村商业银行股份有限公司_蚌埠农村商业银行在哪
1、就是南岗四路十字路口正在装修的大楼就是。本文分享完毕,希望对大
-
宫寒是因为什么引起的_宫寒的原因有哪些
1、宫寒的原因有很多。2、可能是由于平时穿着过于单薄,长期穿低腰裤、
-
【新要闻】裤里丝为什么火_裤里丝是啥意思女生说穿了库里斯暗示什么
想必现在有很多小伙伴对于裤里丝是啥意思,女生说穿了库里斯暗示什么方
-
大名城(600094.SH)定增申请获上交所审核通过
智通财经APP讯,大名城(600094)(600094 SH)公告,公司于2023年6月6日收
-
捉急什么意思饭圈是哪里的方言 智商捉急什么意思-全球热消息
想必现在有很多小伙伴对于捉急什么意思饭圈是哪里的方言(智商捉急什么
-
世界看热讯:3200点失守 短线防御为主
经过近几日的横盘震荡分化后,大盘开始加速回调。本周二,沪指低开震荡
-
数据复盘:4.42亿净流入装修建材 龙虎榜抢筹中国出版|焦点速看
今日(6月6日)两市581只个股上涨,4526只个股下跌,成交额9373 35亿,
-
心态,决定了你会过怎样的生活
有人说,人生是一场漫长的修行,我们要用一辈子去修炼自己的心态,因为
-
621家!福建省2023年第五批拟入库科技型中小企业名单公示 环球快播报
现将福建省2023年第五批621家拟入库科技型中小企业予以公示,公示时间
-
貔貅纹身手稿_貔貅纹身
1、其实这些都是信则有,不信则无,貔貅,最好纹过肩貔貅有这么一个说
-
热议:可以进行中英文翻译的网站_哪个中英文翻译网站最好 要人工翻译的
1、中英文的翻译网站有很多,但全人工的不多我给您推荐一个,365翻译。
-
欧洲天然气期货一度跌幅达10% 独家焦点
欧洲天然气期货一度跌幅达10%:欧洲天然气期货一度跌幅达10%,至25 60
-
中评特写:中方军事专家香会释疑解惑频
第二十届香格里拉对话会6月2日至4日在新加坡举行,这也是中方代表团第
-
上海白露吃什么传统食物_上海白露吃的传统食物简述 每日关注
1、上海白鹭吃的传统食物是白鹭米酒。2、上海、苏南、浙江的老南京有酿
-
实时焦点:侯友宜与竹苗首长议长餐叙 侯郭合作话题热
中国国民党2024参选人、新北市长侯友宜6日晚间拜访新竹县议会,受到新
-
验资账户验资期间只收不付_验资账户
相信目前很多小伙伴对于验资账户都比较感兴趣,那么小搜今天在网上也是
-
福州生育报销多少 世界热门
福州生育报销多少简介:福州市为鼓励夫妻早婚、早育,及促进人口健康发
-
美团买药联动药店药企发起“小黄灯健康守护联盟”
为了积极践行“优质医疗资源扩容下沉和区域均衡布局”,同时推动行业数
-
去年净利润近腰斩,又因资管业务收警示函,华福证券引战IPO能否顺利?
本文来源:时代周报作者:詹兴晶6月5日,华福证券有限责任公司(下称“
-
热资讯!中高考临近 北京疾控中心发布健康提示
高考、中考临近,近日,北京市疾控中心提示考生和家长,要注意预防流行
-
福州生育报销多少 今日热闻
福州生育报销多少简介:福州市为鼓励夫妻早婚、早育,及促进人口健康发
-
宋璟之刚直为什么一定要请宋璟_宋璟之刚直翻译
1、译文资料供参考:宋璟(663~737),字广平,河北邢台人。2、宋璟少
-
母乳性黄疸症状影响打预防针_母乳性黄疸症状_天天速递
1 黄疸持续时间较长:母乳性黄疸持续时间比一般生理性黄疸长,一般在出
-
天天报道:天姥山念lao还是mu_天姥山 读音
1、“姥”是一个多音字。2、他有两个读音,分别是[lǎo]和[mǔ]一,读
-
环球热资讯!盛讯达:股东拟减持不超过1%的股份
6月6日,盛讯达发布股份减持公告,股东五矿国际信托有限公司-五矿信托-
-
代账会计教程_代帐会计
1、一、首先应该是去客户公司取票(原始凭证),如果你们单位有外勤会
-
漠河旅游最佳时间_漠河下雪
1、漠河没有四季下雪,也不是终年不化。2、漠河市是中国气温最低的县份
-
全球关注:高考志愿冲稳保相差多少位次比较合适 冲稳保垫分差大概是多少
,一、高考志愿冲稳保垫之间多少位次合适冲稳保垫该如何分配:1、冲:
-
扬州社保断了几个月有什么后果?可以继续补缴吗?
扬州社保断了几个月有什么后果?可以继续补缴吗?随社保网小编来看看。
-
全球今日报丨注意!栖霞建设:南京高科股份有限公司计划减持不超过2000万股
栖霞建设(SH600533,收盘价:3 22元)6月6日晚间发布公告称,截至本公
-
环球通讯!找回童年 | 这三组照片被网友选为“最可爱童年照”
精美纪念品正在路上,请注意查收!
-
联想集团(00992)增设人民币柜台
智通财经讯,联想集团(00992)发布公告,自2023年6月19日起,该公司的股
-
微视频丨从一份监测报告看白洋淀水质变化 天天速递
长城网·冀云客户端记者刘淼5月31日上午,在白洋淀畔,“水质人”张冬
-
焦点报道:键盘图片打印a4纸_键盘图片打印
1、去文具店有卖的,一元钱一张,还有五笔字根。2、很大的很方便。本文
-
【天天新要闻】我国生态环境保护制度得到系统性完善 老百姓幸福感和获得感满满
央视网消息:6月5日是六五环境日,今年的主题是建设人与自然和谐共生的
-
交了首付迟迟不网签_交完首付网签最迟时间|世界热门
交完首付网签最迟时间我国并没有对网签最迟时间有明确规定,通常新房在
-
天天新资讯:英国提出从2025年起为可持续航空燃料授权
中国航空新闻网讯:据航空在线6月5日报道,英国发布了一份拟议规则,要
-
男子多次盗窃亮化灯带 民警当场将其抓获 天天速看料
5月23日,葫芦岛建交市政工程有限公司负责人,将一封感谢信送至市局沿
-
太平吉祥学平险保什么?好不好?-世界热议
太平吉祥学平险是太平人寿承保的一款学平险产品,该产品支持3到25周岁
-
今热点:毕节幼儿师范高等专科学校怎么样 毕节幼儿师范高等专科学校全国排名
毕节幼儿师范高等专科学校排名全国第几位?在贵州排多少名?毕节幼儿师
-
索尼与Fnatic达成全球合作,进一步提升INZONE专业游戏体验
近日,索尼公司(以下简称“索尼”)与Fnatic有限公司(以下简称“Fnatic
-
热门:c盘满了怎么清理垃圾而不误删_怎么死不疼又比较快
1、根据您描述的情况,考虑您可能是因为孤独导致的不适症状的。2、;建议
-
大宗交易:百济神州成交1.49亿元,成交价129.66元(06-06)
2023年6月6日,百济神州发生1笔大宗交易,总成交115万股,成交金额1 49
-
大宗交易:云从科技成交2507.49万元,折价3.99%(06-06) 环球百事通
2023年6月6日,云从科技发生1笔大宗交易,总成交91 31万股,成交金额25
X 关闭
X 关闭