世界热消息:如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》
机器之心发布
作者:之江实验室
当前,生成式大模型已经为学术研究甚至是社会生活带来了深刻的变革,以 ChatGPT 为代表,生成式大模型的能力已经显示了迈向通用人工智能的可能性。但同时,研究者们也开始意识到 ChatGPT 等生成式大模型面临着数据和模型方面的安全隐患。
(资料图片)
今年 5 月初,美国白宫与谷歌、微软、OpenAI、Anthropic 等 AI 公司的 CEO 们召开集体会议,针对 AI 生成技术的爆发,讨论技术背后隐藏的风险、如何负责任地开发人工智能系统,以及制定有效的监管措施。国内的生成式大模型技术也正在发展之中,但是同时也需要先对安全问题进行相应的分析以便双管齐下,避免生成式大模型这把双刃剑带来的隐藏危害。
为此,之江实验室基础理论研究院人工智能与安全团队首次全面总结了 ChatGPT 为代表的生成式大模型的安全与隐私问题白皮书,希望能够为从事安全问题研究的技术人员指明方向,同时也为 AI 相关政策的制定者提供依据。
白皮书链接: https://github.com/xiaogang00/white-paper-for-large-model-security-and-privacy生成式大模型的发展与重要应用
这份白皮书首先总结了 ChatGPT 与 GPT4 等生成式大模型的发展历程,以及其带来的各种令人惊叹的能力和社会变革、社会应用等。作者列举了 ChatGPT 和 GPT4 出现之前的 GPT-1、GPT-2、GPT-3、Google Bert 等模型的特点以及缺点,这些缺点与 ChatGPT 和 GPT4 的强大能力形成了对比;并且,ChatGPT 和 GPT4 之后又涌现了一大批的模型,包括 LLaMa、Alpaca、文心一言、通义千问等,它们的出现使得在人机交互、资源管理、科学研究、内容创作等应用领域出现了新的、强有力的工具。但同时也出现了包括数据安全,使用规范、可信伦理、知识产权以及模型安全方面的问题。
数据安全问题
白皮书提出,数据的安全和隐私是 ChatGPT 及 GPT4 等生成式大模型使用和研发过程中一个极为重要的问题,并从「显式」和「隐式」两个方面对其进行了分析。
在显式的信息泄漏中,首先,ChatGPT 等生成式大模型的训练数据在不经意间被转换成了生成内容,其中就包括了敏感和隐私的个人信息如银行卡账号、病例信息等。此外,ChatGPT 的数据安全和隐私隐患还体现在它对于对话框内容的存储,当用户在和 ChatGPT 互动时,他们的信息会以某些形式被记录和存储下来。
白皮书还提出了之前被大家忽略的隐式信息泄漏问题。首先,ChatGPT 体现出的数据安全和隐私的隐患是它可能通过对对话框数据的收集进行广告推荐,以及收集对话框数据进行推荐或者其他的下游机器学习任务,且 ChatGPT 有时候可能也会生成虚假的信息,以此来诱导用户泄漏一系列的数据。
使用规范问题
在白皮书中,作者提到 ChatGPT 和 GPT4 等生成式大模型强大的理解和生成能力虽然为我们的生活和生产带来了很多的便利,但是同时也存在更多的机会被恶意使用。在没有规范约束的情况下,恶意使用将带来很多的社会性问题。
其一,ChatGPT 和 GPT-4 等模型的强大能力使得某些别有用心的人想要将其作为违法活动的工具。例如用户可以利用 ChatGPT 来编写诈骗短信和钓鱼邮件,甚至开发代码,按需生成恶意软件和勒索软件等,而无需任何编码知识和犯罪经验。
其二,ChatGPT 和 GPT4 等生成式大模型没有把不同地区的法律规范考虑在内,在使用和输出的过程中可能会违反当地法律法规,因此需要一个强而有力的当地监管系统来检测其使用是否与当地法律法规相冲突。
其三,对于一些游离于安全和危险之间的灰色地带,ChatGPT 等生成式大模型的安全能力还没有得到增强。例如 ChatGPT 可能会输出一些诱导性的语句,包括跟抑郁症患者沟通时候可能会输出某些语句导致其产生轻生的心态。
可信伦理问题
ChatGPT 等生成式大模型以问答形态存在于社会层面,但其回复往往存在不可信,或者无法判断其正确的问题,会有似是而非的错误答案,甚至对现有社会伦理产生冲击。
白皮书指出,首先 ChatGPT 等生成式大模型的回复可能是在一本正经地胡说八道,语句通畅貌似合理,但其实完全大相径庭,目前模型还不能提供合理的证据进行可信性的验证。例如,ChatGPT 可能会对一些历史、科学、文化等方面的问题回答错误或者与事实相悖,甚至可能会造成误导或者误解,需要用户有自己的鉴别能力。
ChatGPT 等生成式大模型的伦理问题也在白皮书中被详细讨论。即使 OpenAI 等研发机构已经使用 ChatGPT 本身生成了他们的道德准则,但其中的道德准则是否符合我国国情的基本价值观原则,尚未有定论。作者提出其中存在传播有害意识形态、传播偏见和仇恨、影响政治正确、破坏教育公平、影响国际社会公平、加剧机器取代人类的进程、形成信息茧房阻碍正确价值观形成等问题。
知识产权问题
ChatGPT 等生成式大模型凭借强大的语言处理能力和低廉使用成本给社会方方面面带来便利的同时,也存在侵权的问题,对现存版权法体系带来冲击。例如 ChatGPT 生成的作品可能存在著作权争议:ChatGPT 虽然有着出色的语言处理能力,但是即使生成的作品符合知识产权的全部形式要求,ChatGPT 也无法成为著作权的主体,这是因为著作权主体享有权利的同时也要承担对应的社会责任,而 ChatGPT 只能作为用户强大的辅助生产力工具,它无法自主创作,更不要谈享有权利、履行义务的主体要求。
而且 ChatGPT 等生成式大模型仍无法独立创作,更没有自主思维和独立思考的能力,因而,ChatGPT 根据用户的输入生成的内容不符合作品「独创性」的要求。ChatGPT 用于模型训练的数据来自于互联网,不论多么高级的模型训练算法必然涉及到对现有智力成果的引用、分析、处理等,必然存在对他人合法知识产权的侵犯问题。
模型安全问题
从攻防技术角度来看,ChatGPT 等生成式大模型也存在着模型安全的问题。ChatGPT 本质上是基于深度学习的一个大型生成模型,也面临着人工智能安全方面的诸多威胁,包括模型窃取以及各种攻击引起输出的错误(例如包括对抗攻击、后门攻击、prompt 攻击、数据投毒等)。
例如,模型窃取指的是攻击者依靠有限次数的模型询问,从而得到一个和目标模型的功能和效果一致的本地模型。而 ChatGPT 已经开放了 API 的使用,这更为模型窃取提供了询问入口。又比如,ChatGPT 和 GPT4 作为一个分布式计算的系统,需要处理来自各方的输入数据,并且经过权威机构验证,这些数据将会被持续用于训练。那么 ChatGPT 和 GPT4 也面临着更大的数据投毒风险。攻击者可以在与 ChatGPT 和 GPT4 交互的时候,强行给 ChatGPT 和 GPT4 灌输错误的数据,或者是通过用户反馈的形式去给 ChatGPT 和 GPT4 进行错误的反馈,从而降低 ChatGPT 和 GPT4 的能力,或者给其加入特殊的后门攻击。
安全与隐私建议
最后,白皮书中对于安全和隐私等问题都进行了相应的建议,可作为之后技术研究者们的方向和政策制定者们的参考依据。
在保护隐私建议方面,白皮书提出要在增强原始数据中高敏感隐私信息的辨别和传播限制;在数据收集过程中利用差分隐私等技术进行隐私保护;对于训练数据的存储进行数据加密形式的安全保护;在模型训练过程中使用安全多方计算,同态加密以及联邦学习等技术进行数据隐私和安全保护;建立数据隐私评估和模型保护与安全认证体系,并且保护下游应用的隐私。
在模型安全问题的建议上,白皮书提出对安全与隐私信息的检测模型的训练;让不同的模型适用于不同国家的法律条款;以及针对各种对抗攻击进行防御性训练。
在模型合规问题上,白皮书提出进行可信输出的度量,信任值评价,增加模型输出的版权信息的查询功能。
总结来说,AI 生成式大模型的发展离不开安全,因此其安全问题将作为下一个技术点,值得众多研究者去攻克。而安全也是社会稳定的保障,有关部门需要尽快进行政策的制定。
THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
标签:
推荐
- 专访郑州航空工业管理工程学院副院长宋志刚:物流枢纽间的竞争将愈加激烈
- 光储充算一体化发展亟待提速!记者实测“一秒一公里”超级储充
- 瑞德智能董秘回复:公司已拥有逆变器等新能源产品的发明专利和实用新型专利
- 单片机代码不变,hex却变了?
- 存储芯片下行周期有望见底 A股上市公司加速布局
- 当赛季包揽助攻王+FMVP:历史仅詹姆斯和魔术师两人
- 「图解牛熊股」本周最牛股大涨逾110% 华为、芯片板块涨幅“遥遥领先”
- 茶村(关于茶村简述)
- 盘活乡村“沉睡”资源 塘垭山礼野奢帐篷营地“花开”武陵源
- 科幻作家陈楸帆:科技发展遵循曲线规律 以想象力战胜周期
- 中国云市场半年观察:运营商中程发力,下沉市场价格鏖战,打好AI牌成为制胜关键?
- 懂车帝发布年轻用户汽车洞察报告 00后比90后更青睐国产品牌和新能源车
- 消息称出口车型去除车尾英文标语 比亚迪回应:部分车型更改
- 用手机做什么可以挣钱(用手机做什么赚钱)
- 段向东与阿联酋环球铝业首席执行官阿卜杜纳赛尔•卡班举行视频会谈
- 涡轮增压器存在隐患 部分进口奥迪汽车被召回
- 陕西能源:9月7日融资买入723.58万元,融资融券余额3.25亿元
- 都市新闻版责任编辑
- 英派斯(002899):9月8日技术指标出现观望信号-“黑三兵”
- 受超强台风“苏拉”影响,香港数百航班取消
- 莘野(关于莘野简述)
- 我国载人航天工程全线拥有4000多件发明专利 广泛应用于各行各业
- 新鲜出炉!2023年海南自贸区上市龙头企业有哪些?(9月1日)
- 助人,让社会更美好议论文
- 鹿城夜跑欢乐童行 三亚夏日亲子季圆满落幕
- 山高新能源(01250)中标山东省菏泽市某标段风电项目
- 这支视障青年组建的本土乐队即将开启秋天的第一场演唱会
- 爱帝宫(00286.HK)中期股东应占亏损收窄61.54%至2365.6万港元
- undertale com undertale au官网
- 奏响就业曲 打通致富路——来自新疆阿克苏地区的一线调研
- 厦门市:实施首套房贷款“认房不用认贷”政策
- 机构观点:加蓬国内局势突变预计不会影响油市
- 观影《孤注一掷》,宝鸡高新公安警民共赴“反诈之约”
- 骁龙765g与尺寸1000plus的性能对比
- 东亚银行(00023.HK)回购19.92万股 涉资约222.83万港元
- TCL流媒体服务TCLtv+北美上线,Google TV电视用户可免费收看
- 王清宪主持召开省政府第十八次常务会议
- 鲁山县花715万元建牛郎织女雕塑 最新通报:县住建局局长免职
- 三国名马和马主人(三国名马)
- 二季度机构持股新动向!“宁王”取代茅台 成最受青睐个股!
- 2023年8月30日乙二醛水溶液价格最新行情预测
- 你可知道这样会让我心碎什么歌(“你可知道这样会让我心碎”是哪首歌里的歌词)
- 美机构研发出能杀死所有实体癌瘤的药物
- 365天免布线插电 乐橙智能Wi-Fi电池球机K9E正式上市 具体是什么情况?
- 旅马大熊猫谊谊、升谊抵川:状态平稳,将隔离检疫30天
- 里昂:上调海底捞评级至“跑赢大市” 目标价升至24.8港元
- 无关三镇!名记李璇:今天能等个通报!球迷:某球队或被取消冠军
- 德钦县开展全国经济普查单位清查业务培训
- 《正是橙黄橘绿时》第四章 一万种夜莺-4
- 「产业互联网周报」ARM向美国证交会提交IPO申请;钉钉首次公布商业化核心进展;阿里云开源通义千问多模态大模型Qwen-VL
- 国际识局:中美建立“新沟通渠道”,释放哪些重要信号?
- 关于传国玉玺的记载 可能是中国最搞笑的伪史
- 联动科技(301369):8月29日北向资金增持31万股
- 北京宏福苑小区二手房价格(北京宏福苑北区二手房)
- 8月29日盟固利(301487)龙虎榜数据:游资上海溧阳路上榜
- 金融助力文旅复苏,2023全省金融服务与文旅企业恳谈对接会在遂宁举行
- 抖音陈奕迅演唱会主持人 抖音陈奕迅
- 国际看点|毒品吸食者成群 美国肯辛顿大道如上演僵尸电影!
- 东方甄选淘宝首秀“翻车”:烟薯红包标错紧急下架,官方认赔
- 安科瑞:已与东南亚和欧洲市场当地系统代理商合作
- 郏县:心系师生出行难 修路便民暖人心
- 全明星街球派对球员强度排行榜
- 金石亚药:2023年上半年扣非归母净利翻倍增长,核心产品需求大幅增加
- 中国烟草,紧急声明
- 西甲-格列兹曼闪袭莫拉塔梅开二度 马竞6人破门7-0血洗
- 火车站旅客醉酒担心财物遗失,找到民警“求保管”
- 三大基地全面投产运行 富煌钢构上半年净利润增长23%
- 中报观察 | 商汤大模型争流
- 德必集团:上半年营收5.23亿元 同比增长28.84%
- 华友钴业跌6.64% 中泰证券在其高位喊买入
- 河南研学游成主流 郑州开封洛阳迎来强势反弹
- 金杯v19 p0340故障码排除方法
- 农发行湖北省分行 绘就荆楚和美乡村崭新画卷
- 短期重磅利好,中长期仍要回归基本面
- 美银证券:维持华润燃气“买入”评级 目标价降至28.5港元
- 【镜头里的青海】云端之上瞰西宁
- 政策“组合拳” 提振投资者信心
- 每年让利基民142亿,超百家公募献上“诚意”,是何信号?
- 呼和浩特加快实施“智慧乳业”行动
- 近似数的概念初中(近似数的概念)
- 酸菜肉片汤的家常做法(酸菜肉片)
- 争光股份(301092.SZ)半年报净利润5134.44万元,同比增长7.49%
- 起亚EV6上市!硬核科技大秀成都车展!
- 仇保兴:京津冀都市圈应建立空间协调落实机制,不能光画图不落实|快讯
- 什么叫股指期货交易
- 总储架规模5.27亿元,首期发行1亿元!全国首单技术产权(技术交易)ABS上市交易
- 全球大米价格飙升!世界最大大米出口国又出手了
- 火影忍者炎之中忍试验!鸣人VS木叶丸!!(火影忍者炎之中忍试验)
- 普特彼他克莫司软膏治疗什么(普特彼)
- 山水比德董秘回复:作为美丽中国与生态文明的探索者与践行者,公司近年来布局全国20+城市
- 小组赛-比塔泽15+10 格鲁吉亚轻取佛得角取开门红
- 本周生猪价格微降,机构称当前市场需求相对有限
- 菲律宾电子签证系统率先在上海试行
- 业界热议大模型落地金融业:创新应用场景 加快数字化转型
- 离婚案一方不同意离婚怎么办呢?
- 康冠科技08月25日获深股通增持2.31万股
- 中国(河北)—韩国生态环境产业对接交流会举行 河北现场签约总投资约218.24亿元
- 08月25日猪评: 全面暂停进口水产品,猪价或将迎来上涨?
- 西子洁能(002534)周评:本周跌6.85%,主力资金合计净流出2131.67万元
- 女性占西藏高级专业技术人员42.9%
X 关闭
行业规章
X 关闭