基于人工智能的网络空间内容安全治理方法研究

2024-06-07 08:44

本文主要是介绍基于人工智能的网络空间内容安全治理方法研究,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文 | 中国移动通信集团有限公司信息安全管理与运行中心 乔喆、刘阳、江为强;中国信息通信研究院安全研究所 静静、刘明辉

近年来,人工智能技术对社会的发展产生了深刻的影响和推动作用。然而,这为网络空间内容安全治理带来了诸多挑战。以电信网络诈骗为代表的新型诈骗方式已经逐步呈现出跨地域、跨行业、跨网络等明显特点,而且诈骗手法也逐渐变得“智能化”。它们从早期单一诈骗方式发展演变为基于人工智能生成内容(AIGC)技术,并结合获取的个人信息生成精准诈骗脚本。此外,诈骗脚本格式和内容的变化速度也快速迭代变换,这些变化给网络空间的内容安全治理领域带来巨大挑战。不断“智能化”的电信网络诈骗手段对网络空间内容安全融合分析能力、治理时效性等提出了更高的要求。因此,需深度结合新型人工智能技术,持续提升内容安全治理水平。

一、网络空间内容安全治理领域面临着风险与挑战

现阶段,通信运营商网络空间内容安全治理体系主要采用“两级联动”的治理模式。第一级是针对全国普遍存在的不良信息传播问题,采用集中发现、集中治理、集中处置与运营的方式,实现一点违规全国知晓的治理效果。第二级是针对各省、各地区存在的个性化不良信息治理问题,进行源头治理、个性化治理与运营等环节,实现从事前预防、事中控制、事后处置三方面对不良信息传播链条进行综合治理。

随着人工智能技术的迅速发展和普及,网络空间中人工智能技术高效的学习能力、快速迭代能力、复杂的多样性等特点愈发明显。同时,使用 AIGC 技术生成文本、图片、音频、视频等信息的门槛也逐步降低,这促成了网络空间中的不良信息内容愈发复杂、类型变化愈发迅速、趋势变化愈发难以捉摸。

一是传统网络空间内容安全治理效率存在瓶颈。现阶段,不良信息传播脚本迭代速度与类型变化愈发迅速,像垃圾消息、骚扰电话、不良网站、电信网络诈骗等治理条线的不良信息中存在大量类似脚本内容,传统治理模式需要耗费大量时间识别难以辨别真伪的不良信息。例如,基于人工智能换脸技术可以在短时间内生成大量图片信息,且这些图片让用户难以辨识其信息真伪,很可能被用于欺诈、虚假宣传等不良行为,严重危害了用户合法权益。因此,这要求我们在短时间内识别并处置出大量类似的 AIGC 技术生成的违规内容信息。

二是传统网络空间内容安全治理手段存在局限性。现阶段,AIGC 技术被不法分子滥用等情况存在,这导致不良信息监控量呈每年上升趋势,不良信息传播脚本内容愈发复杂。传统单一条线的治理手段已经不能及时识别人工智能生成的不良信息脚本内容。例如,人工智能语音合成技术已经可以生成相对自然、流畅的合成语音信息,通过这种以假乱真的音频信息可能让用户难以辨识对方真实身份,这让用户极易被不法分子实施骚扰或诈骗。因此,这要求我们在内容安全治理环节中优化治理手段,实现及时识别 AIGC 技术生成的违规内容信息等。

为有效应对这些风险与挑战,我们宜针对以垃圾消息、骚扰电话、不良网站、电信网络诈骗为主的治理场景,利用人工智能识别能力,从文本内容、音频指纹信息、图片内容等纬度实现对不良信息内容的快速甄别与处置。一方面,这可以节省人工监测环节的工作量,提升不良信息处置效率。另一方面,这可以有效提升治理环节的识别与监测效率,基于人工智能技术快速构建场景模型,识别新型不良信息样本,做到早发现、早抑制、早处置。

二、人工智能技术引入网络空间内容安全治理领域技术研究

在网络空间内容安全治理领域,结合人工智能技术的优势,可以实现对不良信息数据的快速甄别、快速处置、实时持续优化,从而提升网络空间内容安全治理效率,增强治理效果。

一是利用人工智能技术提升网络不良舆情监测能力。在内容安全治理领域,舆情监测是事前预警与防范的重要手段。传统舆情监测能力仅限于获取互联网信息,对于互联网舆情信息的实时融合关联分析能力较为薄弱。但是结合人工智能自动文本摘要技术,可实现对互联网上文章、评论、帖子等信息进行实时监测和融合分析,从而更好地了解公众对其关注话题的态度和情绪,及时掌握社会不良舆情动态,提升事前预警与防范水平。

二是利用人工智能声纹识别技术增强治理效果。目前,骚扰诈骗团伙具有换卡不换人的鲜明特点,这导致仅以关停号码、关闭语音或短信功能等治理手段,并不能有效遏制不良信息传播。与传统的身份识别方法相比,人工智能声纹识别技术具有更高的准确性和安全性,通过建立违规人物声纹采集、特征提取、识别算法等能力,结合汇聚历史违规人物的语音特征,建立声音指纹黑名单库,可实现从人物语音特征纬度识别诈骗犯罪团伙,从而提升内容安全治理效果。

三是利用人工智能语音识别技术提高治理效率。网络空间不良信息传播途径有逐步从违规文本内容向违规语音内容转移的趋势。基于传统语音转写能力并结合人工智能语音关键词检测技术,可以识别带有特定关键词的语音信息,相比传统语音识别能力,这种方法具有响应速度更快、算力消耗更低、高定制化等特点。此外,还可以通过语音自然度、流畅度、音频质量、语音情感表现力等方面进行综合分析和识别,提高具有特定关键词的语音识别准确率,从而甄别疑似违规语,保护用户权益不受侵害。

四是利用人工智能图片识别技术提升治理水平。传统的基于违规图片相似比等识别技术只能满足对极为相近的违规图片进行机器研判和处置,利用人工智能技术基于对历史违规图片进行深度学习及建模,可以实现更加智能化和高效化的图像识别和分类能力,并有助于对违规图片类型进行趋势分析,发掘疑似违规图片的发展动态,这样就可以实现对违规图片内容的提前发现、提前处置,并可以为潜在被骗客户提供及时预警,保护客户权益不受侵害。

五是利用人工智能外呼机器人技术辅助自动化治理。人工智能外呼机器人是基于机器学习和自然语言处理等技术,实现自动化呼叫、语音识别等功能的智能语音应答系统。在内容安全治理领域,传统的回拨取证方式是通过人工向疑似骚扰诈骗分子进行回拨电话验证其行为特征,这需要耗费大量的时间,极大影响治理效率。在发现疑似诈骗分子时,可利用外呼机器人技术对其行为进行验证,识别对方说话的内容,并根据需要进行自动回答,实现自动智能化验证。同时,可结合人工智能语音合成等技术,并根据业务需要,将提醒的内容转换为语音提示,提高机器人交流效率。

三、结束语

综上所述,滥用 AIGC 技术生成并传播虚假信息等系列行为不仅侵害用户权益,甚至影响国家安全与社会稳定。建议在以下方面采取措施:在行业监管方面,应加强对人工智能生成与传播互联网内容的监管力度,推动研制人工智能技术滥用管理相关规范标准,倡导内容合规传播等行业自律及协同治理机制;在企业落实方面,基于“以人工智能对抗人工智能”的理念,开展基于人工智能的内容安全监测识别与自动化审核技术手段研究与推广应用,精准抑制网络空间内的不良信息传播;在公众意识方面,应积极开展内容安全典型案例普及和教育活动,提高公众对人工智能生成不良信息的辨识能力,发现疑似不良信息要积极举报,协同维护清朗网络空间。

(本文刊登于《中国信息安全》杂志2023年第5期)

这篇关于基于人工智能的网络空间内容安全治理方法研究的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1038696

相关文章

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

Python实现字典转字符串的五种方法

《Python实现字典转字符串的五种方法》本文介绍了在Python中如何将字典数据结构转换为字符串格式的多种方法,首先可以通过内置的str()函数进行简单转换;其次利用ison.dumps()函数能够... 目录1、使用json模块的dumps方法:2、使用str方法:3、使用循环和字符串拼接:4、使用字符

Python版本与package版本兼容性检查方法总结

《Python版本与package版本兼容性检查方法总结》:本文主要介绍Python版本与package版本兼容性检查方法的相关资料,文中提供四种检查方法,分别是pip查询、conda管理、PyP... 目录引言为什么会出现兼容性问题方法一:用 pip 官方命令查询可用版本方法二:conda 管理包环境方法

Linux云服务器手动配置DNS的方法步骤

《Linux云服务器手动配置DNS的方法步骤》在Linux云服务器上手动配置DNS(域名系统)是确保服务器能够正常解析域名的重要步骤,以下是详细的配置方法,包括系统文件的修改和常见问题的解决方案,需要... 目录1. 为什么需要手动配置 DNS?2. 手动配置 DNS 的方法方法 1:修改 /etc/res

JavaScript对象转数组的三种方法实现

《JavaScript对象转数组的三种方法实现》本文介绍了在JavaScript中将对象转换为数组的三种实用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友... 目录方法1:使用Object.keys()和Array.map()方法2:使用Object.entr

SpringBoot中ResponseEntity的使用方法举例详解

《SpringBoot中ResponseEntity的使用方法举例详解》ResponseEntity是Spring的一个用于表示HTTP响应的全功能对象,它可以包含响应的状态码、头信息及响应体内容,下... 目录一、ResponseEntity概述基本特点:二、ResponseEntity的基本用法1. 创

java中判断json key是否存在的几种方法

《java中判断jsonkey是否存在的几种方法》在使用Java处理JSON数据时,如何判断某一个key是否存在?本文就来介绍三种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的... 目http://www.chinasem.cn录第一种方法是使用 jsONObject 的 has 方法

java中ssh2执行多条命令的四种方法

《java中ssh2执行多条命令的四种方法》本文主要介绍了java中ssh2执行多条命令的四种方法,包括分号分隔、管道分隔、EOF块、脚本调用,可确保环境配置生效,提升操作效率,具有一定的参考价值,感... 目录1 使用分号隔开2 使用管道符号隔开3 使用写EOF的方式4 使用脚本的方式大家平时有没有遇到自