基于人工智能的网络空间内容安全治理方法研究

2024-06-07 08:44

本文主要是介绍基于人工智能的网络空间内容安全治理方法研究,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文 | 中国移动通信集团有限公司信息安全管理与运行中心 乔喆、刘阳、江为强;中国信息通信研究院安全研究所 静静、刘明辉

近年来,人工智能技术对社会的发展产生了深刻的影响和推动作用。然而,这为网络空间内容安全治理带来了诸多挑战。以电信网络诈骗为代表的新型诈骗方式已经逐步呈现出跨地域、跨行业、跨网络等明显特点,而且诈骗手法也逐渐变得“智能化”。它们从早期单一诈骗方式发展演变为基于人工智能生成内容(AIGC)技术,并结合获取的个人信息生成精准诈骗脚本。此外,诈骗脚本格式和内容的变化速度也快速迭代变换,这些变化给网络空间的内容安全治理领域带来巨大挑战。不断“智能化”的电信网络诈骗手段对网络空间内容安全融合分析能力、治理时效性等提出了更高的要求。因此,需深度结合新型人工智能技术,持续提升内容安全治理水平。

一、网络空间内容安全治理领域面临着风险与挑战

现阶段,通信运营商网络空间内容安全治理体系主要采用“两级联动”的治理模式。第一级是针对全国普遍存在的不良信息传播问题,采用集中发现、集中治理、集中处置与运营的方式,实现一点违规全国知晓的治理效果。第二级是针对各省、各地区存在的个性化不良信息治理问题,进行源头治理、个性化治理与运营等环节,实现从事前预防、事中控制、事后处置三方面对不良信息传播链条进行综合治理。

随着人工智能技术的迅速发展和普及,网络空间中人工智能技术高效的学习能力、快速迭代能力、复杂的多样性等特点愈发明显。同时,使用 AIGC 技术生成文本、图片、音频、视频等信息的门槛也逐步降低,这促成了网络空间中的不良信息内容愈发复杂、类型变化愈发迅速、趋势变化愈发难以捉摸。

一是传统网络空间内容安全治理效率存在瓶颈。现阶段,不良信息传播脚本迭代速度与类型变化愈发迅速,像垃圾消息、骚扰电话、不良网站、电信网络诈骗等治理条线的不良信息中存在大量类似脚本内容,传统治理模式需要耗费大量时间识别难以辨别真伪的不良信息。例如,基于人工智能换脸技术可以在短时间内生成大量图片信息,且这些图片让用户难以辨识其信息真伪,很可能被用于欺诈、虚假宣传等不良行为,严重危害了用户合法权益。因此,这要求我们在短时间内识别并处置出大量类似的 AIGC 技术生成的违规内容信息。

二是传统网络空间内容安全治理手段存在局限性。现阶段,AIGC 技术被不法分子滥用等情况存在,这导致不良信息监控量呈每年上升趋势,不良信息传播脚本内容愈发复杂。传统单一条线的治理手段已经不能及时识别人工智能生成的不良信息脚本内容。例如,人工智能语音合成技术已经可以生成相对自然、流畅的合成语音信息,通过这种以假乱真的音频信息可能让用户难以辨识对方真实身份,这让用户极易被不法分子实施骚扰或诈骗。因此,这要求我们在内容安全治理环节中优化治理手段,实现及时识别 AIGC 技术生成的违规内容信息等。

为有效应对这些风险与挑战,我们宜针对以垃圾消息、骚扰电话、不良网站、电信网络诈骗为主的治理场景,利用人工智能识别能力,从文本内容、音频指纹信息、图片内容等纬度实现对不良信息内容的快速甄别与处置。一方面,这可以节省人工监测环节的工作量,提升不良信息处置效率。另一方面,这可以有效提升治理环节的识别与监测效率,基于人工智能技术快速构建场景模型,识别新型不良信息样本,做到早发现、早抑制、早处置。

二、人工智能技术引入网络空间内容安全治理领域技术研究

在网络空间内容安全治理领域,结合人工智能技术的优势,可以实现对不良信息数据的快速甄别、快速处置、实时持续优化,从而提升网络空间内容安全治理效率,增强治理效果。

一是利用人工智能技术提升网络不良舆情监测能力。在内容安全治理领域,舆情监测是事前预警与防范的重要手段。传统舆情监测能力仅限于获取互联网信息,对于互联网舆情信息的实时融合关联分析能力较为薄弱。但是结合人工智能自动文本摘要技术,可实现对互联网上文章、评论、帖子等信息进行实时监测和融合分析,从而更好地了解公众对其关注话题的态度和情绪,及时掌握社会不良舆情动态,提升事前预警与防范水平。

二是利用人工智能声纹识别技术增强治理效果。目前,骚扰诈骗团伙具有换卡不换人的鲜明特点,这导致仅以关停号码、关闭语音或短信功能等治理手段,并不能有效遏制不良信息传播。与传统的身份识别方法相比,人工智能声纹识别技术具有更高的准确性和安全性,通过建立违规人物声纹采集、特征提取、识别算法等能力,结合汇聚历史违规人物的语音特征,建立声音指纹黑名单库,可实现从人物语音特征纬度识别诈骗犯罪团伙,从而提升内容安全治理效果。

三是利用人工智能语音识别技术提高治理效率。网络空间不良信息传播途径有逐步从违规文本内容向违规语音内容转移的趋势。基于传统语音转写能力并结合人工智能语音关键词检测技术,可以识别带有特定关键词的语音信息,相比传统语音识别能力,这种方法具有响应速度更快、算力消耗更低、高定制化等特点。此外,还可以通过语音自然度、流畅度、音频质量、语音情感表现力等方面进行综合分析和识别,提高具有特定关键词的语音识别准确率,从而甄别疑似违规语,保护用户权益不受侵害。

四是利用人工智能图片识别技术提升治理水平。传统的基于违规图片相似比等识别技术只能满足对极为相近的违规图片进行机器研判和处置,利用人工智能技术基于对历史违规图片进行深度学习及建模,可以实现更加智能化和高效化的图像识别和分类能力,并有助于对违规图片类型进行趋势分析,发掘疑似违规图片的发展动态,这样就可以实现对违规图片内容的提前发现、提前处置,并可以为潜在被骗客户提供及时预警,保护客户权益不受侵害。

五是利用人工智能外呼机器人技术辅助自动化治理。人工智能外呼机器人是基于机器学习和自然语言处理等技术,实现自动化呼叫、语音识别等功能的智能语音应答系统。在内容安全治理领域,传统的回拨取证方式是通过人工向疑似骚扰诈骗分子进行回拨电话验证其行为特征,这需要耗费大量的时间,极大影响治理效率。在发现疑似诈骗分子时,可利用外呼机器人技术对其行为进行验证,识别对方说话的内容,并根据需要进行自动回答,实现自动智能化验证。同时,可结合人工智能语音合成等技术,并根据业务需要,将提醒的内容转换为语音提示,提高机器人交流效率。

三、结束语

综上所述,滥用 AIGC 技术生成并传播虚假信息等系列行为不仅侵害用户权益,甚至影响国家安全与社会稳定。建议在以下方面采取措施:在行业监管方面,应加强对人工智能生成与传播互联网内容的监管力度,推动研制人工智能技术滥用管理相关规范标准,倡导内容合规传播等行业自律及协同治理机制;在企业落实方面,基于“以人工智能对抗人工智能”的理念,开展基于人工智能的内容安全监测识别与自动化审核技术手段研究与推广应用,精准抑制网络空间内的不良信息传播;在公众意识方面,应积极开展内容安全典型案例普及和教育活动,提高公众对人工智能生成不良信息的辨识能力,发现疑似不良信息要积极举报,协同维护清朗网络空间。

(本文刊登于《中国信息安全》杂志2023年第5期)

这篇关于基于人工智能的网络空间内容安全治理方法研究的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1038696

相关文章

Python安装Pandas库的两种方法

《Python安装Pandas库的两种方法》本文介绍了三种安装PythonPandas库的方法,通过cmd命令行安装并解决版本冲突,手动下载whl文件安装,更换国内镜像源加速下载,最后建议用pipli... 目录方法一:cmd命令行执行pip install pandas方法二:找到pandas下载库,然后

Linux系统中查询JDK安装目录的几种常用方法

《Linux系统中查询JDK安装目录的几种常用方法》:本文主要介绍Linux系统中查询JDK安装目录的几种常用方法,方法分别是通过update-alternatives、Java命令、环境变量及目... 目录方法 1:通过update-alternatives查询(推荐)方法 2:检查所有已安装的 JDK方

SQL Server安装时候没有中文选项的解决方法

《SQLServer安装时候没有中文选项的解决方法》用户安装SQLServer时界面全英文,无中文选项,通过修改安装设置中的国家或地区为中文中国,重启安装程序后界面恢复中文,解决了问题,对SQLSe... 你是不是在安装SQL Server时候发现安装界面和别人不同,并且无论如何都没有中文选项?这个问题也

Java Thread中join方法使用举例详解

《JavaThread中join方法使用举例详解》JavaThread中join()方法主要是让调用改方法的thread完成run方法里面的东西后,在执行join()方法后面的代码,这篇文章主要介绍... 目录前言1.join()方法的定义和作用2.join()方法的三个重载版本3.join()方法的工作原

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

《在MySQL中实现冷热数据分离的方法及使用场景底层原理解析》MySQL冷热数据分离通过分表/分区策略、数据归档和索引优化,将频繁访问的热数据与冷数据分开存储,提升查询效率并降低存储成本,适用于高并发... 目录实现冷热数据分离1. 分表策略2. 使用分区表3. 数据归档与迁移在mysql中实现冷热数据分

Spring Boot从main方法到内嵌Tomcat的全过程(自动化流程)

《SpringBoot从main方法到内嵌Tomcat的全过程(自动化流程)》SpringBoot启动始于main方法,创建SpringApplication实例,初始化上下文,准备环境,刷新容器并... 目录1. 入口:main方法2. SpringApplication初始化2.1 构造阶段3. 运行阶

linux批量替换文件内容的实现方式

《linux批量替换文件内容的实现方式》本文总结了Linux中批量替换文件内容的几种方法,包括使用sed替换文件夹内所有文件、单个文件内容及逐行字符串,强调使用反引号和绝对路径,并分享个人经验供参考... 目录一、linux批量替换文件内容 二、替换文件内所有匹配的字符串 三、替换每一行中全部str1为st

Olingo分析和实践之ODataImpl详细分析(重要方法详解)

《Olingo分析和实践之ODataImpl详细分析(重要方法详解)》ODataImpl.java是ApacheOlingoOData框架的核心工厂类,负责创建序列化器、反序列化器和处理器等组件,... 目录概述主要职责类结构与继承关系核心功能分析1. 序列化器管理2. 反序列化器管理3. 处理器管理重要方

Python错误AttributeError: 'NoneType' object has no attribute问题的彻底解决方法

《Python错误AttributeError:NoneTypeobjecthasnoattribute问题的彻底解决方法》在Python项目开发和调试过程中,经常会碰到这样一个异常信息... 目录问题背景与概述错误解读:AttributeError: 'NoneType' object has no at

从入门到精通详解LangChain加载HTML内容的全攻略

《从入门到精通详解LangChain加载HTML内容的全攻略》这篇文章主要为大家详细介绍了如何用LangChain优雅地处理HTML内容,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录引言:当大语言模型遇见html一、HTML加载器为什么需要专门的HTML加载器核心加载器对比表二