前言:走近图像大模型
Chat-GPT发布后,众多科技公司纷纷推出自家的大模型。从通用大语言模型(Large Language Models,LLM)飞速进步,到文档、图像、声音等多模态的输入和输出,其中图像大模型为AI的发展和应用带来了新机遇。
图像安全与各行各业紧密相连,前有不法分子用PS等工具篡改图像,后有AI工具批量生产违规内容,给社会带来了不同程度的伤害。对图像进行违禁、涉政、广告等方面的审核,提前拦截风险信息,对各家企业来说都已经迫在眉睫。
在传统审核场景的基础上,百度的跨模态大模型为了覆盖更多长尾审核情景,推出“图像大模型审核”新功能,只需要提供少量“图片样本“+基础提示词”,就能实现个性化内容的审核,增强通用场景的审核效果,为网络安全保驾护航。
一、能力概览
核心能力一:增强审核效果
针对涉黄、暴恐等基础场景,平台在海量数据库的基础上,结合最新的跨模态大模型能力,搭建官方场景库,实现图片拦截效果的快速优化和效果增强,提高审核全面性、召回率。
识别度增强,各类场景召回度进一步提升;
覆盖长尾场景,对隐晦色情、不良价值观等一网打尽;
应用便捷,官方大模型审核场景库可一键开启、快速应用。
核心能力二:个性化审核
内容的表现形式正在不断变化,传统的审核方式可能无法满足特殊的审核需求。例如,以炫富为目的的“人民币花”本应被判违规,但传统审核方式无法做出正确判断。此时,针对特定业务需求的个性化审核至关重要。
使用最新的图片大模型审核功能,结合图片特征,输入相关Prompt提示词,就可以对特殊图片进行拦截。
二、超详细实战步骤
假设,我们正在审核一批建筑物的图片,需要将“商场”相关的图片排除。
Step 1 进入自定义场景库页面
登录百度智能云账号,找到产品服务-人工智能下的内容审核产品;
根据操作指引,分别领取免费资源、创建应用、配置策略和调用服务。
进入“图像大模型审核 > 自定义场景库”页面。
Step 2 创建场景
点击“图像大模型审核 > 自定义场景库 > 创建场景”,进入编辑页面。
编辑“场景名称”部分时,建议将具有相似内容、主题或特征的图片归纳为一个类别,例如地点(如商场)、事物(如卡通警察)或任何具体的活动(如送餐)。
上传“图片样本”时,场景越细分、图片样本越多、像素越高(不低于 5*5px),训练后的审核效果越好。
支持批量上传,建议单次上传 6-10 张,最大上传数为 20 张,单张图不超过 10Mb;
上传格式支持 JPG、JPEG、PNG、BMP、GIF、WEBP。
设定好“场景名称”“图片样本”后,应为场景“撰写初始提示词”。
建议至少 2-3 个,单个提示词不超过 10 个字;
限制 100 字符以内,建议 3-5 个提示词,最多 15 个提示词,多个提示词以回车换行。
标签代表场景的主要属性。给场景“绑定标签”能让审核系统快速识别和处理图片,有效提高审核的准确率和效率。
Step 3 配置提示词
上述内容设置完成后,点击“完成创建”或“创建并配置提示词”,进入下一步骤。
根据实际的使用需求,可添加新的提示词,并对提示词的匹配阈值进行调整。
匹配度在匹配阈值以上的图片将被判断为违规;
匹配阈值越⾼,匹配精确度越高,匹配的违规图片数量越少。
匹配阈值设置完成后,点击左下角的“保存并检测提示词效果”。
如果自行上传的图片样本存在漏审情况,可根据系统提示进行调整。
如果不存在漏审,可根据实际情况,选择“检查系统图库是否存在误命中”或“无明显问题,去应用”。
Step 4 应用至策略
随后,进入“策略配置”页面。选中想要修改的审核策略并点击“编辑”,勾选“自定义场景库”,并添加所需“场景”。
保存策略配置后,可进行在线验证和内容审核。
以一张商场内部图片为验证样本。如果上述步骤全都顺利完成,将得到以下验证结果。
三、总结和思考
在安全领域,图像大模型有着广泛的应用前景和市场需求。
百度的图像大模型审核可以覆盖长尾场景,实现图片拦截的个性化和效果增强,只需轻松几步,就能实现检测和审核的完美融合。这个新功能还提高了图像审核的全面性和召回率,展现了大模型在网络安全领域的显著优势。