产品概述
更新时间:
融媒体审核
面向网页与文档的多模态内容风险识别
融媒体审核面向网页、H5、论坛、社区、电商、博客、活动页、PDF、Word、Excel、CSV 等内容场景,支持对网页和文档中的文本、图片、链接、二维码、动态内容及上下文进行自动化检测,帮助平台快速发现违规内容、外链导流、诈骗广告及多模态内容风险。
核心能力
能力
描述
网页内容解析
自动解析 DOM、页面文本、图片、评论区、昵称、按钮、浮层等内容,减少业务侧自行拆解页面的接入成本
动态网页渲染
支持 JS 动态加载、H5、SPA、懒加载、弹窗内容检测,覆盖更多真实用户可见内容
文档内容解析
支持 PDF、Word、Excel、CSV 等文档解析,提取文档文本和内嵌图片进行统一审核
图文融合审核
支持 OCR 识别、图片文字提取、上下文语义理解,识别隐藏在图片、截图和组合内容中的风险
外链与二维码检测
识别跳转链接、下载链接、社交导流、二维码内容及风险域名,发现站外引流和欺诈风险
音频/视频检测
识别网站中的音视频内容进行模型审核,降低多媒体违规内容风险
审核流程
URL/文档输入 → 页面渲染或文档解析 → 内容提取 → OCR 识别 → 文本/图片/音频/视频审核 → 大模型语义分析 → 风险聚合 → 结果输出
-
提交网页 URL 或文档 URL,系统创建异步审核任务并返回 taskId。
-
服务端加载页面或下载文档,处理动态渲染、懒加载、弹窗、文档格式识别等内容。
-
解析 DOM、正文、图片、链接、二维码、文档文本和内嵌图片等内容元素。
-
对文本、图片及 OCR 内容进行审核,并结合上下文进行语义分析。
-
聚合多模态检测结果,输出页面级或文档级风险结论和命中明细。
-
通过回调或结果查询接口获取审核结果。
产品优势
优势
描述
高覆盖网页解析
覆盖静态网页、动态 H5、SPA、评论区、浮层和懒加载内容,尽量还原真实页面呈现
多格式文档解析
支持常见办公文档和表格文件,自动提取文本和图片内容,减少业务侧预处理成本
多模态图文理解
结合文本审核、图片审核、OCR 和语义理解,提升复杂页面风险识别能力
高并发稳定服务
异步任务架构适合批量巡检、页面上线前审核和存量内容定期复检
灵活策略配置
支持按业务线、国家地区、内容类型配置不同审核策略,并通过 strategyId 调用
适用场景
场景
说明
社交社区
审核用户主页、帖子详情页、评论聚合页、话题页等社区内容
游戏论坛
审核攻略、论坛帖、玩家主页、活动讨论页中的违规和导流风险
电商商品页
审核商品详情、店铺介绍、买家秀、营销素材中的违规内容
AIGC 平台
审核 AI 生成文章、页面、图片说明和活动落地页
文档资料审核
审核用户上传的 PDF、Word、Excel、CSV 等资料中的文本和图片风险
H5 活动页
审核营销活动、裂变页面、抽奖页面中的诱导、欺诈和敏感内容
海外内容平台
支持海外社区、博客、论坛和内容平台的多语言风险巡检
接入方式
网页内容调用网页检测任务提交接口提交网页 URL,文档内容调用文档检测任务提交接口提交文档 URL。接口返回 taskId 后,可通过回调或对应的结果查询接口获取结果。
融媒体审核
面向网页与文档的多模态内容风险识别
融媒体审核面向网页、H5、论坛、社区、电商、博客、活动页、PDF、Word、Excel、CSV 等内容场景,支持对网页和文档中的文本、图片、链接、二维码、动态内容及上下文进行自动化检测,帮助平台快速发现违规内容、外链导流、诈骗广告及多模态内容风险。
核心能力
| 能力 | 描述 |
|---|---|
| 网页内容解析 | 自动解析 DOM、页面文本、图片、评论区、昵称、按钮、浮层等内容,减少业务侧自行拆解页面的接入成本 |
| 动态网页渲染 | 支持 JS 动态加载、H5、SPA、懒加载、弹窗内容检测,覆盖更多真实用户可见内容 |
| 文档内容解析 | 支持 PDF、Word、Excel、CSV 等文档解析,提取文档文本和内嵌图片进行统一审核 |
| 图文融合审核 | 支持 OCR 识别、图片文字提取、上下文语义理解,识别隐藏在图片、截图和组合内容中的风险 |
| 外链与二维码检测 | 识别跳转链接、下载链接、社交导流、二维码内容及风险域名,发现站外引流和欺诈风险 |
| 音频/视频检测 | 识别网站中的音视频内容进行模型审核,降低多媒体违规内容风险 |
审核流程
URL/文档输入 → 页面渲染或文档解析 → 内容提取 → OCR 识别 → 文本/图片/音频/视频审核 → 大模型语义分析 → 风险聚合 → 结果输出
-
提交网页 URL 或文档 URL,系统创建异步审核任务并返回
taskId。 -
服务端加载页面或下载文档,处理动态渲染、懒加载、弹窗、文档格式识别等内容。
-
解析 DOM、正文、图片、链接、二维码、文档文本和内嵌图片等内容元素。
-
对文本、图片及 OCR 内容进行审核,并结合上下文进行语义分析。
-
聚合多模态检测结果,输出页面级或文档级风险结论和命中明细。
-
通过回调或结果查询接口获取审核结果。
产品优势
| 优势 | 描述 |
|---|---|
| 高覆盖网页解析 | 覆盖静态网页、动态 H5、SPA、评论区、浮层和懒加载内容,尽量还原真实页面呈现 |
| 多格式文档解析 | 支持常见办公文档和表格文件,自动提取文本和图片内容,减少业务侧预处理成本 |
| 多模态图文理解 | 结合文本审核、图片审核、OCR 和语义理解,提升复杂页面风险识别能力 |
| 高并发稳定服务 | 异步任务架构适合批量巡检、页面上线前审核和存量内容定期复检 |
| 灵活策略配置 | 支持按业务线、国家地区、内容类型配置不同审核策略,并通过 strategyId 调用 |
适用场景
| 场景 | 说明 |
|---|---|
| 社交社区 | 审核用户主页、帖子详情页、评论聚合页、话题页等社区内容 |
| 游戏论坛 | 审核攻略、论坛帖、玩家主页、活动讨论页中的违规和导流风险 |
| 电商商品页 | 审核商品详情、店铺介绍、买家秀、营销素材中的违规内容 |
| AIGC 平台 | 审核 AI 生成文章、页面、图片说明和活动落地页 |
| 文档资料审核 | 审核用户上传的 PDF、Word、Excel、CSV 等资料中的文本和图片风险 |
| H5 活动页 | 审核营销活动、裂变页面、抽奖页面中的诱导、欺诈和敏感内容 |
| 海外内容平台 | 支持海外社区、博客、论坛和内容平台的多语言风险巡检 |
接入方式
网页内容调用网页检测任务提交接口提交网页 URL,文档内容调用文档检测任务提交接口提交文档 URL。接口返回 taskId 后,可通过回调或对应的结果查询接口获取结果。