ai-content-detection

by chat2dev

Use this skill whenever a user wants to verify whether content (text, images, audio, video, or documents) was created by AI; detect deepfakes or AI-synthesized voices; use tools like GPTZero, Turnitin, ELA error analysis, or spectral analysis for authenticity checking; understand what percentage of online content is AI-generated; create a structured detection report with confidence scores; or defend against a false AI-writing accusation. Also applies when users suspect received materials (articles, promotional copy, contracts) may be AI-generated and want guidance on how to tell. Relevant regardless of language — including Chinese (检测AI生成内容、AI合成语音、深度伪造、ELA图片篡改分析、置信度报告、AI内容占比统计).

3.7k内容与创意未扫描2026年3月23日

安装

claude skill add --url github.com/openclaw/skills/tree/main/skills/chat2dev/ai-content-detection

文档

AI内容检测完整指南

概述

本技能提供对AI生成内容(文本、图片、视频、音频、文档、链接)的系统性检测方法,包含技术证据指标、置信度框架、工具对比及当前AI内容占比统计数据(截至2025年3月)。

快速导航

检测目标直接跳转
文章/文本是否AI生成→ 第2.1节(文本检测)
图片是否AI生成/伪造→ 第2.2节(图片检测)
视频是否Deepfake→ 第2.3节(视频检测)
语音/音频是否合成→ 第2.4节(音频检测)
文档/合同是否篡改→ 第2.5节(文档检测)
链接/流量是否Bot→ 第2.6节(链接检测)
AI内容占比统计数据→ 第一部分
生成检测报告→ 第四部分(报告模板)

第一部分:AI内容现状统计

统计项数值来源
新发布网页含AI内容比例74.2%Ahrefs 2025年4月研究(90万页样本)
所有在线文章中AI撰写比例52%Graphite SEO 2025数据
全部在线文本中AI辅助/生成比例~57%综合分析
2026年预测AI内容比例~90%Europol/欧盟预测
ChatGPT发布前AI内容比例(2022年末)~10%历史基线
金融科技行业2023年Deepfake事件增长700%行业报告
AI生成文档欺诈占比(欧洲2025)12%(2022年<2%)Deloitte 2025

第二部分:按内容类型的检测方法


2.1 文本检测(Text Detection)

核心检测指标

指标说明AI特征置信权重
困惑度(Perplexity)衡量文本的语言不可预测性AI文本困惑度低(5-10),人类文本高(20-50)高(但受语言水平影响)
突发性(Burstiness)句子长度/风格的变异程度AI文本突发性低,节奏均匀中(现代AI可模仿)
词汇多样性词汇重复率和词汇密度AI倾向使用固定词汇组合
语义一致性段落间逻辑连贯程度AI过度连贯,缺乏人类的思维跳跃
水印信号隐藏统计模式/Unicode字符生成时嵌入(可被释义绕过)高(若未被篡改)
N-gram分布短语使用频率模式与已知AI模型输出分布匹配
风格一致性整篇文章风格变化AI风格高度一致,人类有自然波动

重要证据(高置信度)

code
强证据(单项即可怀疑):
✓ 检测到合法水印信号(如C2PA标准)
✓ N-gram分析匹配已知LLM输出分布
✓ 困惑度持续低于10分(标准英文基准)

中等证据(需多项组合):
✓ 全文突发性标准差<0.3(异常均匀)
✓ 句子长度标准差<5词(机械规律)
✓ 无拼写错误、无口语化错误
✓ 标点使用完全符合规范(人类有自然偏差)

辅助证据(仅作参考):
✓ 逻辑结构过于完整(引言-正文-结论)
✓ 缺乏个人经历、情感波动、偏见
✓ 回避争议性立场

2.2 图片检测(Image Detection)

核心检测指标

指标说明检测方法置信权重
视觉伪影(Visual Artifacts)像素排列异常、边缘失真像素级检查、局部放大
GAN棋盘格纹GAN生成特有的棋盘状噪声频域分析(FFT/DCT)高(对GAN图像)
频域异常DCT/DWT变换后的低频异常HiFE网络分析
ELA误差分析不同区域JPEG压缩级别差异Error Level Analysis工具高(篡改检测)
元数据检查EXIF中相机型号、GPS、时间戳ExifTool等中(可被清除)
光照/阴影一致性光源方向与阴影方向矛盾人工/AI综合判断
皮肤纹理面部边缘异常融合、不自然过渡局部放大检查
手指/文字AI图像常见手指数量异常、文字变形人工检查中高

重要证据

code
强证据:
✓ FFT/DCT分析发现低频域周期性异常
✓ ELA显示局部区域再压缩痕迹
✓ 皮肤/毛发边缘高度局部放大后出现混合伪影
✓ 检测到C2PA/Content Credentials内容凭据

中等证据:
✓ EXIF元数据完全缺失(现代相机必有)
✓ 手指数量≠5或手指形状异常
✓ 背景中文字无法辨认或逻辑混乱
✓ 眼睛/牙齿区域不自然的对称性

辅助证据:
✓ 整体风格过于"完美"(无噪点、无自然缺陷)
✓ 珠宝、眼镜等配件细节异常

2.3 视频检测(Video Detection)

核心检测指标

指标说明检测方法置信权重
面部特征漂移(FFD)连续帧之间面部特征微妙漂移抖动帧间比较
时域频率伪影频域时间轴上的不可见伪影像素级时序频率分析(ICCV 2025)
光流异常运动轨迹违反物理规律双分支RGB+光流残差模型
闪烁/抖动面部局部闪烁(眼、鼻、嘴区域)逐帧分析(0.25x速度)中高
时间不一致帧间物体形变、细节消失重现逐帧检查
嘴唇同步唇形与音频不匹配AV同步分析高(换脸类)
眨眼频率不自然的眨眼节律(过多/过少)视频时序分析
元数据缺失摄像头信息、时间戳异常元数据工具

重要证据

code
强证据:
✓ 0.25x慢速播放可见形变/翘曲效应
✓ 面部特征漂移(眼/鼻/嘴在静态场景中微抖)
✓ 唇形与音频明显不同步
✓ 帧间光流分析发现非物理运动轨迹

中等证据:
✓ 牙齿细节在不同帧间变化
✓ 头发/耳朵边缘区域出现融合伪影
✓ 视频元数据缺失相机型号信息
✓ 长视频(64帧+)时间轴上累积不一致性

辅助证据:
✓ 背景元素在镜头切换间不自然变化
✓ 环境光源方向与面部高光矛盾

2025年前沿检测框架

  • D3(ICCV 2025)— 免训练,基于二阶牛顿力学特征
  • UNITE(CVPR 2025)— 通用合成视频检测器
  • FFD + 视频混合(CVPR 2025)— 面部特征漂移检测
  • AiVidect — 面向Sora、Veo 3等主流AI视频的实用检测工具

2.4 音频检测(Audio Detection)

核心检测指标

指标说明检测方法置信权重
梅尔频谱(Mel Spectrogram)时频模式保留分析CNN分类器 + Grad-CAM
MFCC系数梅尔频率倒谱系数传统+深度学习模型
常量Q变换(CQT)非线性频率细节分析宽频谱精细分析
SSL特征融合自监督学习表征Wave2Vec2BERT最高(跨域泛化最佳)
语速均匀性人类语速有自然变化时序分析
音高/音调自然度AI合成音调不自然波动基频分析
谐波异常不寻常谐波成分频谱分析
背景噪声连续性AI音频背景噪声异常均匀或突变声谱对比

重要证据

code
强证据:
✓ 梅尔频谱图显示非自然时频模式
✓ SSL模型(Wave2Vec2BERT)置信评分>0.85
✓ LFCC+MFCC+CQCC三特征融合均异常

中等证据:
✓ 语速方差极低(<0.05ms变异)
✓ 呼吸声、停顿位置不符合人类习惯
✓ 高频谐波分布异常(TTS特有模式)
✓ 音频首尾无自然环境背景噪声

辅助证据:
✓ 整段音频音色完全一致(无情绪波动)
✓ 发音过于标准(方言/口音完全消失)

2.5 文档检测(Document/PDF Detection)

核心检测指标

指标说明检测方法置信权重
ELA误差分析被篡改区域重压缩等级不同ErrorLevelAnalysis工具
PDF结构法证元数据、字体分析、透明层检测PDF元数据工具
修订链重建追踪每次修改时间和内容文档历史分析
字体一致性不同区域字体渲染差异专业OCR/字体分析中高
像素级篡改数字/文字替换留下的像素痕迹图像法证分析
元数据完整性创建工具、时间戳、作者信息ExifTool/pdfinfo
签名后修改签名后内容被更改(签名仍有效)增量更新重建
模板特征批量生成文档共享相同模板痕迹跨文档比对中高

重要证据

code
强证据:
✓ ELA显示文档中存在不一致的压缩层
✓ PDF增量更新记录显示签名后内容修改
✓ 字体渲染在不同区域明显不一致
✓ 元数据显示生成工具为AI/Python脚本

中等证据:
✓ 创建时间戳与声称日期矛盾
✓ 文档未包含正常相机/扫描仪元数据
✓ PDF结构包含不可见透明层(隐藏内容)
✓ 跨文档分析发现相同模板特征

辅助证据:
✓ 文档来源链接/印章与官方格式不符
✓ 字体大小/间距在关键数字处细微异常

2.6 链接/URL检测(Link/URL/Bot Traffic Detection)

核心检测指标

指标说明检测方法置信权重
流量模式异常突发性访问量/低质量页面高流量流量分析工具
用户代理异常过时浏览器/不可能的设备组合请求头分析
行为模式完美时间戳规律、机械点击模式行为分析引擎
会话数据零秒会话多页浏览、零转化Analytics分析
地理异常来自异常地区的突发流量GeoIP分析
Referrer垃圾伪造的来源域名来源分析
SSL证书短期证书、不信任CAHTTPS检查
域名历史新注册域名、AI生成的欺骗性域名WHOIS + NLP分析

重要证据(AI生成恶意链接)

code
强证据:
✓ 域名注册时间<7天且仿冒知名品牌
✓ 请求中user-agent为已知爬虫/AI工具特征
✓ 点击时间间隔完全规律(毫秒级精确)
✓ 登录失败率异常高(凭据填充攻击)

中等证据:
✓ 访问路径完全相同(无自然浏览习惯)
✓ 流量突增但转化率为0
✓ Referrer域名从未在浏览器中打开
✓ SSL证书域名与显示文本不匹配

辅助证据:
✓ 链接包含AI生成的诱导性上下文文本
✓ 域名使用Unicode字符模仿ASCII(如rnicrosoft.com)

第三部分:置信度评估框架

综合置信度评分方法

code
置信度 = (强证据数 × 3 + 中等证据数 × 1.5 + 辅助证据数 × 0.5) / 内容类型最高分

解读:
≥0.75  →  高置信度AI生成
0.50-0.74 →  中置信度(存在AI成分,需综合判断)
0.25-0.49 →  低置信度(疑似AI辅助,不能确定)
<0.25   →  可能为人类创作(不能排除AI辅助)

实际计算示例(文本检测)

某篇文章检测结果:

  • 强证据2项:GPTZero评分0.92 + N-gram匹配GPT-4分布
  • 中等证据3项:全文突发性标准差0.15(极低)、无拼写错误、句长均匀
  • 辅助证据2项:结构过于完整、回避争议立场

计算:(2×3 + 3×1.5 + 2×0.5) / (3×3 + 3×1.5 + 2×0.5) = (6 + 4.5 + 1) / (9 + 4.5 + 1) = 11.5 / 14.5 = 0.79 → 高置信度AI生成


第四部分:检测报告生成模板

markdown
## AI内容检测报告

**内容类型:** [文本/图片/视频/音频/文档/链接]
**检测日期:** YYYY-MM-DD

### 检测结果摘要
- **AI生成概率:** XX%
- **置信度等级:** 高/中/低

### 发现的关键证据

**强证据(权重3):**
1. [具体发现]

**中等证据(权重1.5):**
1. [具体发现]

**辅助证据(权重0.5):**
1. [具体发现]

### 置信度计算
总得分:(强×3 + 中×1.5 + 辅×0.5) = XX / 最高分 = XX%

### 结论
[基于证据的综合判断]

### 局限性说明
- 本报告基于当前可用检测技术,不构成法律证据

第五部分:局限性与注意事项

核心局限性

局限性影响缓解方法
非母语写作者假阳性文本检测准确率显著下降额外人工判断
对抗性规避AI可学会模拟人类特征多特征综合
跨生成器泛化新模型导致检测率下降50%持续更新检测器
水印可被绕过释义/翻译即可去除结合多种方法
法律证明力检测结果不足以作为法律定罪证据作为调查线索使用
压缩降质多次压缩破坏频域证据分析原始文件

EU AI法规要求(2025年3月生效)

  • 要求所有AI生成内容必须使用可检测信号标注(水印或元数据)
  • C2PA(Coalition for Content Provenance and Authenticity)标准推广中
  • 中国要求平台强制执行显性和隐性双重水印

参考来源

相关 Skills

主题工厂

by anthropics

Universal
热门

给幻灯片、文档、报告和 HTML 落地页快速套用专业配色与字体主题,内置 10 套预设风格并支持现场生成新主题,适合统一品牌或内容视觉。

主题工厂能帮你把幻灯片、文档到落地页快速统一视觉风格,内置 10 套主题,还能按需即时生成新主题。

内容与创意
未扫描109.6k

品牌规范

by anthropics

Universal
热门

把文档、幻灯片等内容快速套用 Anthropic 官方品牌配色与字体规范,统一标题、正文和图形视觉风格,适合做品牌化排版、视觉润色和公司设计标准校准。

把文档、页面和素材快速套用 Anthropic 官方色彩与字体系,少翻设计手册也能稳稳保持统一品牌感。

内容与创意
未扫描109.6k

文档共著

by anthropics

Universal
热门

围绕文档、提案、技术规格、决策记录等写作任务,按上下文收集、结构迭代、读者测试三步协作共创,减少信息遗漏,写出更清晰、经得起他人阅读的内容。

写文档、方案或技术规格时容易思路散、信息漏,它用结构化共著流程帮你高效传递上下文、反复打磨内容,还能从读者视角做验证。

内容与创意
未扫描109.6k

相关 MCP 服务

热门

免费的加密新闻聚合 MCP,汇集 Bitcoin、Ethereum、DeFi、Solana 与 altcoins 资讯源。

内容与创意
111

by ProfessionalWiki

让 Large Language Model 客户端无缝连接任意 MediaWiki 站点,可创建、更新、搜索页面,并通过 OAuth 2.0 安全管理内容。

内容与创意16 个工具
72

借助 86+ 个云端 media processing robots,处理视频、音频、图像和文档。

内容与创意
71

评论