ai-content-detection

by chat2dev

Use this skill whenever a user wants to verify whether content (text, images, audio, video, or documents) was created by AI; detect deepfakes or AI-synthesized voices; use tools like GPTZero, Turnitin, ELA error analysis, or spectral analysis for authenticity checking; understand what percentage of online content is AI-generated; create a structured detection report with confidence scores; or defend against a false AI-writing accusation. Also applies when users suspect received materials (articles, promotional copy, contracts) may be AI-generated and want guidance on how to tell. Relevant regardless of language — including Chinese (检测AI生成内容、AI合成语音、深度伪造、ELA图片篡改分析、置信度报告、AI内容占比统计).

View Chinese version with editor review

安装

claude skill add --url github.com/openclaw/skills/tree/main/skills/chat2dev/ai-content-detection

文档

AI内容检测完整指南

概述

本技能提供对AI生成内容(文本、图片、视频、音频、文档、链接)的系统性检测方法,包含技术证据指标、置信度框架、工具对比及当前AI内容占比统计数据(截至2025年3月)。

快速导航

检测目标直接跳转
文章/文本是否AI生成→ 第2.1节(文本检测)
图片是否AI生成/伪造→ 第2.2节(图片检测)
视频是否Deepfake→ 第2.3节(视频检测)
语音/音频是否合成→ 第2.4节(音频检测)
文档/合同是否篡改→ 第2.5节(文档检测)
链接/流量是否Bot→ 第2.6节(链接检测)
AI内容占比统计数据→ 第一部分
生成检测报告→ 第四部分(报告模板)

第一部分:AI内容现状统计

统计项数值来源
新发布网页含AI内容比例74.2%Ahrefs 2025年4月研究(90万页样本)
所有在线文章中AI撰写比例52%Graphite SEO 2025数据
全部在线文本中AI辅助/生成比例~57%综合分析
2026年预测AI内容比例~90%Europol/欧盟预测
ChatGPT发布前AI内容比例(2022年末)~10%历史基线
金融科技行业2023年Deepfake事件增长700%行业报告
AI生成文档欺诈占比(欧洲2025)12%(2022年<2%)Deloitte 2025

第二部分:按内容类型的检测方法


2.1 文本检测(Text Detection)

核心检测指标

指标说明AI特征置信权重
困惑度(Perplexity)衡量文本的语言不可预测性AI文本困惑度低(5-10),人类文本高(20-50)高(但受语言水平影响)
突发性(Burstiness)句子长度/风格的变异程度AI文本突发性低,节奏均匀中(现代AI可模仿)
词汇多样性词汇重复率和词汇密度AI倾向使用固定词汇组合
语义一致性段落间逻辑连贯程度AI过度连贯,缺乏人类的思维跳跃
水印信号隐藏统计模式/Unicode字符生成时嵌入(可被释义绕过)高(若未被篡改)
N-gram分布短语使用频率模式与已知AI模型输出分布匹配
风格一致性整篇文章风格变化AI风格高度一致,人类有自然波动

重要证据(高置信度)

code
强证据(单项即可怀疑):
✓ 检测到合法水印信号(如C2PA标准)
✓ N-gram分析匹配已知LLM输出分布
✓ 困惑度持续低于10分(标准英文基准)

中等证据(需多项组合):
✓ 全文突发性标准差<0.3(异常均匀)
✓ 句子长度标准差<5词(机械规律)
✓ 无拼写错误、无口语化错误
✓ 标点使用完全符合规范(人类有自然偏差)

辅助证据(仅作参考):
✓ 逻辑结构过于完整(引言-正文-结论)
✓ 缺乏个人经历、情感波动、偏见
✓ 回避争议性立场

2.2 图片检测(Image Detection)

核心检测指标

指标说明检测方法置信权重
视觉伪影(Visual Artifacts)像素排列异常、边缘失真像素级检查、局部放大
GAN棋盘格纹GAN生成特有的棋盘状噪声频域分析(FFT/DCT)高(对GAN图像)
频域异常DCT/DWT变换后的低频异常HiFE网络分析
ELA误差分析不同区域JPEG压缩级别差异Error Level Analysis工具高(篡改检测)
元数据检查EXIF中相机型号、GPS、时间戳ExifTool等中(可被清除)
光照/阴影一致性光源方向与阴影方向矛盾人工/AI综合判断
皮肤纹理面部边缘异常融合、不自然过渡局部放大检查
手指/文字AI图像常见手指数量异常、文字变形人工检查中高

重要证据

code
强证据:
✓ FFT/DCT分析发现低频域周期性异常
✓ ELA显示局部区域再压缩痕迹
✓ 皮肤/毛发边缘高度局部放大后出现混合伪影
✓ 检测到C2PA/Content Credentials内容凭据

中等证据:
✓ EXIF元数据完全缺失(现代相机必有)
✓ 手指数量≠5或手指形状异常
✓ 背景中文字无法辨认或逻辑混乱
✓ 眼睛/牙齿区域不自然的对称性

辅助证据:
✓ 整体风格过于"完美"(无噪点、无自然缺陷)
✓ 珠宝、眼镜等配件细节异常

2.3 视频检测(Video Detection)

核心检测指标

指标说明检测方法置信权重
面部特征漂移(FFD)连续帧之间面部特征微妙漂移抖动帧间比较
时域频率伪影频域时间轴上的不可见伪影像素级时序频率分析(ICCV 2025)
光流异常运动轨迹违反物理规律双分支RGB+光流残差模型
闪烁/抖动面部局部闪烁(眼、鼻、嘴区域)逐帧分析(0.25x速度)中高
时间不一致帧间物体形变、细节消失重现逐帧检查
嘴唇同步唇形与音频不匹配AV同步分析高(换脸类)
眨眼频率不自然的眨眼节律(过多/过少)视频时序分析
元数据缺失摄像头信息、时间戳异常元数据工具

重要证据

code
强证据:
✓ 0.25x慢速播放可见形变/翘曲效应
✓ 面部特征漂移(眼/鼻/嘴在静态场景中微抖)
✓ 唇形与音频明显不同步
✓ 帧间光流分析发现非物理运动轨迹

中等证据:
✓ 牙齿细节在不同帧间变化
✓ 头发/耳朵边缘区域出现融合伪影
✓ 视频元数据缺失相机型号信息
✓ 长视频(64帧+)时间轴上累积不一致性

辅助证据:
✓ 背景元素在镜头切换间不自然变化
✓ 环境光源方向与面部高光矛盾

2025年前沿检测框架

  • D3(ICCV 2025)— 免训练,基于二阶牛顿力学特征
  • UNITE(CVPR 2025)— 通用合成视频检测器
  • FFD + 视频混合(CVPR 2025)— 面部特征漂移检测
  • AiVidect — 面向Sora、Veo 3等主流AI视频的实用检测工具

2.4 音频检测(Audio Detection)

核心检测指标

指标说明检测方法置信权重
梅尔频谱(Mel Spectrogram)时频模式保留分析CNN分类器 + Grad-CAM
MFCC系数梅尔频率倒谱系数传统+深度学习模型
常量Q变换(CQT)非线性频率细节分析宽频谱精细分析
SSL特征融合自监督学习表征Wave2Vec2BERT最高(跨域泛化最佳)
语速均匀性人类语速有自然变化时序分析
音高/音调自然度AI合成音调不自然波动基频分析
谐波异常不寻常谐波成分频谱分析
背景噪声连续性AI音频背景噪声异常均匀或突变声谱对比

重要证据

code
强证据:
✓ 梅尔频谱图显示非自然时频模式
✓ SSL模型(Wave2Vec2BERT)置信评分>0.85
✓ LFCC+MFCC+CQCC三特征融合均异常

中等证据:
✓ 语速方差极低(<0.05ms变异)
✓ 呼吸声、停顿位置不符合人类习惯
✓ 高频谐波分布异常(TTS特有模式)
✓ 音频首尾无自然环境背景噪声

辅助证据:
✓ 整段音频音色完全一致(无情绪波动)
✓ 发音过于标准(方言/口音完全消失)

2.5 文档检测(Document/PDF Detection)

核心检测指标

指标说明检测方法置信权重
ELA误差分析被篡改区域重压缩等级不同ErrorLevelAnalysis工具
PDF结构法证元数据、字体分析、透明层检测PDF元数据工具
修订链重建追踪每次修改时间和内容文档历史分析
字体一致性不同区域字体渲染差异专业OCR/字体分析中高
像素级篡改数字/文字替换留下的像素痕迹图像法证分析
元数据完整性创建工具、时间戳、作者信息ExifTool/pdfinfo
签名后修改签名后内容被更改(签名仍有效)增量更新重建
模板特征批量生成文档共享相同模板痕迹跨文档比对中高

重要证据

code
强证据:
✓ ELA显示文档中存在不一致的压缩层
✓ PDF增量更新记录显示签名后内容修改
✓ 字体渲染在不同区域明显不一致
✓ 元数据显示生成工具为AI/Python脚本

中等证据:
✓ 创建时间戳与声称日期矛盾
✓ 文档未包含正常相机/扫描仪元数据
✓ PDF结构包含不可见透明层(隐藏内容)
✓ 跨文档分析发现相同模板特征

辅助证据:
✓ 文档来源链接/印章与官方格式不符
✓ 字体大小/间距在关键数字处细微异常

2.6 链接/URL检测(Link/URL/Bot Traffic Detection)

核心检测指标

指标说明检测方法置信权重
流量模式异常突发性访问量/低质量页面高流量流量分析工具
用户代理异常过时浏览器/不可能的设备组合请求头分析
行为模式完美时间戳规律、机械点击模式行为分析引擎
会话数据零秒会话多页浏览、零转化Analytics分析
地理异常来自异常地区的突发流量GeoIP分析
Referrer垃圾伪造的来源域名来源分析
SSL证书短期证书、不信任CAHTTPS检查
域名历史新注册域名、AI生成的欺骗性域名WHOIS + NLP分析

重要证据(AI生成恶意链接)

code
强证据:
✓ 域名注册时间<7天且仿冒知名品牌
✓ 请求中user-agent为已知爬虫/AI工具特征
✓ 点击时间间隔完全规律(毫秒级精确)
✓ 登录失败率异常高(凭据填充攻击)

中等证据:
✓ 访问路径完全相同(无自然浏览习惯)
✓ 流量突增但转化率为0
✓ Referrer域名从未在浏览器中打开
✓ SSL证书域名与显示文本不匹配

辅助证据:
✓ 链接包含AI生成的诱导性上下文文本
✓ 域名使用Unicode字符模仿ASCII(如rnicrosoft.com)

第三部分:置信度评估框架

综合置信度评分方法

code
置信度 = (强证据数 × 3 + 中等证据数 × 1.5 + 辅助证据数 × 0.5) / 内容类型最高分

解读:
≥0.75  →  高置信度AI生成
0.50-0.74 →  中置信度(存在AI成分,需综合判断)
0.25-0.49 →  低置信度(疑似AI辅助,不能确定)
<0.25   →  可能为人类创作(不能排除AI辅助)

实际计算示例(文本检测)

某篇文章检测结果:

  • 强证据2项:GPTZero评分0.92 + N-gram匹配GPT-4分布
  • 中等证据3项:全文突发性标准差0.15(极低)、无拼写错误、句长均匀
  • 辅助证据2项:结构过于完整、回避争议立场

计算:(2×3 + 3×1.5 + 2×0.5) / (3×3 + 3×1.5 + 2×0.5) = (6 + 4.5 + 1) / (9 + 4.5 + 1) = 11.5 / 14.5 = 0.79 → 高置信度AI生成


第四部分:检测报告生成模板

markdown
## AI内容检测报告

**内容类型:** [文本/图片/视频/音频/文档/链接]
**检测日期:** YYYY-MM-DD

### 检测结果摘要
- **AI生成概率:** XX%
- **置信度等级:** 高/中/低

### 发现的关键证据

**强证据(权重3):**
1. [具体发现]

**中等证据(权重1.5):**
1. [具体发现]

**辅助证据(权重0.5):**
1. [具体发现]

### 置信度计算
总得分:(强×3 + 中×1.5 + 辅×0.5) = XX / 最高分 = XX%

### 结论
[基于证据的综合判断]

### 局限性说明
- 本报告基于当前可用检测技术,不构成法律证据

第五部分:局限性与注意事项

核心局限性

局限性影响缓解方法
非母语写作者假阳性文本检测准确率显著下降额外人工判断
对抗性规避AI可学会模拟人类特征多特征综合
跨生成器泛化新模型导致检测率下降50%持续更新检测器
水印可被绕过释义/翻译即可去除结合多种方法
法律证明力检测结果不足以作为法律定罪证据作为调查线索使用
压缩降质多次压缩破坏频域证据分析原始文件

EU AI法规要求(2025年3月生效)

  • 要求所有AI生成内容必须使用可检测信号标注(水印或元数据)
  • C2PA(Coalition for Content Provenance and Authenticity)标准推广中
  • 中国要求平台强制执行显性和隐性双重水印

参考来源