媒体分析
media-inspector
by chensu1234
本地音视频文件分析工具。支持扫描媒体文件、提取元数据、语音转文字(Whisper)、生成摘要和关键片段。支持 MP4/MOV/MKV/MP3/WAV/M4A/FLAC 等格式。
安装
claude skill add --url github.com/openclaw/skills/tree/main/skills/chensu1234/media-inspector文档
Media Inspector 📺 🎵
本地音视频文件分析工具,可扫描、提取元数据、转录、摘要和导出报告。
支持格式
视频: mp4, mov, mkv, avi, webm, m4v, ts, mpg, mpeg
音频: mp3, wav, m4a, aac, flac, ogg, opus, aiff, wma
快速开始
1. 扫描媒体文件
python scripts/scan_media.py /path/to/media --out-dir ./media_scan
输出文件:
scan_results.json- JSON格式scan_results.csv- CSV格式scan_results.md- Markdown格式
2. 深度分析
python scripts/analyze_media.py /path/to/file.mp4 --out-dir ./media_analysis
分析内容:
- 元数据提取(ffprobe)
- 语音转文字(Whisper,可选)
- 内容摘要
- 关键片段提取(带时间戳)
- 报告导出(JSON/CSV/Markdown)
依赖安装
# 必需:ffmpeg (包含 ffprobe)
brew install ffmpeg
# 可选:Whisper 语音转文字
pip install whisper
# 或
brew install whisper
使用规则
- ✅ 优先使用转录文本进行分析,不要仅凭文件名猜测
- ⚠️ Whisper 不可用时,明确告知用户并仅返回元数据
- ❌ 不要虚构内容摘要
- 📝 关键片段必须包含时间戳
- 📊 批量分析时,每个文件单独报告
输出示例
扫描报告
# Media Scan Report
## Summary
- scanned path: /path/to/media
- files found: 10
- audio files: 3
- video files: 7
## Candidates
| filename | duration | type | file size |
|---|---|---|---|
| video.mp4 | 01:30:00 | video | 500.2 MB |
| audio.mp3 | 00:05:30 | audio | 5.2 MB |
分析报告
# Media Analysis Report
## File
- path: /path/to/video.mp4
- type: video
- duration: 01:30:00
## Transcript
- available: yes
- whisper used: yes
## Summary
[基于转录文本的摘要内容]
## Key excerpts
1. [00:01:30 - 00:02:15] 关键片段内容...
2. [00:15:00 - 00:16:30] 另一个关键片段...
相关 Skills
内部沟通
by anthropics
按公司常用模板和语气快速起草内部沟通内容,覆盖 3P 更新、状态报告、领导汇报、项目进展、事故复盘、FAQ 与 newsletter,适合需要统一格式的团队沟通场景。
✎ 按公司偏好的模板快速产出状态汇报、领导更新和 FAQ,既省去反复改稿,也让内部沟通更统一、更专业。
主题工厂
by anthropics
给幻灯片、文档、报告和 HTML 落地页快速套用专业配色与字体主题,内置 10 套预设风格并支持现场生成新主题,适合统一品牌或内容视觉。
✎ 主题工厂能帮你把幻灯片、文档到落地页快速统一视觉风格,内置 10 套主题,还能按需即时生成新主题。
文档共著
by anthropics
围绕文档、提案、技术规格、决策记录等写作任务,按上下文收集、结构迭代、读者测试三步协作共创,减少信息遗漏,写出更清晰、经得起他人阅读的内容。
✎ 写文档、方案或技术规格时容易思路散、信息漏,它用结构化共著流程帮你高效传递上下文、反复打磨内容,还能从读者视角做验证。
相关 MCP 服务
by nirholas
免费的加密新闻聚合 MCP,汇集 Bitcoin、Ethereum、DeFi、Solana 与 altcoins 资讯源。
by ProfessionalWiki
让 Large Language Model 客户端无缝连接任意 MediaWiki 站点,可创建、更新、搜索页面,并通过 OAuth 2.0 安全管理内容。
by transloadit
借助 86+ 个云端 media processing robots,处理视频、音频、图像和文档。