发票识别导出

poocr-vatinvoice2excel

by coderwanfeng

使用 poocr 库识别发票并导出 Excel。当用户需要识别增值税发票、批量处理发票文件或提取发票信息到 Excel 时调用此技能。

4.5k数据与存储未扫描2026年3月23日

安装

claude skill add --url github.com/openclaw/skills/tree/main/skills/coderwanfeng/poocr-vatinvoice2excel

文档

POOCR 发票识别技能

这个技能使用 poocr 库(基于腾讯云 AI)实现增值税发票的 OCR 识别,并将识别结果保存为 Excel 文件。

功能特性

  • 支持单张发票识别
  • 支持批量识别文件夹中的发票
  • 支持多种发票格式:PDF、JPG、PNG
  • 自动提取发票关键信息:发票号码、开票日期、金额、税额等
  • 结果直接导出为 Excel 格式

使用方法

1. 安装依赖

bash
pip install poocr

2. 配置腾讯云 API 密钥

需要获取腾讯云 API 的 SecretId 和 SecretKey:

3. 代码示例

python
import poocr

# 单张发票识别并导出 Excel
poocr.ocr2excel.VatInvoiceOCR2Excel(
    input_path='发票文件路径.pdf',
    output_path='输出目录',
    id='你的SecretId',
    key='你的SecretKey'
)

# 批量识别文件夹中的发票
poocr.ocr2excel.VatInvoiceOCR2Excel(
    input_path='发票文件夹路径',
    output_path='输出目录',
    id='你的SecretId',
    key='你的SecretKey'
)

参数说明

参数类型说明
input_pathstr发票文件路径或包含发票的文件夹路径
output_pathstr输出 Excel 文件的目录路径
idstr腾讯云 API SecretId
keystr腾讯云 API SecretKey

使用场景

  1. 财务报销:批量识别员工提交的发票,自动提取关键信息
  2. 税务处理:快速整理大量发票数据用于税务申报
  3. 数据录入:将纸质发票或电子发票信息数字化
  4. 审计工作:批量处理发票数据进行分析

注意事项

  1. 确保腾讯云 API 密钥有效且有足够的调用额度
  2. 支持的发票类型:增值税普通发票、增值税专用发票等
  3. 图片质量会影响识别准确率,建议使用清晰的发票图片或 PDF
  4. 批量处理时,程序会自动遍历文件夹中的所有发票文件

完整示例代码

python
import poocr
import os

class InvoiceOCR:
    def __init__(self, secret_id, secret_key):
        self.SecretId = secret_id
        self.SecretKey = secret_key
    
    def recognize_invoice(self, input_path, output_path):
        """识别发票并导出 Excel"""
        if not os.path.exists(input_path):
            raise FileNotFoundError(f"文件不存在: {input_path}")
        
        poocr.ocr2excel.VatInvoiceOCR2Excel(
            input_path=input_path,
            output_path=output_path,
            id=self.SecretId,
            key=self.SecretKey
        )
        
        print(f"发票识别完成,结果已保存到: {output_path}")

# 使用示例
if __name__ == "__main__":
    ocr = InvoiceOCR(
        secret_id="你的SecretId",
        secret_key="你的SecretKey"
    )
    
    ocr.recognize_invoice(
        input_path="../test_files/VatInvoiceOCR",
        output_path="../test_files/VatInvoiceOCR"
    )

相关 Skills

技术栈评估

by alirezarezvani

Universal
热门

对比框架、数据库和云服务,结合 5 年 TCO、安全风险、生态活力与迁移复杂度做量化评估,适合技术选型、栈升级和替换路线决策。

帮你系统比较技术栈优劣,不只看功能,还把TCO、安全性和生态健康度一起量化,选型和迁移决策更稳。

数据与存储
未扫描15.8k

资深数据科学家

by alirezarezvani

Universal
热门

覆盖实验设计、特征工程、预测建模、因果推断与模型评估,适合用 Python/R/SQL 做 A/B 测试、时序分析和生产级 ML 落地,支撑数据驱动决策。

从 A/B 测试、因果分析到预测建模一条龙搞定,既有硬核统计方法也懂业务沟通,特别适合把数据结论真正落地。

数据与存储
未扫描15.8k

资深架构师

by alirezarezvani

Universal
热门

适合系统设计评审、ADR记录和扩展性规划,分析依赖与耦合,权衡单体或微服务、数据库与技术栈选型,并输出Mermaid、PlantUML、ASCII架构图。

搞系统设计、技术选型和扩展规划时,用它能更快理清架构决策与依赖关系,还能直接产出 Mermaid/PlantUML 图,方案讨论效率很高。

数据与存储
未扫描15.8k

相关 MCP 服务

SQLite 数据库

编辑精选

by Anthropic

热门

SQLite 是让 AI 直接查询本地数据库进行数据分析的 MCP 服务器。

这个服务器解决了 AI 无法直接访问 SQLite 数据库的问题,适合需要快速分析本地数据集的开发者。不过,作为参考实现,它可能缺乏生产级的安全特性,建议在受控环境中使用。

数据与存储
86.1k

by Anthropic

热门

PostgreSQL 是让 Claude 直接查询和管理你的数据库的 MCP 服务器。

这个服务器解决了开发者需要手动编写 SQL 查询的痛点,特别适合数据分析师或后端开发者快速探索数据库结构。不过,由于是参考实现,生产环境使用前务必评估安全风险,别指望它能处理复杂事务。

数据与存储
86.1k

by Firecrawl

热门

Firecrawl 是让 AI 直接抓取网页并提取结构化数据的 MCP 服务器。

它解决了手动写爬虫的麻烦,让 Claude 能直接访问动态网页内容。最适合需要实时数据的研究者或开发者,比如监控竞品价格或抓取新闻。但要注意,它依赖第三方 API,可能涉及隐私和成本问题。

数据与存储
6.4k

评论