当前位置:首页 > 技术 > 正文内容

电子发票智能识别系统:PDF与OFD格式处理方案

访客 技术 2026年6月5日 1

电子发票智能识别系统:PDF与OFD格式处理方案

本系统专注于电子发票的智能识别与解析,能够高效处理各类电子普通发票、专用发票以及全电发票,支持PDF和OFD两种主流文件格式。

系统架构与接口设计

系统采用模块化设计,提供标准化的Web接口服务,便于企业集成到现有财务系统中。通过API调用,用户可以快速获取发票结构化数据,实现发票信息的自动化处理。

PDF发票解析示例

以下是PDF格式发票解析后的JSON响应示例:


{
    "status": 200,
    "responseMessage": "处理成功",
    "invoiceCode": "012001800211",
    "invoiceNumber": "23326471",
    "issueDate": "2018-09-21",
    "validationHash": "16707184549009707698",
    "totalSum": 756.63,
    "totalSumInWords": "柒佰伍拾陆元陆角叁分",
    "taxTotal": 22.04,
    "netAmount": 734.59,
    "purchaser": {
        "companyName": "聚光科技(杭州)股份有限公司",
        "taxID": "91330000734500338C",
        "address": "杭州市滨江区滨安路760号0571-85012188",
        "bankAccount": "中行滨江支行385758326851"
    },
    "supplier": {
        "companyName": "滴滴出行科技有限公司",
        "taxID": "911201163409833307",
        "address": "天津经济技术开发区南港工业区综合服务区办公楼C座103室12单元022-59002850",
        "bankAccount": "招商银行股份有限公司天津自由贸易试验区分行122905939910401"
    },
    "invoiceType": "普通发票",
    "items": [
        {
            "description": "*运输服务*客运服务费 无",
            "specification": null,
            "unit": "次",
            "quantity": 1,
            "unitPrice": 734.59,
            "lineTotal": 734.59,
            "taxRate": 0.03,
            "taxAmount": 22.04
        }
    ]
}

OFD发票解析示例

对于OFD格式发票,系统会先将其转换为PDF格式再进行解析,确保解析准确性。以下是解析结果示例:


{
    "statusCode": 200,
    "statusDescription": "操作成功完成",
    "fiscalCode": null,
    "serialNumber": "24122000000021651285",
    "transactionDate": "2024-04-22",
    "verificationCode": null,
    "grandTotal": 14464.11,
    "grandTotalInChinese": "壹万肆仟肆佰陆拾肆圆壹角壹分",
    "taxSum": 1664.01,
    "subtotal": 12800.10,
    "recipient": {
        "enterpriseName": "天津中通鼎兴钢管有限公司",
        "taxRegistrationNumber": "91120112578348556H",
        "registeredAddress": null,
        "bankDetails": null
    },
    "issuer": {
        "enterpriseName": "天津市合盛钢管有限公司",
        "taxRegistrationNumber": "91120223727492229X",
        "registeredAddress": null,
        "bankDetails": null
    },
    "classification": "增值税专用发票",
    "invoiceItems": [
        {
            "productCategory": "*黑色金属冶炼压延品*直缝焊管",
            "规格型号": "60*3.5",
            "计量单位": "吨",
            "数量": 3.2,
            "单价": 3565.48672566372,
            "金额": 11409.56,
            "税率": 0.13,
            "税额": 1483.24
        },
        {
            "productCategory": "*黑色金属冶炼压延品*直缝焊管",
            "规格型号": "60*3.75",
            "计量单位": "吨",
            "数量": 0.23,
            "单价": 3565.48672566372,
            "金额": 820.06,
            "税率": 0.13,
            "税额": 106.61
        },
        {
            "productCategory": "*黑色金属冶炼压延品*直缝焊管",
            "规格型号": "60*4.75",
            "计量单位": "吨",
            "数量": 0.16,
            "单价": 3565.48672566372,
            "金额": 570.48,
            "税率": 0.13,
            "税额": 74.16
        }
    ]
}

系统优化特点

  1. 格式转换优化:将OFD文件转换为PDF格式后再进行解析,有效避免了直接解析OFD格式可能出现的错误问题。
  2. 解析算法改进:优化了PDF解析过程中的多个关键环节,提高了识别准确率和稳定性。
  3. 结果数据清洗:对PDF解析结果进行智能矫正,去除冗余信息,确保输出数据的简洁性和实用性。

相关文章

Linux crontab 详解

1) crontab 是什么cron 是 Linux 的定时任务守护进程;crontab 是用来编辑/查看“按时间周期执行命令”的表(cron table)。常见两类:用户 crontab:每个用户一份(crontab -e 编辑)系统级 crontab / cron.d:可指定执行用户(/etc/crontab、/etc/cron.d/*)2) crontab 时间...

富文本里可以允许的 HTML 属性

一、所有标签默认允许的安全属性(极少)class        (可选)id           (通常建议禁用)title️ 注意:id 容易被滥用做锚点注入,很多系统直接禁用class 允许的话最好只允许固定前缀(如 editor-*)二、a 标签允许属性<a href="" t...

Mac 安装 Node.js 指南

方法一:通过官网安装包(最简单,适合初学者)如果你只是想快速安装并开始使用,这是最直接的方法。访问 Node.js 官网。页面会显示两个版本:LTS (Recommended For Most Users):长期支持版,最稳定。建议选这个。Current:最新特性版,包含最新功能但可能不够稳定。下载 .pkg 安装包并运行。按照安装向导点击“下一步”即可完成。方法二:使用 Homebrew 安装(...

Dom\HTML_NO_DEFAULT_NS 的副作用:自动加闭合标签

在使用Dom\HTMLDocument时,Dom\HTML_NO_DEFAULT_NS 将禁止在解析过程中设置元素的命名空间, 此设置是为了与DOMDocument向后兼容而存在的。当使用它时,已知的一个副作用就是:自动加闭合标签例如 </img> 为什么会这样?当你使用:Dom\HTML_NO_DEFAULT_NS文档会变成 无命名空间模式,此时内部更接近 XML...

Laravel 事件和监听器创建

在 Laravel 中,使用 Artisan 命令创建 Events(事件) 和 Listeners(监听器) 是非常高效的。你可以通过以下几种方式来实现:1. 手动创建单个 Event如果你只想创建一个事件类,可以使用 make:event 命令:Bashphp artisan make:event UserRegistered执行后,文件将生成在 app/Even...

自定义域名解析神器 dnsmasq

什么是 dnsmasq?dnsmasq 是一个轻量级、功能强大的网络服务工具,专为小型和中等规模网络设计。它是一个综合的网络基础设施解决方案[1]。dnsmasq 能做什么?功能说明应用场景DNS 转发与缓存将 DNS 查询转发到上游服务器(ISP、Google DNS 等),并在本地缓存结果加快 DNS 查询速度,减少外部 DNS 流量本地 DNS解析本地网络设备的主机名,无需编辑&n...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。