基于 Dify 的 AI 多维单证自动化处理系统

基于 Dify 的 AI 多维单证自动化处理系统

可拓展方向

  • 国际货代:自动扫描并录入海运提单,减少提单号(B/L No.)输入错误。
  • 企业财务中心:自动化应付账款(AP)处理,将 PDF 发票直接转化为报销凭证。
  • 跨境电商:快速审核装箱单与采购单,实时比对货物重量与体积差异。

项目背景

项目背景 在国际贸易与财务审计场景中,单证处理长期面临以下挑战:

  • 人工录入低效:每日处理数百份发票(Invoice)、装箱单(PL)和提单(BL),耗费大量人力。
  • 数据质量参差不齐:原始文档常包含错别字(如将 Gross 写成 Gr0ss)、非标排版或中英双语混排,传统 OCR 难以精准结构化。
  • 系统孤岛:OCR 提取后的原始文本与企业最终需要的业务报表之间存在“断层”,缺乏逻辑校验与自动汇总能力。

整体架构

graph TD
    subgraph Input
        A[飞书 Webhook 实时监控] -->|推送文件/消息| B[批量手动上传接口]
    end

    subgraph 识别层 OCR & Parse
        C[批量提取节点] -->|PDF/Word/Excel/图片| D[原始长字符串]
    end

    subgraph 路由层
        E[Jinja2 上下文锚点对齐] --> F[LLM 单证类型分类]
        F --> G{发票/合同/提单/其他}
    end

    subgraph 执行层
        H[迭代节点 - 并行运行] --> I[分支1: 发票字段提取]
        H --> J[分支2: 合同字段提取]
        H --> K[分支3: 提单字段提取]
        I & J & K --> L[聚合各单证结构化数据]
    end

    subgraph 数据清洗层
        M[Python 节点] --> N[正则清洗 Markdown 标签]
        N --> O[String → Object 类型转换]
    end

    subgraph 输出层
        P[聚合数据渲染] --> Q[飞书消息卡片推送]
    end

    B --> C
    D --> E
    F --> G
    G --> H
    L --> M
    O --> P

    classDef layer fill:#f0f0f0,stroke:#333,stroke-width:1px;
    class Input,OCR,Class,Exec,Clean,Output layer;

系统通过 Dify 工作流编排,实现了从“非结构化文本”到“结构化决策”的闭环。

  • 输入层 (Input):支持飞书 Webhook 实时监控转发或批量手动上传。
  • 识别层 (OCR & Parse):利用 批量提取 节点将各类文档(PDF/Word/Excel/图片)转为原始长字符串。
  • 路由层 (Classification):通过 Jinja2 模板进行“上下文锚点对齐”,引导 LLM 准确判断单证类型(发票、合同、提单等)。
  • 执行层 (Parallel Extraction):开启迭代节点的 “并行运行” 模式,多分支同步提取各单证核心字段。
  • 数据清洗层 (Python Bridge):利用 Python 节点进行正则清洗,剥离 Markdown 标签并完成 StringObject 的类型转换。
  • 输出层 (Feishu Card):将聚合后的数据渲染为飞书消息卡片进行推送。

功能展示:

1.准备3个文件测试

TC01_Invoice_Standard.pdf(发票),TC02_PackingList_Messy.xlsx(装箱单),TC03_BillOfLading_Bilingual.docx(提单) image.png image.png image.png

2.执行工作流

image.png

3.查看结果

消息提取后,可以对接任意平台,不论是你飞书,还是企业微信,还是钉钉或者是ERP系统都是可以的 image.png

核心亮点

  • 极强的容错性:Prompt 注入了“财务审计逻辑”,能自动识别并修正 Gr0ss We!ght 等故意构造的干扰项。
  • 并行加速:支持多文件同时处理,显著降低大规模单据处理的等待总时长。
  • 数据一致性保障:在 Python 节点中增加了 if not item: continue 过滤逻辑,确保最终报告中不会出现 null 导致的渲染崩溃。
  • 中英双语兼容:针对 TC03 等提单文件,系统能同时解析中英文地址与物权主体。

主要能力

  • 多维度分类:支持发票、装箱单、提单、采购单、合同、保单、报关单等 7+ 种类型识别。
  • 财务勾稽校验:自动验证发票中的“单价 × 数量 = 总额”逻辑。
  • 物流属性提取:精准抓取毛重(GW)、体积(CBM)及件数(QTY)等核心物理指标。
  • 异常拦截:通过 ELSE 分支识别非单证类“噪音”文件,防止脏数据进入数据库。
  • 结构化汇总:将所有迭代结果聚合为单一的 JSON 数组,方便对接下游 ERP 系统。
© 2026 Personal Website
Developed by Ryan 🫡