什么是 PDF/A?
PDF/A 是 PDF 格式的一个子集,专为长期数字归档而设计。"A"代表"Archive"(归档)。它作为 ISO 标准(ISO 19005)开发,旨在确保文档在未来能够被忠实地阅读和重现,无论当时可用的软件、硬件或操作系统是什么。
普通 PDF 与 PDF/A 的关键区别在于,PDF/A 是自包含且自给自足的:重现文档所需的所有字体、颜色、图像和元数据都嵌入在文件内部。它不依赖外部资源或阅读器系统的配置。
为什么需要归档标准?
想象一下,您今天在电脑上保存了一个 PDF 文档。该 PDF 使用了安装在您系统上的特殊字体。20 年后,当有人需要打开该文档时,那个操作系统可能已经不存在,那种字体也将不可用。文档可能看起来完全不同,甚至无法正确打开。
PDF/A 通过强制要求重现文档所需的一切都在文件本身内部来避免这个问题。就像将文档密封在数字时间胶囊中一样。
PDF/A 类型:应该使用哪种?
| 版本 | ISO 标准 | 主要特点 | 推荐用途 |
|---|---|---|---|
| PDF/A-1b | ISO 19005-1 | 保证视觉外观。基础级别。 | 简单文件:合同、报告 |
| PDF/A-1a | ISO 19005-1 | 与 1b 相同 + 逻辑结构和无障碍(标签) | 需要无障碍的文档 |
| PDF/A-2b | ISO 19005-2 | 与 1b 相同 + 支持 JPEG 2000、透明度、图层 | 含复杂图像或图层的文档 |
| PDF/A-2a | ISO 19005-2 | 与 2b 相同 + 逻辑结构和无障碍 | 复杂设计的无障碍归档文件 |
| PDF/A-3b | ISO 19005-3 | 与 2b 相同 + 允许附加任何格式的文件 | 电子发票(ZUGFeRD、Factur-X) |
| PDF/A-4 | ISO 19005-4 | 最新版本(2020),基于 PDF 2.0 | 未来归档和现代系统 |
对于大多数情况:PDF/A-1b 足以归档标准文字和图像文档。如果您在欧洲处理电子发票,请使用 PDF/A-3b,这是 Factur-X 的基础格式。
PDF/A 中禁止什么?
为确保长期可重现性,PDF/A 禁止依赖外部系统的某些元素:
- 加密:PDF/A 不能用密码保护(加密可能使其在未来无法读取)
- JavaScript:禁止动态脚本
- 嵌入音频和视频:在基础版本中不允许多媒体
- 外部字体:所有字体必须嵌入文件中
- 设备相关颜色:只允许标准和校准颜色空间
- 外部资源引用:不能存在作为内容一部分的外部文件或 URL 链接
- 透明度(在 PDF/A-1 中):归档前必须扁平化透明度
谁需要使用 PDF/A?
公共行政和政府机构
大多数欧洲政府要求以 PDF/A 格式提交官方数字文件。欧盟、德国政府(使用 XRechnung 标准)以及许多政府机构明确要求 PDF/A 以确保对公共记录的长期访问。
法律和公证行业
需要保存数十年或数百年的合同、契约、遗嘱和公证文件以 PDF/A 格式归档,以确保未来的可读性。
金融和银行业
银行和金融机构有义务保存多年的交易记录。PDF/A 确保这些记录在未来可访问且真实可信。
数字档案馆和图书馆
文献遗产数字化项目(书籍、手稿、历史地图)使用 PDF/A 确保长期保存。
有合规义务的企业
制药、食品、航空和制造业等行业受到法规(ISO、FDA、EASA)约束,要求以经过验证的保存格式归档技术文件。
如何将普通 PDF 转换为 PDF/A
- 访问工具:前往 PDF 转 PDF/A。
- 上传 PDF:将文件拖入或从设备中选择。
- 选择版本:选择 PDF/A-1b 获得最大兼容性,或者如果您的文档使用透明度或 JPEG 2000,则选择 PDF/A-2b。
- 转换:工具嵌入字体,调整颜色配置文件,删除不合规元素,并生成经过验证的 PDF/A。
- 下载并验证:下载生成的 PDF/A。您可以使用 veraPDF 等工具验证合规性。
如何验证 PDF 是否真正符合 PDF/A 标准?
仅更改扩展名或声称 PDF 是 PDF/A 是不够的。必须验证合规性。有几种方法:
- Adobe Acrobat Pro:包含内置 PDF/A 验证器
- veraPDF:PDF/A 验证的参考开源工具
- pdfforge 的 PDFTools:验证并生成合规报告
- 文件元数据:PDF/A 包含声明其合规版本的 XMP 元数据
PDF/A vs PDF/UA vs PDF/X
还有其他针对特定目的的 PDF 标准子集:
- PDF/A:用于长期数字归档
- PDF/UA:用于通用无障碍(Universal Accessibility)— 面向残障人士的文档
- PDF/X:用于专业印前和印刷交换
- PDF/E:用于工程文档