PDF/A:歸檔(archival)的文件格式之王

以往電子化不流行的時候,企業、政府機關每年生產出的鉅量紙本文件都需要找倉儲空間歸檔;待電子文件興起,大家轉用電子方式歸檔,雖然能節省大量的空間和人力,但也讓另一個問題逐漸浮上檯面:如何讓一份電子文件在數十年後依然能開啟、讀取?

任何一位長年使用電腦的工作者,可能都遭遇過無法開啟舊資料的窘境。舉例來說,大家最熟知的Microsoft Word從97、2003、2007再一路到如今的2016,歷經這麼多的版本,有時候太舊版的文件可能就無法以新版軟體正常開啟;或是我們來看另一個例子,數十年前用WordPerfect建立的檔案,一樣會無法用新版軟體讀取。

如果您的組織需要歸檔數以千計、萬計甚至百萬計的文件,檔案格式就是個學問了。簡單來說,它應該符合以下準則:

  • 忠實保存文件的原貌
  • 能保留註解說明
  • 可獨立於開發者和作業系統之外 (不受版本限制)
  • 檢視文件不需要額外手段
  • 支援搜尋功能
綜合以上所述,PDF格式大致符合需求。國外一些大型機關,例如美國政府的IRS,更進一步需要確保資料在百年之後仍然能正常開啟、處理,因此PDF之上又生出了一套規範:PDF/A。這套規範由ISO組織監管,定義於ISO 19005標準之中。

創立PDF/A(ISO 19005)的原因有三:

  1. 主要原因:以PDF格式為基底定義一個文件格式(PDF/A),提供一個能長期保存電子文件靜態視覺外觀的機制,且獨立於用以建立、儲存或轉譯文件的工具或系統。
  2. 為符合規範的電子文件定義一個支援邏輯結構以及其他語義資訊的框架。
  3. 為符合規範的電子文件提供能以中繼資料記錄文章脈絡和歷史資訊的框架。
PDF/A另有數個延伸格式,例如ISO 19005-1 (PDF/A-1)、ISO 19005-2 (PDF/A-2)、ISO 19005-3 (PDF/A-3),各有各的特色,就等到下一篇再說吧!


0 意見: