跳至內容
主選單
主選單
移至側邊欄
隱藏
導覽
首頁
近期變更
隨機頁面
MediaWiki說明
Taiwan Tongues 客語維基
搜尋
搜尋
外觀
建立帳號
登入
個人工具
建立帳號
登入
檢視 PDF 的原始碼
頁面
討論
臺灣正體
閱讀
檢視原始碼
檢視歷史
工具
工具
移至側邊欄
隱藏
操作
閱讀
檢視原始碼
檢視歷史
一般
連結至此的頁面
相關變更
特殊頁面
頁面資訊
外觀
移至側邊欄
隱藏
←
PDF
由於以下原因,您無權編輯此頁面:
您請求的操作只有這些群組的使用者能使用:
使用者
、taigi-reviewer、apibot
您可以檢視並複製此頁面的原始碼。
'''做得同式文件个格式合作'''(英語:'''P'''ortable'''D'''ocument'''F'''ormat,縮寫:'''PDF''')係一種用獨立於應用个程式、硬體、操作系統个方式來表現文件个檔案格式。逐個 PDF 檔案包含固定布局个平面文件完整描述,包含著有文字、字形、圖形還有其他需要顯示个資訊。PDF 檔案除了平面个文字摎圖形之外,還可能包括邏輯結構元素, 注解、表單、圖層、富媒體(包含影片內容)這類互動个元素,使用 U 三 D 抑係 PRC 三維物件,還有幾下種其他資料內容。PDF 規範還提供吔啟用這兜功能个時節所需要个加密功能、數位簽章、文件附件个銀資料這兜。 PDF 係對一九九一年來个 Adobe Systems 共同創造人約翰 ・ 沃諾克發起來个「Camelot 專案」。 二零零八年成為 ISO 標準个一部分,編號 ISO 三股二千零,最新个版本 ISO 三章二千九百二十二 : 二千空二十在二零二零年十二月發布。 ==歷史== Adobe Systems 在一九九三年免費提供吔 PDF 規範, 該央時同 PDF 共下競爭跨平台文件格式个,還包含 DjVu(還在開發當中)、 Envoy、Common Ground Digital Paper、Farallon Replica 過Adobe 自家本身个 PostScript(. ps)格式。在全球資訊網還有 HTML 文字吂起時,PDF 在桌面出版工作流技術當中盡受歡迎。PDF 一開始係 Adobe 所控制个專有格式,一直到二零零八年七月初一正分官方以開放標準發行,還過由國際標準化組織以 ISO 三面書二千九百五十二 : 二千空八發布。下後,標準个控制權便移轉到了產業專家志願者所組个 ISO 委員會底下。二零零八年,Adobe 在 ISO 三章兩千九百五十二發佈吔公共專利个許可,對製作、使用、銷售摎發佈 PDF 相容个應用需要个專利,總下分買斷式授權。 PDF 一千擔七百二十二 Adobe 所定義个專有技術,像係 Adobe XML 表單結構(XFA)摎 JavaScript 中對 Acrobat 个擴充。這兜技術分 ISO 三千兩百零角仔一參照為著對這個規範完整實現做毋得無還過規範性个,但係佢兜並無分標準化,佢規格也只有發佈在 Adobe 个網站項。這兜技術大部分也無分人熱門个啦 PDF 第三方實現支援。二零一七年七月二十八日,公布吔 ISO 三章二千九百二十二 : 二千空一十七(PDF 二側零)。 ISO 三面書二千七百二十二間無用任何个專門做理由係規範性參照檔案。 二零二零年十二月十四號,發布吔 ISO 三章二千九百二十二 : 二千空二十(PDF 二側零)。 在二千空一十七版本个基礎上包括了對規範性參照个澄清、更正以及其他个一兜重要个更新。 ==技術基礎== PDF 檔案一般由向量圖形、文字摎點陣圖形構成。 PDF 主要係由三項技術組成: * 產生自家 PostScript 頁面描寫語言个子集,用生成同輸出圖形。 * 字型嵌入來 / 替換系統,做得使字型隨時檔案共下傳輸。 * 結構化个儲存系統,用來䌈定這兜元素同任何相關內容到單個檔案,帶有適當个資料壓縮系統。 ===PostScript=== PostScript 係一種執行在直譯器以生成圖像个頁面描述語言,一個需要大量資源个行程。毋單淨做得處理圖形,也具有 ` if ` 過 ` loop ` 之類命令个標準程式語言个特性。PDF 當大程度上基於 PostScript,毋過做了簡化,來移除像恁樣个流控制特性,還保持等 ` lineto ` 這類个圖形命令。 一般,類 PostScript 个 PDF 代碼產生在 PostScript原始檔。以 PostScript 代碼輸出个圖形命令分人收集還過標記;其中文件參與个任何檔案圖像或者係字型也分人收集,還過每一件都分人壓縮做單個檔案。由這部分,歸隻仔 PostScript 領過域(字型、輸出、計量)做得保持完整。 做一隻文件个格式,PDF 相比較 PostScript 有兜仔優勢: * PDF 包含已經標記摎解析个 PostScript 原始碼,以在修改 PDF 頁面講著中國个項摎修改所產生个頁面造型之間直接保持共樣。 * PDF(對一千擔四百空二版)支援真圖形透明度;PostScript 毋支援。 * PostScript 係一種帶有隱形全域狀態个直譯語言,故所佢就跈等一頁个指令做得任何後續頁面个表現。故所,PostScript 文件肚項所有先前个頁面必須經過處理以決定所分出來个頁面个正確表現,還過 PDF 文件肚項个每一頁毋會受著其他因素个影響。結果 PDF 檢視器做得分使用者當遽跳轉到長文件个盡尾一頁,啊一個 PostScript 檢視器需要在做得顯示目標頁面前繼續處理所有个頁面(除忒做得選 PostScript 文件結構規範已經分周密个遵守外)。 PDF 一千五百二十六還過高版本个支援嵌入 PDF 檔案个互動式三 D 文件,做得用 U 三 D、PRC 抑其他各種三 D 格式嵌入去三 D 圖像。 ==技術概概有== ===檔案結構=== PDF 檔案係 COS(" Carousel " Object Structure,Carousel 物件結構)格式个子集。COS 乜跈等欸 FDF 檔案。COS 樹檔案主要係由物件組成,其中有八種類型: * 布林值,表示 true 抑係 false * 數字 * 字串 * 名稱 * 陣列,物件个指令性集合 * 字典,按名稱索引物件个集合 * 字串流,一般包含大量資料 * 空物件物件做得係直接(嵌入其他物件)抑係講非直接。直接个物件係用物件號抑係代號編號。安到 xref 表个索引表賦予每一隻物件從檔案開頭起勢个位元組偏移量。這一設計允准有效个隨機存取著檔案當中个物件,還允准無需要再過寫歸個檔案(增量更新)就算得出細義改動。從 PDF 一千五百版開始,毋係直接个物件也可位在安到「 物件流」个字串流肚。這一增加檔案大細个技術有大量細个非直接物件,也對置標 PDF 特別有效呢。 PDF 檔案有兩種輸出个方式:非線性(非「最佳化」)摎線性(「 最佳化」)。 非線性PDF 檔案比線性个占用還較細个硬碟空間,就算因為一部分个資料要求文件裡背个集合頁面通過 PDF 檔案分散開來存取更加慢。線性 PDF 檔案(乜講「最佳化」抑係「web 最佳化」PDF 檔案)以使得網頁瀏覽器外掛程式無需要等待下載歸個檔案來閱讀个方式構建,自從佢兜用線性方式寫入硬碟(就像頁面順序)開始。PDF 檔案做得使用 Adobe Acrobat 軟體抑係 QPDF 最佳化。 ===圖像模式=== 圖形在 PDF 中呈現个基本設計係用非常相像 PostScript 中个方式啦,除忒 PDF 一千八百五十四增添个透明度个使用。 PDF 圖形使用裝置獨立性笛卡兒坐標系來描寫頁面个外觀。一個 PDF 頁面描寫做得使用矩陣來縮放、轉還係毋著切圖形元素。PDF 中个一個主要概念係圖形狀態,斯可能會通過頁面講出修改、儲存抑係還原个圖形參數个集合。PDF 有(就像一千擔六百空版)二十四種圖形狀態算係性个,其中最重要个有: * 當前變換矩陣(CTM), 決定坐標系 * 剪下路徑 * 色彩空間 * 阿爾法複合,透明度个關鍵部分====向量圖==== PDF 中个向量圖就像在 PostScript 當中共樣,係用路徑組成个。路徑一般由直線摎幾下項个貝茲曲線組成,毋過乜做得從文字个外廓構建。無共樣 PostScript,PDF 做毋得帶直線摎曲線个單一路徑去組合文字外廓。路徑做得描寫、或者係用來剪取。描繪摎填充做得用任意圖形仔當中个色彩集,包含式樣。 PDF 支援幾下種調色个盤類型。最簡單个係瓷磚式个樣仔,其中藝術作品个一部分指定用分人重複个畫圖。這可能係彩色个瓷磚式,帶有在式樣物件當中个指定个色,抑係展後色別編碼到式樣已經畫好个時節無色情个瓷磚樣仔。從 PDF 一. 三開始還有了底紋式樣,連續畫無共樣个色目。7種底紋式樣當中最簡單个係軸向底紋(Type 二)還有路向底紋(Type 三)。 ====點陣圖==== PDF 中个點陣圖(稱作 Image XObjects)由帶相關个字串流个字典呈現。字典描寫了圖像个屬性摎包含圖像資料个流。(少見个係,點陣圖或者係許會用作為一隻內嵌圖像分直接嵌入在頁面描寫。)圖像一般出於壓縮个目的過濾。PDF 中支援个圖像過濾器包含吔常用个過濾器 *'''ASCII 八十五 Decode'''用在摎字串流放到七位 ASCII 个過濾器 *'''ASCIIHexDecode'''像係 ASCII 八十五 Decode,毋過相容性低 *'''FlateDecode'''因為 RFC 一千九百五十及 RFC 一千九百五十一間定義的 zlib / deflate演算法(也就係 gzip,毋過毋係 zip)个時常用過濾器;引入於 PDF 一千擔二百空二;做得用兩組預測功能當中个一組來進一步相容 zlib / deflate 演算法:出自 TIFF 六千五百空規格中个 Predictor 二和來自 PNG 規格(RFC 二千空八十三)个預測器(過濾器) *'''LZWDecode'''因為 LZW 演算法个過濾器做得用兩組預測功能當中个一組進一步相容 LZW 縮減:出自 TIFF 六千五百空規格當中个 Predictor 二和來自 PNG 規格个預測器(過濾器) *'''RunLengthDecode'''使用遊程編碼演算法同圖像指定个過濾器个用來帶重複資料个字串流个簡單个壓縮演算法 *'''DCTDecode'''因為 JPEG 標準个有損過濾器 *'''CCITTFaxDecode'''因為 ITU-T T . 四和 T . 六中定義个 Group 三抑係 Group 四 CCITT(ITU-T)傳真壓縮標準个無失真二值(烏白)過濾器 *'''JBIG 二 Decode'''因為 JBIG 第二標準个有損抑係無失真二值(烏白)過濾器,引入 PDF 一千四百五十 *'''JPXDecode'''因為 JPEG 二千標準个有損抑係無失真過濾器,引入 PDF 一千五百樣 PDF 中包含个所有圖像嵌入到圖像,毋過 PDF 做得分圖像資料通過使用外部字串流抑係替代圖像儲存到外部个檔案。PDF 个標準子集,包含 PDF / A 摎 PDF / X,禁止這兜特性。 ====文字==== 文字在 PDF 中以頁面內容字串流中个「文字元素」呈現出來。一隻文字元素指定字元應當在指定位仔描繪。字元用所選字型源个編碼指定。=====字型===== PDF 中个字型物件係對數位字型个描寫。可能係字型裡背个字元个描寫,或者係包含嵌入个字型檔案。擱來喊嵌入字型,前者喊非嵌入字型。所嵌入个字型檔案因為大體較闊用个標準數位字型檔案:'''Type 一'''(摎佢壓縮版變種'''CFF''')、'''TrueType'''摎(自家 PDF 一千八百五十六版起勢)'''OpenType'''。另外PDF 支援由 PDF 圖形處理器在講个字型組件裡背个'''Type 三'''變種。 =====Standard Type 一字型(Standard 十四字型)=====以 Standard 十四種字型講係个四種字在文件肚項 PDF 有特別个意義呢: * Times(v 三,常規、斜體、粗體摎粗斜體) * Courier(常規、斜體、粗體摎粗斜體) * Helvetica(v 三,常規、偽斜體、粗體摎粗斜斜體) * Symbol / Zapf Dingbats 這兜字型有時稱作 Base 十四字型。這兜字型抑係無共樣度量異適合个替代字型,定著愛用在所有个 PDF 閱讀器頂項,還過毋使嵌入去 PDF。PDF 檢視器必須掌握這兜字型度量。係無字型無嵌入來 PDF 就可能會分人換忒。 =====編碼=====文字串肚項,字元用編碼對映字形在當前字型个字元代碼(整數)顯示。預定義个編碼有當多種,包含 WinAnsi、MacRoman,還有大量東亞語言編碼,還過這字型做得有自家个編碼。(就係使 WinAnsi 摎 MacRoman 編碼取自 Windows 摎 Macintosh 作業系統肚个歷史上專有編碼,用這類編碼个內容在任何平台項都執行个好。)PDF 做得指定做得來使用个預定義个編碼、字型肚个建編碼,或者提供預定義或者內建編碼个查詢表(毋著 TrueType 字型推薦)。 PDF 當中个編碼機制係為 Type 一隻字型設計个,還過應用著 TrueType 字型个規則係複合个。 對於大型字型或者帶非標準字形个字型,特殊个編碼 Identity-H(用於橫寫)抑係 Identity-V(用於豎寫)分人使用。假使有關字元个語意資訊分人預定義,這類字型有必要个提供 ToUnicode 表。 ====透明度==== PDF 个原始圖像模型像 PostScript 个 opaque:頁面項寫个東西完全替換先前在共隻位仔標記个任何東西。在 PDF 一千八百五十二年四中度圖像模型分人擴大希望透明度。使用透明度个時節,新物件摎先前標記个物件相互作用來產生混合个特效。透明度增加到 PDF 由寫著 PDF 一 .第三摎早期个規格个產品當中分人忽略設計个新个擴充方法完成。結果,使用少量透明度个檔案在舊个檢視器當中可能會分人接受地視圖檢視,毋過大量用透明度个檔案在舊个檢視器裡背會顯示無正確又無警告。透明度擴大基於透明度組、混合模式、形仔摎 alpha 个關鍵概念。這一模式密對應 Adobe Illustrator 九个特性。混合模式因為該央時 Adobe Photoshop所用个。PDF 一千七百五十二年出版个時節,用來算混合模式个公式分人 Adobe 保密。下後佢兜分人公布。 PDF 規格當中透明度組个概念獨立於 Adobe Illustrator 之類个應用當中已經有个「組」抑係「層」个概念。該兜反映物件以上个邏輯關係个分組在編輯該兜物件个時節有意義,毋過毋係圖像模型个一部分。 ===互動式元素=== PDF 檔案可能包含注釋、表單、影片還過 Flash 動畫這兜互動式个元素。 '''富媒體 PDF'''係一個用來描述可以嵌入或者鏈入 PDF 个互動式內容个術語。這一內容愛用 Flash 檔案格式提供。Adobe 收購 Macromedia 个時節,公司个主業係 Flash,還過 Flash 播放器分嵌入去 Adobe Acrobat,Adobe Reader,移除了用於 Flash、 QuickTime 抑係 Windows Media 第三方外掛程式个需要。不幸个係,這造成 QuickTime 影片從 PDF 禁止恁樣摎蘋果公司个裂痕。富媒體專家 Robert Connolly 𠊎相信這一件事件引起了蘋果摎 Adobe 之間 Flash iPhone / iPad 爭論之上个衝突。富媒體 PDF 就無在蘋果个呢 iPad 這兜 iOS 裝置項操作,還過互動性受著限制。 '''互動式表單'''係一個添加表單到 PDF 檔案格式个機制。 PDF 當前支援用在整合資料摎 PDF 表單个兩種無共樣个辦法。兩種格式今晡日也有放PDF 規格: *'''AcroForms'''(又安到'''Acrobat forms''')引入 PDF 一千五百二十二格式个規格並包含著有所有後來个 PDF 規格。 *'''Adobe XML 表單架構(XFA)'''个表單,引入 PDF 一千五百七十二個格式个規格。XFA 規格無包含過 PDF 規格,單淨作為可選特性參考。Adobe XFA 表單毋摎 AcroForms 相容。 ====AcroForms==== AcroForms 於 PDF 一千七百二十二隻格式分人引入。AcroForms 准用物件(像文字方塊、選擇鈕這兜)還過一兜代碼(像係 JavaScript)。 在標準 PDF 動作類型之外,互動式个形式(AcroForms)支援提交、重設同匯入資料。「提交」動作傳送所選表單欄位摎值个名稱分指定个統一資源定為符( URL)。 互動式表單欄位名稱摎值可能會分人用任意格式提交(就愛看輸出个格式、提交个 PDF 摎 XFDF 旗標个設定): * HTML 表單格式(自家 PDF 一千五百空二 HTML四千五百空一規格;一千兩百五十二件用 HTML 二側零) * 表單資料格式(Forms Data Format,FDF) * XML 表單資料格式(XML Forms Data Format,XFDF)(擴大 XFDF 規格,二十五月初六;自家 PDF 一千五百空八件分人支援;在 PDF 一千七百五十二年為著換 XML 表單提交格式定義) * PDF(歸隻文件做得分人提交,毋係單獨个欄位摎值)。(PDF 一千七百五十二間定義) AcroForms 做得保持表單欄在包含 key : value 組合个外部个單獨个檔案。內部个檔案可能會使用 FDF 摎 XFDF 檔案。使用權(UR)簽章定義匯入表單資料檔案以 FDF、XFDF 摎文字(CSV / TSV)格式,過以 FDF 過 XFDF 格式從資料檔案匯出檔案个權利。 =====表單資料格式(FDF)===== 表單資料格式(Forms Data Format,FDF)因為 PDF,使用共樣个句法摎基本上共樣个檔案結構,毋過比 PDF 簡單,自從 FDF 文件个主體係單淨一個個要求个物件組成開始。表單資料格式定義於 PDF 規格(自家 PDF 一千擔二百空五)。 表單資料格式可以在表單資料到伺服器、接收回應摎組合到互動式表單仔時節分人使用。還做得用來匯出表單个資料到做得分人帶轉來相應个 PDF 互動式表單獨个檔案。從 PDF 一千五百二十三開始,FDF 做得分人用來定義用來應用个 PDF 文件分開个注意个容器。FDF 一般封裝 X . 五百空九憑證之類个資訊、要求憑證、設定目錄、設定時間揰伺服器還有為網路傳輸嵌入 PDF 檔案。FDF 使用 MIME 內容類型 application / vnd . fdf、副檔名 . fdf,並在 MacOS 使用檔案類型'FDF'。匯入摎匯出獨立 FDF 檔案个支援並無分自由抑係講免費 PDF 軟體廣泛个實現。比將講,Evince、Okular、Poppler、KPDF 抑係 Sumatra PDF 沒有匯入 / 匯出个支援,毋過,Evince、Okular 摎 Popller 填入 PDF Acroforms 並在 PDF 中儲存已經寫資料。匯入著獨立 FDF檔案个支援在 Adobe Reader 中得著實現;匯入摎匯出支援(包括在 PDF 中儲存 FDF 資料)拿來做例仔在 Foxit Reader 摎 PDF-XChange Viewer Free 中得著實現;PDF 檔案當中 FDF 資料个儲存也分 pdftk 支援。 =====XML 表單資料格式(XFDF)===== XML 表單資料格式(XFDF,XML Forms Data Format)係表單資料格式个 XML 版本,毋過 XFDF 淨執行 FDF 內含表單摎注釋个子集。FDF 字典當中个一兜詞條無就在該價 XFDF 个,像係狀態、編碼、JavaScript、頁面關鍵字、嵌入式 FDF、差異摎目標。另外,XFDF 不准在基於已經分定个資料个新頁面大量生成或者添加;就像使用 FDF 檔案个時節做得分人完成个一樣仔。XFDF 規格分人翕著(毋過無包含於)PDF 一千五百二十五隻規格(摎下二擺个版本)。 佢分人單獨描寫為「XML 表單資料結構規格」(XML Forms Data Format Specification)。 PDF 一千五百七十二年个規格做得 XML 格式提交表單,毋過在 PDF 一千五百二十二個規格當中用 XFDF 格式提交取代。XFDF 符合 XML 標準。 到二零一六年十二月,XFDF 三千空在 _ ISO 一千四百四十四十四間 : 二千空一十六–Document management–XML Forms Data Format–Part 一 : Use of ISO 三章二千九百二十二 ( XFDF 三章零 ) _ 个名義下成為 ISO / IEC 標準。這標準係 ISO 三面書二千九百二十二个規範性參考資料。 XFDF 做得用還有 FDF相等个方式,假使提交表單資料分伺服器,做出修訂,再倒轉去,還過新表單資料匯入到互動式表單裡背肚。佢還可以用來匯出表單資料到能夠分人導轉到相應个 PDF 互動式表單獨个檔案。 ====Adobe XML 表單架構(XFA)==== PDF 一千五百五十二個格式當中,Adobe Systems 引入了新个、專有个表單格式,名仔安到 Adobe XML 表單架構(XFA)。 XFA二千七百五十二參照在 PDF 一千五百二十五隻規格(還有以後个版本), 毋過單獨講係《Adobe XML Forms Architecture ( XFA ) Specification》,有隻版本。XFA 規格無包括在 ISO 三面書二千九百五十二 PDF 一千七百空二日單淨作為理由 Adobe 建立个外部專門有規格參照。在 ISO 三章二千九百二十二(PDF 二側零)係講分人棄用。 Adobe XFA 表單毋摎 AcroForms 相容。Adobe Reader 包含使用 XFA 表單个「禁用个特性」,淨在打開來自 Adobe 个可行个技術建立个 PDF 文件个時節啟用。XFA Forms 無相容於 Adobe Reader 六頭擺个版本。 XFA 表單做得建立或者係用作 PDF 檔案還係作為 XDP(XML 封包)檔案。PDF 中 XFA 源个格式由 XML 封包規格係在講。XDP 可能做一隻獨个文件,乜可能在 PDF 文件个內部帶來。XDP 提供打包周邊 XML 容器內部个表單組件个機制。XDP 乜做得打包一隻 PDF檔案,伴隨 XML 表單摎模板資料。PDF 可能包含 XFA(在 XDP 格式當中), XFA 也可能包含 PDF。係用來喔 XFA 表單 XFA(XML 表單架構)語法從一個應用徙到另外一個應用个時節,佢兜定著愛 XML 封包封裝。 當 PDF 摎 XFA 結合到共下,結果係儘採頁面个 XFA 表單覆等吔 PDF 背景。這臺構有成時分人提作 XFAF(XFA Foreground,XFA 前景)。 替代方法係直接在 XFA(毋使 PDF,或者單淨用帶有 PDF 標記个最細構造 XFA 个容器个啊「外掛 PDF」,抑係用靜態 XFA 表單个預彩現描講著就係 PDF)展開所有个表單,包含樣板檔案。這有成時分人喊做全 XFA。 PDF 一千五百空二,可變文字欄位个文字內容,摎標記註解可能包含格式資訊(樣式資訊)。 這兜富文字串係符合XML 表單架構規格二千七百空二(本身係 XHTML 一千五百空規格个子集)定義个富文字慣例个 XML 文件,有擴大哩 CSS 二樣式屬性當中受限个設定。PDF 一千擔六百空八,PDF 支援XML 表單架構(XFA)規格兩千五百二十二定義个富文字元素摎屬性。PDF 一千七百空二,PDF 支援 XML 表單架構(XFA)規格兩千五百七十四定義个富文字元素摎屬性。 大部分 PDF處理器毋處理 XFA 內容。生成外掛 PDF 个時節會分人建議包含在 PDF 標記个一個簡單个單頁 PDF 圖像顯示警告(像係:「 為著愛看著本文件个全部內容,你需要新版 PDF 檢視器」 等。)彩現 XFA 內容个 PDF 處理器應該毋現實警示頁面圖像或者係動態表單裡背都遽遽換忒。帶有兜仔 XFA 彩現功能支援个 PDF 軟體个例仔包含 Adobe Readerfor Windows、Linux、Mac OS X(毋過毋係 Adobe Reader Mobile for Android / iOS)抑係 Nuance PDF Reader。===邏輯架構摎可讀性=== 「 標籤」PDF(ISO 三面書二千九百五十二 : 二千空八十四角八)係包含有文件架構還有語意資訊,希望做得倚恃个文字抽取還有使用。技術上來講,標籤 PDF 係建立到PDF 一千五百五十三間引入个邏輯結構框架頂項,針對厥格式个程式化使用。標籤 PDF 定義了一組標準个結構型別摎屬性,允准頁面內容(文字、圖形還有圖片)下後分人提取還過再利用在其他用途。 當PDF 檔案淨提供印時,毋使要求支援標籤 PDF。故所一个特色係毋係必須个,還過 ISO 三面書二千裁一對標籤 PDF 个規則相對濛,故所在消費性裝置當中,包含輔助技術(AT),標籤 PDF 个支援參與差毋多。 一個專門針對可讀性、為 ISO 標準之子集个 PDF 規格:PDF / UA 在二零一二年第一擺發佈。 ===安全摎簽章=== 一份 PDF 檔案可能用在驗證个擔保或者數位簽章加密。 由 Acrobat PDF 提供个標準擔保以兩種無共樣个方法摎兩種無共樣个密碼組成,使用者密碼,除了加密檔案乜擋下來;所有个密碼,指定就算文件分人解密个時節應該分人限制个操作,做得包括:列印、從文件複製文字摎圖像、修飾文件,或者添加或者刪除文字注釋摎 AcroForm 欄位。使用者密碼(控制開啟)加密檔案並要求密碼破解以去除,難度取決在密碼長度還有加密演算法—— 佢可能係非常安全(假使好个密碼同加密演算法無已經知个攻擊手法)。 所有个密碼(控制操作)毋使密檔案,相反取決在客戶端軟體來遵循這兜限制,還毋安全。 所有个密碼做得分當多用得著个 PDF 破解軟體移除,包括一兜自由个線上服務。由這部分,文件作者放在 PDF 文件當中个使用限制無安全,還過做毋得在一旦个檔案分人散布時;這一危險在使用Adobe Acrobat 軟體來建立抑係講編輯 PDF 檔案應用這類限制个時節顯現出來。 就算無徙除密碼,當多毋使錢或者係開源 PDF 閱讀器忽略權限「保護」還過允准使用者列印或者做文字摘要个複製,就像文件無分密碼保護限制共樣。 一息解決方案像 Adobe 个 LiveCycle Rights Management 更強化資訊權利管理个方式,毋單淨做得限制麼人做得打開文件,還過用標準个安全處理程式做毋著个方式做得靠个執行權限。 ====使用權==== 從 PDF 一千擔五百空二,使用權(UR)簽章用來啟用在一兜仔 PDF 檢視器應用當中毋係預設个附加个互動式个特性。這一簽章用來驗證由真實个授權機構賦予个許可。比將講,佢做得准使用者: * 儲存伴有修訂表單摎 / 抑注釋資料个 PDF 文件 * 從 FDF、XFDF 摎文字(CSV/ TSV)格式當中个資料檔案匯入 * 從 FDF 摎 XFDF 格式當中个資料檔案匯出 * 對資料提交 * 對安名个頁面模板具體呈現新頁面 * 應用一隻數位簽章到已經有个數位簽章表單欄位* 建立、刪除、修正、複製、匯入、匯出注意像係,Adobe Systems 在 Adobe Reader 中授權啟用附加个特性,使用公鎖密碼學。Adobe Reader 使用從一個 Adobe 授權个權威認證个驗證該隻簽章。PDF 一千五百二十二年來講其他無共樣 PDF 閱讀器應用做得為佢兜自家个目的自由使用這共樣个機制。 ===檔案附件=== PDF 檔案可以以有文件等級摎頁面級个檔案附件,讀者做得存在還過打開抑係儲存原生个檔案系統。PDF 附件做得準做範例用 pdftk 加到已已已經有个 PDF 檔案。Adobe Reader 提供對附件个支援,還過還過基於 Poppler 个閱讀器斯像 Evince 抑係 Okular 也有對文件級附件个支援。 ===元資料=== PDF 檔案可以包含兩種類型个元資料。第一種係文件資訊字典,一套像作者、標題、主題、建立摎更新日期个關鍵字 / 值欄位。這儲存於做得選个檔案尾部。有一小組欄位係有定義个,還過係有需要,做得用附加个文字欄位增加。 後來在 PDF 一千擔,著元資料流个支援分人加入,用可延伸元資料平台(XMP)來添加像在其他檔案格式恁樣个因為 XML 標準个做得延伸个元資料。這允准元資料附加到文件裡肚个任何字串流,像人个崁入式插圖个說明,以還過歸隻文件(附加到文件目錄), 使用可延伸个綱要。 ==相關个技術== ===Mars=== Adobe 識探索因為 XML 个下一代 PDF,代號 Mars。 Mars 个圖形元素个格式有成時簡單个描寫為 SVG,毋過照二零零七年十一月个零八版草案規格(§ 三 Mars SVG Support)淨係接近 SVG:佢同時包含SVG 新增加同徙除个部分,故所一般做毋得分標準 SVG 工具檢視或者建立:一息東西在 SVG 檢視器還過 Mars 檢視器之間看起來明顯無共樣。 Adobe Systems 在二千空八年視年停止開發 Mars。 ==技術問題== ===掃描个文件=== 由掃描器硬拷貝文件建立个 PDF 檔案包含原始文字無由共樣个文件直接建立个 PDF 檔案恁樣相同个架構。掃描个文件原旦地包含文件个圖片,無關於文字个資訊。淨愛使用者做得看著佢淨係另外一個嗬 PDF 檔案,帶有從其他任意地方來个無法度區分个名稱摎副檔名;好个掃描器無定著會準確實做摎原生个PDF 檔案相同,就算係視覺上品質當毋好个檔案,輒常帶有扭彎仔个頁面,行出了佢本性。毋過,檔案大細會明顯無共樣,還過做毋得搜尋文字。對於精確品質个掃描做得用帶光學字來辨識(OCR)堵好合適个軟體辨識文件當中个文字,擱有嵌入文件內底分佢會用檢索,就愛看 OCR 个準確性。 ===可讀性=== PDF 檔案使得專門為著分殘疾人閱讀來建立。截至二零一四年 ( 二千空一十四 -Missing required parameter 一=_ month _ ! ) PDF 檔案格式在使用當中做得包含標籤(XML)、 為換文字、標題、音訊描述這兜。置標 PDF 在 PDF / A 重點一千八百空二a 規格當中分人要求。一兜軟體做得自動生成置標 PDF,毋過這個特性不被預設啟用。輒常看著个螢幕閱讀器,包含 JAWS、Window-Eyes、Hal 摎 Kurzweil 一千及三零可以朗讀置標 PDF,就像 Acrobat 摎 Acrobat Reader 後來个版本共樣。另外,置標 PDF 做得為有視覺障礙个讀者重排放大。問題還係有分舊版 PDF還有對掃描个文件有生成个 PDF 加標記。這兜情形下,可讀性標記摎重排就做毋得用,還過必須愛手動或者係用 OCR 技術處理。這兜過程對於一兜殘疾病人係達毋到个。 著 PDF 可讀性个一個重大挑戰係 PDF 這文件有三種無共樣个視圖,就愛看文件个建立,會摎其他視圖相矛盾。這兜視圖有啦:物理視圖、標記視圖摎內容視圖。物理視圖做得顯示摎列印(大體人都認為个 PDF 文件)。 標記視圖係螢幕閱讀器還有其他存取技術用來分有障礙个使用者帶來高品質導航同閱讀體驗个。內容視圖 PDF 內容字串流當中个物件个物理排列仔,也可能由毋完全支援標記視圖个軟體顯示,像係 AdobeReader 个 Reflow 特性。 因為 ISO 三章兩千九百五十二間个可閱讀 PDF 國際標準 PDF / UA 在二零一二年以 ISO 一千兩百八十九九十二一發布,乜為使得閱讀 PDF 技術建立規範个語言。 ===病毒同漏空=== PDF 附件帶病毒最先發現在二零零一年。這種名仔安到 OUTLOOK . PDFWorm 抑係 Peachy 个病毒,會通過 Microsoft Outlook 以附件个形式將自家傳送到 Adobe PDF 檔案。過仔會用 Adobe Acrobat 將自身个啟用,毋過毋會分 Acrobat Reader 啟用。跈等時間緊過,新个漏空在 Adobe Reader 个當多隻版本分人發現,促使企業發出安全性修復。其他 PDF 閱讀器乜容易受著影響。一隻惡化个因素係 PDF 閱讀器會分人組態在網頁嵌入來 PDF 時節自動啟動,為攻擊帶來了載體。假使惡意个網頁包含一份利用 PDF 个漏空感染个 PDF 檔案,系統會無法度抵抗,就算瀏覽器係安全个。其中一息仔漏空係因為 PDF 標準允准PDF 文件用 JavaScript 指令碼指令个結果。在 PDF 閱讀器裡背禁止執行 JavaScript 做得幫助緩解該兜未來个漏空,就算這擋毋核 PDF 檢視器其他部分个漏空。安全專家講 JavaScript 對於 PDF 閱讀器來講毋係基本个,還過因為禁止 JavaScript 个安全保障勝過任何造成个相容性問題。阻止 PDF 檔案漏空个一種方式係有本地或者網路服務做得在閱讀前摎檔案轉換做其他格式。 二零一零年三月三十安全專家 Didier Stevens 報告 Adobe Reader 同福昕閱讀器有假使使使用者經詢問允許啟動个時節執行惡意可執行檔个漏空。 ===使用限制摎顯示=== PDF 可能會分人加密,造成檢視抑係編輯內容个時節會要求輸入密碼。PDF 參考書同時定義四十個銀摎一百二十八個銀加密,都運用了 RC 四和 MD 五个複雜系統。PDF 參考書還定義第三方做得制定佢兜自家个 PDF 加密系統个方式。 PDF 檔案可能還包含嵌入个 DRM 限制,提供限制複製、編輯抑係講列印个進一步控制啦。複製、編輯抑係列印个限制決定在閱讀軟體遵守佢這兜,因此佢兜提供个安全機制係有限个。 PDF 參考書有面向終端使用者概覽个技術細節。就像 HTML 檔案共樣,PDF 檔案仔做得向網路伺服器提交資訊。這做得分人用來追蹤客戶端 PC 个 IP 位所,這一過程分人講係背景連線通訊。Acrobat Reader 升級到七千五百空 . 五以後,使用者會分人提示「. . .via a dialogue box that the author of the file is auditing usage of the file , and be offered the option of continuing」。 Adobe 通過 LiveCycle 安全伺服器提供針對特定文件設定安全策略个方法。乜做得包括要求使用者認證還過限制文件做得分人離線打開个時節做得分人存取或者載入个時期。PDF 文件一旦分人繫結到策略伺服器摎指定策略,這一策略做得分所有个人改變抑係復原。這一策略控制文件,無就係「在自然狀態下」。 每一隻文件打開抑係關閉事件也做得分人策略伺服器追蹤。策略伺服器做得由個人來設定,抑係 Adobe 通過 Adobe 線上服務提供公共服務。摎其他 DRM 形式共樣,照附這兜策略同限制有可能會,乜有可能毋會分人看書器軟體執行。 ===預設个顯示設定=== PDF 文件可以包含顯示設定,包含頁面顯示輸出摎縮放級別。打開文件个時節 Adobe Reader 用這兜設定去摎使用者个預設設定。毋使錢个 Adobe Reader 做毋得移除這類限制。 ==內容== PDF 檔案一般混合吔向量圖形、文字摎點陣圖。PDF 个基本內容包括: * 文字儲存係內容个字串(就係毋係文字本身) * 由圖形摎線條組成个用於說明摎設計个向量圖形 * 由相片摎其他類型个圖片組成个點陣圖在近期 PDF 標準修訂當中,PDF 文件還支援連結(文件肚項也網頁)、 表單、 JavaScript(做得通過 Acrobat 三千五百空个外掛程式啟用), 或者其他隨意類型个做得用外掛程式控制个可嵌入內容。 PDF 一千五百五十六支援互動式个三 D 文件嵌入去 PDF——三 D 繪圖做得用 U 三 D 抑係 PRC 還有其他當多種格式嵌入來。 在電腦螢幕項看起來相像个兩個 PDF 檔案有可能大細無共樣。比將講,一隻高解析度點陣圖比低解析度个佔更加多个儲存空間。一般更加高个解析度還較適當列印文件毋係顯示在螢幕裡肚。其他可能影響檔案大大細个可能有嵌入全部个字型,尤其係東亞个字型,還過摎文字存為圖片。 ==軟體== PDF 一般免費提供,還過當多版本做得對多个來源得著。 有當多軟體選項用來建立 PDF,包含內建於 Mac OS X 摎大部分 Linux 發行版、LibreOffice、Microsoft Office 二千空一十六、WordPerfect 九、Scribus 當多適用於 Microsoft Windows 个 PDF 列印驅動、pdfTeX 排版系統、DocBook PDF 工具、𫟧𫟧啊 Ghostscript 過 Adobe Acrobat 本身開發个應用還有 Adobe FrameMaker 个 PDF 排印功能。Google 个線上辦公套件 Google Docs 可能哦上傳、儲存為 PDF。 光柵圖像處理器(RIPs)用來做轉換 PDF 檔案係點陣圖格式以適應於成像在紙項摎其他媒體个印表機、數字生產用印刷機還過一種分人安到柵格化个行程當中个印前。有直接處理 PDF 能力个 RIP 包含在出自 Adobe Systems 摎 Jaws 个 Adobe PDF 排印引擎同出自 Global Graphics 个 HarlequinRIP 當中。 有兜仔軟體做得直接建立空白个 PDF 文件,比將講 Adobe 官方个 Adobe Acrobat DC,但是通常意義無大;因為 Adobe Acrobat 並毋曉得對文件進行排版。 因為 PDF 都有展現檔案原貌个功能,故所市面上也有一部分軟體毋係係 PDF 而生,但係通過一兜開發函式庫或者圖形繪做个框架乜具有 PDF 个匯出功能。 一兜用來編輯 PDF 檔案个特殊軟體,通過受當多限制還過比建立摎編輯標準做得編輯文件格式還較貴个選擇。Inkscape 零角四六摎以後个版本做得通過 Poppler 加入中間个轉譯步驟編輯 PDF。 Adobe Acrobat DC 做得分使用者對一隻無加密个 PDF 檔案或者具有相關權限使用者對 PDF 檔案進行編輯,同時內起吔 OCR 辨識、注解、表單預備、合併,數位簽章這兜十分完善个功能 Serif PagePlus 做得打開來、編輯同儲存已經有个 PDF 文件,還有軟體套件當中建立个文件个發布。 Microsoft Office Word 也支援打開、編輯同儲存已經有个 PDF 文件个編輯功能。 Enfocus PitStop Pro,Acrobat 个外掛程式,允准 PDF 檔案个手動摎自動編輯,同時毋使錢个 Enfocus Browser 做得分編輯 PDF 个低階別架構成為可能个。 大部分个 TeX 檔案經過編譯系統了後个預設置輸出格式為 PDF 檔案 ===注解=== Adobe Acrobat 係允許使用者分已經建立个 PDF 檔案注解、表現同添加筆記个專有軟體个一個案例。做為自由軟體做得用个(GNU 通用公共許可協定許可之下)一個 UNIX 應用係 PDFedit。另一個 GPL 授權个原生 UNIX 應用係 Xournal。Xournal 做得用無共樣个字形摎色注釋,還過用在文字抑係段落个快速下畫摎突顯線條个規則。Xournal還有一個用於四角形、矩形摎圓形个形狀辨識工具。Xournal 中个注釋做得分人徙動、複製抑係貼頂高。毋使錢个軟體福昕閱讀器,適用於 Microsoft Windows,允准注釋文件。Tracker Software 个 PDF-XChange Viewer 个免費版允准無受著限制个注釋摎標記。蘋果 Mac OS X 內建 PDF 閱讀器 Preview 乜做得像毋使錢个軟體Skim 恁呢注意哦,後者支援摎支援 LaTeX、SyncTeX 摎 PDFSync 整合,還過摎 BibDesk 參考文獻管理軟體整合。免費軟體 Qiqqa 做得建立總結所有注釋个報告,還過筆記通過佢兜个 PDF 函式庫做出來。 對這行動版本个注釋,iAnnotate PDF(來自 Branchfire)摎 GoodReader(來自 Aji)允准著 PDF注解摎匯出注釋个摘要。 還有一兜支援注釋 PDF 還有其他文件个格式 web 注釋系統,像係 A . nnotate、crocodoc、WebNotes。 在 PDF 被期望擁有紙質文件个全部功能个地方,墨水注釋會分人要求。一兜接受來自滑鼠个墨水輸入个程式可能毋罅以對應平板項个手寫輸入。PC 上已經有个解決方案包含 PDF Annotator 摎 Qiqqa。 ===其他=== PDF 軟體做為線上服務个例仔包含用在檢視摎儲存个 Scribd、用在線上編輯个 Pdfvue 同用於 PDF 轉換个嗬 Zamzar。 一九九三年出自家 Global Graphics 个 Jaws 點陣圖處理器變做第一隻毋使轉換到其他个格式原生產生 PDF 个銷售用个印前 RIP。公司在一九九七年分佢兜个 Harlequin RIP發布了一個有共樣相容性个更新。 愛克發 - 吉華一九九七年推介同時出售 Apogee,第一個考慮著 PDF 个印前工作流系統。 異多商業个膠印機接受遞交發布就緒个 PDF 檔案印刷來源,特別係 PDF / X 重點一千八百空二 a 子集同共樣个變種。發布就緒个 PDF 檔案个提交係對接收已經收集本地檔案工作个無確定性需求个替代。 PDF 分人選做 Mac OS X 个「本地」元檔案格式,取代早期 Mac OS 个 PICT 格式。Quartz 圖形層个圖像模式因為 Display PostScript 摎 PDF 共有个模式,產生了細名仔 Display PDF。Preview 應用摎應用 Safari 網頁瀏覽器二姣零摎以後个版本都做得顯示 PDF 檔案。著 PDF 个系統級支援分 Mac OS X 應用做得自動建立 PDF文件,分佢兜提供 OS 標準个列印架構支援。檔案做得按檔案个時間來輸出 PDF 一千五百七十二個格式咧。在 Mac OS X 十千五百二十三隻版本截圖个時節,圖像也做得截取為 PDF;後來个版本儲存截圖為 PNG 檔案,雖然這一行為係講有需要做得重新設定做 PDF。 一兜桌面印表機也支援直接列印 PDF,做得毋使另外个輔助生成 PDF 資料。目前嗬,所有 PDF 相容印表機也支援 PostScript,毋過大部分 PostScript 印表機無直接支援 PDF 列印。 自由軟體基金會識認為佢兜个一個高優先級計劃「提供自由、高品質摎全功能个一組軟體函式庫還有程式實現 PDF 檔案格式摎 ISO 三股二千標準个相關技術」。 還過在二零一一年,GNU PDF 計劃從「高優先級」列表中分人徙除,因為 Poppler 函式庫个完善,激勵了像 Evince 這兜應用摎 GNOME 桌面環境个廣泛應用。Poppler 因為 Xpdf 代碼。PDF 軟體列表乜列出做得用个商業開發用軟體函式庫。 Apache 軟體基金會个 Apache PDFBox 計畫係一種用於處理 PDF 文件个開放原始碼 Java 函式庫。PDFBox 以 Apache 許可證授權發布。 一個名仔安到 Devon Govett 个 Adobe 員工在 GitHub 上開源吔一款用在 JavaScript 个 PDF 操作函式庫 PDFKit Apple 開發者早期使用 Quartz 个 CGPDFDocument 來畫一個 PDF 文件,毋過因為使用較底層个圖形函式庫繪製 PDF 文件還過檢視當麻煩,故所在二零一七年个 WWDC 大會項 Apple 引進吔PDFKit 來分開發者在 Apple 產品个作業系統頂高分自家个 App 支援繪製,檢視,標註 PDF 等一下功能 ==參考文獻== ==參見== * XML 紙張个規範 *PostScript * DjVu * PDF / A * PDF 軟體列表 ==外部連結== * Adobe PDF 官方紹介:麼个係 PDF?Adobe 做得同式文件个格式合作(重點面存砂草,存于網際網路檔案館) * How was the PDF format created ? Quora * PDF Association - PDF Association 係軟體開發者創作還過處理 PDF 文件个產業協會 * Adobe PDF 一百空一 : Summary of PDF * Adobe : PostScript vs . PDF–官方紹介个 PS、EPS 摎 PDF 个比較 * _ PDF Standards . . . . transitioning the PDF specification from a de facto standard to a de jure standard _,存在網際網路檔案館–有關做得有文件格式个 PDF / E 過 PDF / UA 規格个資訊 * ISO 一千九百五千八百五十一 : 二千空五國際標準化組織發布个 PDF / A 重點一千八百空二 ISO 標準 * PDF Reference and Adobe Extensions to the PDF Specification * Portable Document Format : An Introduction for Programmers–對比 PDF、PostScript 過PDF 構件个紹介(升級到 v 一千擔百空三) * The Camelot Paper–John Warnock 概述个建立 PDF 个專案啊 * Everything you wanted to know about PDF but were afraid to ask - Leonard Rosenthol(Adobe Systems)在 TUG 二千空七上个談話記錄 * How to produce PDF with XSL-FO * 善用佳軟:做下接觸著 PDF : 盡好用个 PDF 軟體匯總 [[分類: 待校正]]
返回到「
PDF
」。