PDFはあらゆる場所で使われています。契約書、請求書、履歴書、確定申告書類、取扱説明書、電子書籍、搭乗券――おそらく毎日PDFファイルに触れているはずです。しかし、PDFとは正確には何なのでしょうか?なぜドキュメント共有のデフォルト形式になったのでしょうか?
PDFの簡単な歴史
PDFはPortable Document Format(ポータブル・ドキュメント・フォーマット)の略称です。1993年にAdobe Systems社が、ある厄介な問題を解決するために開発しました。それは、使用するパソコン、OS、プリンターによってドキュメントの見た目が変わってしまうという問題です。WindowsのWordで作成したレポートをMacで開くと、フォントが崩れ、余白がずれ、画像が消えるということがよくありました。
Adobeの共同創業者であるジョン・ワーノックは、どこで表示しても文書の見た目が完全に同じになるフォーマットを構想しました。その結果生まれたのがPDFで、AdobeのPostScriptページ記述言語をベースに構築されています。
長年にわたりPDFはAdobeが管理する独自フォーマットでした。しかし2008年にAdobeが仕様をオープン標準(ISO 32000)として公開したことで状況は変わりました。この動きにより、PDFは特定の企業に縛られない真の意味でのユニバーサルフォーマットとなりました。
PDFの内部の仕組み
Word文書やGoogle ドキュメントとは異なり、PDFは簡単に編集されることを前提に設計されていません。どこで表示しても同一に見えることを目的に設計されています。それを実現する仕組みは以下の通りです:
- 固定レイアウト。 ページ上のすべての要素――テキスト、画像、線、図形――は座標で正確な位置が定義されています。別の画面で開いてもリフローは起こりません。
- フォントの埋め込み。 実際のフォントデータがPDFファイル内に格納されています。閲覧者のパソコンにそのフォントがインストールされていなくても、テキストは意図通りに表示されます。
- 自己完結型。 画像、ベクターグラフィックス、その他のリソースはすべてファイル内に直接埋め込まれています。PDFは外部ファイルを参照しません――必要なものはすべて内部に含まれています。
- ページベースの構造。 PDFは個別のページの集合として構成されており、各ページは独立してレンダリングされます。これは文書を連続的なテキストの流れとして扱うワードプロセッサとは根本的に異なります。
豆知識。 PDFファイルの内部はオブジェクト(テキストストリーム、画像データ、フォントプログラム、メタデータ)のツリー構造で、相互参照テーブルで結ばれています。そのため、ファイル全体を読み込まなくても、任意のページに即座にジャンプできるのです。
PDF/A — アーカイブ用に設計されたフォーマット
標準的なPDFには、時間の経過とともに問題になり得る機能が含まれることがあります:JavaScript、外部リンク、マルチメディア、暗号化レイヤーなどです。長期保存のために、PDF/A(ISO 19005)というバリアントが作られました。
PDF/Aには厳格なルールがあります:
- すべてのフォントを埋め込むこと
- JavaScriptや実行可能コンテンツを含まないこと
- 外部依存関係を持たないこと
- 色空間を明確に定義すること
- メタデータはXMP標準に従うこと
政府機関、法務部門、図書館は、文書が数十年にわたって読めるようにするためにPDF/Aを使用しています。50年後にも完全に閲覧可能でなければならない文書をアーカイブするなら、PDF/Aが最適です。
セキュリティ機能
PDFは複数のセキュリティレイヤーをサポートしています:
- パスワード保護。 ファイルを開くためのパスワードを設定したり、編集・印刷・テキストコピーを制限するための別のパスワードを設定できます。
- 電子署名。 PDFに暗号署名を施すことで、誰が作成したか、内容が改ざんされていないかを証明できます。
- 墨消し。 機密情報を永久に削除できます(黒い四角で覆うだけではなく、ファイルデータから実際に削除します)。
- 暗号化。 PDFはAES-256暗号化をサポートしており、正しいパスワードがなければ内容を読むことができません。
注意。 PDF上のテキストに黒い四角形を重ねるだけでは墨消しにはなりません。下のテキストはファイル内にそのまま残っており、抽出可能です。真の墨消しには、データを完全に削除する専用ツールが必要です。
PDFを使うべき場面(と使うべきでない場面)
PDFが最適な場合:
- すべてのデバイスで文書が同一に見える必要がある場合
- 簡単な編集を防ぎたい場合
- 長期保存のために文書をアーカイブする場合
- 電子署名やセキュリティ機能が必要な場合
- 印刷用のコンテンツ(チラシ、ポスター、書籍)を配布する場合
PDFが最適ではない場合:
- 文書を共同編集する必要がある場合(Google ドキュメント、Word、またはMarkdownを使用してください)
- コンテンツが異なる画面サイズにリフローすべき場合(電子書籍にはEPUB、ウェブにはHTMLを使用してください)
- 構造化データの抽出が必要な場合(CSV、JSON、またはXMLを使用してください)
- ファイルサイズを最小にする必要がある場合(プレーンテキストやMarkdownの方が軽量です)
| 特徴 | Word/DOCX | HTML | EPUB | |
|---|---|---|---|---|
| 固定レイアウト | はい | いいえ | いいえ | いいえ |
| 編集可能 | 限定的 | はい | はい | はい |
| モバイルでリフロー | いいえ | 部分的 | はい | はい |
| フォント埋め込み | はい | 部分的 | いいえ | はい |
| ユニバーサルリーダー | はい | いいえ | はい | いいえ |
| 長期アーカイブ | PDF/A | いいえ | いいえ | いいえ |
今日のPDF
誕生から30年以上が経った今も、PDFは文書交換の揺るぎないスタンダードです。毎年25億以上のPDFが作成されています。すべての主要なOSにPDFビューアが組み込まれています。フォーマットはフォーム、注釈、3Dコンテンツ、マルチメディア、アクセシビリティ機能を含むように進化してきましたが、その本来の約束は変わりません:あなたが作成したものは、他の人が見るものと完全に同じです。
さらに詳しく
PDFファイルの圧縮、結合、分割、保護、変換が必要な場合、ToolK.ioでは無料ツールや詳細なチュートリアルを提供しており、PDFの効率的な活用をサポートします。
