【ぴーでぃーえふ】

PDF とは?

💡 「どの端末で開いても同じ見た目」の文書形式
📌 このページのポイント
PDFフォーマット ― ファイル構造 物理構造 ヘッダー (バージョン) ボディ (間接オブジェクト) ストリーム / 辞書 / 配列 xref テーブル トレーラー / startxref 論理構造(ページツリー) カタログ ページツリー ページ1 ページ2 テキスト 画像 フォント
PDFフォーマットのファイル構造のイメージ
ひよこ ひよこ

WordファイルじゃなくてPDFにする理由は?

ペンギン先生 ペンギン先生

Wordファイルは開くソフトやバージョンによってレイアウトが崩れることがある。フォントインストールされていないと文字化けもする。PDFフォントを埋め込んで表示を固定するから、相手のPCに何が入っていても同じ見た目。請求書、契約書、マニュアルなど「崩れたら困る文書」はPDF一択だよ

ひよこ ひよこ

PDFの編集はできる?

ペンギン先生 ペンギン先生

基本的にPDFは「完成した文書」を配布するための形式で、編集には向いていない。Adobe Acrobat Proなら直接編集できるけど有料。無料でやるなら①LibreOffice DrawでPDFを開いて編集、②Smallpdf等のWebツールでテキスト追加、③PDFを一度Wordに変換して編集→PDF化、が定番だよ

ひよこ ひよこ

PDF/Aって何?

ペンギン先生 ペンギン先生

長期保存用のPDF規格(ISO 19005)。通常のPDFは外部フォントやリンクに依存できるけど、PDF/Aはフォント完全埋め込み、暗号化禁止、マルチメディア禁止など制限がある。50年後でも開ける保証があるから、政府文書や法律文書のアーカイブで義務化されていることがあるよ

ひよこ ひよこ

プログラムPDFを扱うには?

ペンギン先生 ペンギン先生

生成なら、Python: ReportLab/WeasyPrint、JavaScript: pdf-lib/Puppeteer、Java: iText/Apache PDFBox。読み取りならPython: PyPDF2/pdfplumber。ブラウザ表示ならpdf.js(Mozilla製)。HTMLからPDFに変換するならPuppeteerでheadless ChromeのPDF出力が最も再現度が高いよ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
PDF」って出てきたら「どの環境でも同じレイアウトで見られる文書形式」と思えればだいたいOK!
📖 おまけ:英語の意味
「Portable Document Format」 = 携帯可能な文書形式
💬 Portable(持ち運べる)Document Format。1993年にAdobe Systemsが開発したよ
← 用語集にもどる