PDF có mặt ở khắp mọi nơi. Hợp đồng, hóa đơn, sơ yếu lý lịch, tờ khai thuế, sổ tay hướng dẫn, sách điện tử, vé máy bay — rất có thể bạn tương tác với các tệp PDF mỗi ngày. Nhưng chính xác PDF là gì, và tại sao nó trở thành cách mặc định để chia sẻ tài liệu?
Lịch sử ngắn gọn về PDF
PDF là viết tắt của Portable Document Format (Định dạng Tài liệu Di động). Nó được tạo ra bởi Adobe Systems vào năm 1993 để giải quyết một vấn đề gây khó chịu: tài liệu hiển thị khác nhau tùy thuộc vào máy tính, hệ điều hành hoặc máy in mà bạn sử dụng. Một báo cáo tạo bằng Word trên Windows có thể trông hoàn toàn khác khi mở trên Mac, với phông chữ bị lỗi, lề bị lệch và hình ảnh bị thiếu.
Đồng sáng lập Adobe, John Warnock, hình dung một định dạng có thể giữ nguyên diện mạo chính xác của tài liệu bất kể nó được xem ở đâu. Kết quả là PDF, được xây dựng trên ngôn ngữ mô tả trang PostScript của Adobe.
Trong nhiều năm, PDF là một định dạng độc quyền do Adobe kiểm soát. Điều này thay đổi vào năm 2008 khi Adobe công bố đặc tả dưới dạng tiêu chuẩn mở (ISO 32000). Bước đi này đã củng cố PDF trở thành một định dạng thực sự phổ biến toàn cầu, không phụ thuộc vào bất kỳ công ty nào.
Cách PDF hoạt động bên trong
Khác với tài liệu Word hay Google Doc, PDF không được thiết kế để dễ dàng chỉnh sửa. Nó được thiết kế để hiển thị giống hệt nhau ở mọi nơi. Đây là cách nó đạt được điều này:
- Bố cục cố định. Mọi phần tử trên trang — văn bản, hình ảnh, đường nét, hình khối — đều có vị trí chính xác được xác định bằng tọa độ. Không có gì bị thay đổi dòng khi bạn mở tệp trên màn hình khác.
- Nhúng phông chữ. Dữ liệu phông chữ thực tế được lưu trữ bên trong tệp PDF. Ngay cả khi máy tính người đọc không cài phông chữ đó, PDF vẫn hiển thị văn bản đúng như dự định.
- Tự chứa. Hình ảnh, đồ họa vector và các tài nguyên khác được nhúng trực tiếp trong tệp. PDF không liên kết đến tệp bên ngoài — mọi thứ cần thiết đều nằm bên trong.
- Cấu trúc theo trang. PDF được tổ chức dưới dạng tập hợp các trang riêng lẻ, mỗi trang được kết xuất độc lập. Điều này khác biệt cơ bản so với trình xử lý văn bản, vốn coi tài liệu như một luồng văn bản liên tục.
Nên biết. Tệp PDF bên trong được cấu trúc dưới dạng cây đối tượng (luồng văn bản, dữ liệu hình ảnh, chương trình phông chữ, siêu dữ liệu) được liên kết bởi bảng tham chiếu chéo. Đây là lý do bạn có thể nhảy đến bất kỳ trang nào ngay lập tức mà không cần tải toàn bộ tệp.
PDF/A — Được thiết kế cho lưu trữ
PDF tiêu chuẩn có thể chứa các tính năng lỗi thời theo thời gian: JavaScript, liên kết bên ngoài, đa phương tiện, lớp mã hóa. Để bảo quản lâu dài, một biến thể gọi là PDF/A (ISO 19005) đã được tạo ra.
PDF/A áp dụng các quy tắc nghiêm ngặt:
- Tất cả phông chữ phải được nhúng
- Không có JavaScript hoặc nội dung thực thi
- Không phụ thuộc bên ngoài
- Không gian màu phải được xác định rõ ràng
- Siêu dữ liệu phải tuân theo tiêu chuẩn XMP
Các cơ quan chính phủ, phòng pháp lý và thư viện sử dụng PDF/A để đảm bảo tài liệu vẫn đọc được trong nhiều thập kỷ. Nếu bạn cần lưu trữ tài liệu mà vẫn phải xem được hoàn hảo sau 50 năm, PDF/A là lựa chọn đúng đắn.
Tính năng bảo mật
PDF hỗ trợ nhiều lớp bảo mật:
- Bảo vệ bằng mật khẩu. Bạn có thể đặt mật khẩu để mở tệp, hoặc mật khẩu riêng để hạn chế chỉnh sửa, in ấn hoặc sao chép văn bản.
- Chữ ký số. PDF có thể được ký số bằng mật mã để chứng minh ai đã tạo nó và nội dung chưa bị thay đổi.
- Xóa bôi đen. Thông tin nhạy cảm có thể bị xóa vĩnh viễn (không chỉ che bằng hộp đen, mà thực sự bị xóa khỏi dữ liệu tệp).
- Mã hóa. PDF hỗ trợ mã hóa AES-256, làm cho nội dung không thể đọc được nếu không có mật khẩu chính xác.
Hãy cẩn thận. Chỉ đặt một hình chữ nhật đen lên văn bản trong PDF không phải là xóa bôi đen thực sự. Văn bản bên dưới vẫn tồn tại trong tệp và có thể được trích xuất. Xóa bôi đen thực sự cần một công cụ chuyên dụng để xóa hoàn toàn dữ liệu.
Khi nào nên dùng PDF (và khi nào không nên)
PDF là lựa chọn phù hợp khi:
- Bạn cần tài liệu trông giống hệt nhau trên mọi thiết bị
- Bạn muốn ngăn chặn việc chỉnh sửa dễ dàng
- Bạn đang lưu trữ tài liệu để bảo quản lâu dài
- Bạn cần chữ ký số hoặc tính năng bảo mật
- Bạn đang phân phối nội dung sẵn sàng in (tờ rơi, áp phích, sách)
PDF không phải là lựa chọn tốt nhất khi:
- Tài liệu cần được cộng tác chỉnh sửa (dùng Google Docs, Word hoặc Markdown)
- Nội dung cần tự động điều chỉnh cho các kích thước màn hình khác nhau (dùng EPUB cho sách điện tử, HTML cho web)
- Bạn cần trích xuất dữ liệu có cấu trúc (dùng CSV, JSON hoặc XML)
- Kích thước tệp phải tối thiểu (tệp văn bản thuần hoặc Markdown nhẹ hơn)
| Tính năng | Word/DOCX | HTML | EPUB | |
|---|---|---|---|---|
| Bố cục cố định | Có | Không | Không | Không |
| Có thể chỉnh sửa | Hạn chế | Có | Có | Có |
| Tự động dòng trên di động | Không | Một phần | Có | Có |
| Nhúng phông chữ | Có | Một phần | Không | Có |
| Trình đọc phổ biến | Có | Không | Có | Không |
| Lưu trữ lâu dài | PDF/A | Không | Không | Không |
PDF ngày nay
Hơn ba thập kỷ sau khi được tạo ra, PDF vẫn là chuẩn không thể tranh cãi cho việc trao đổi tài liệu. Hơn 2,5 tỷ tệp PDF được tạo mỗi năm. Mọi hệ điều hành lớn đều có trình xem PDF tích hợp sẵn. Định dạng đã phát triển để bao gồm biểu mẫu, chú thích, nội dung 3D, đa phương tiện và tính năng trợ năng, trong khi vẫn giữ đúng lời hứa ban đầu: những gì bạn tạo ra chính xác là những gì người khác sẽ thấy.
Tìm hiểu thêm
Dù bạn cần nén, gộp, tách, bảo vệ hay chuyển đổi tệp PDF, một loạt công cụ miễn phí và hướng dẫn chuyên sâu có sẵn trên ToolK.io để giúp bạn làm việc với PDF hiệu quả.
