Tệp PDF âm thầm tiết lộ gì về bạn
Mỗi PDF bạn tạo mang theo hành lý vô hình. Mở PDF trong trình đọc chuẩn và bạn thấy nội dung: chữ, hình ảnh, trang. Nhưng nhúng trong tệp, ẩn khỏi tầm nhìn bình thường, là một lớp siêu dữ liệu có thể tiết lộ nhiều về bạn hơn bạn dự định chia sẻ.
Đây không phải lo ngại quyền riêng tư lý thuyết. Đây là vấn đề thực tế ảnh hưởng đến bất kỳ ai chia sẻ PDF: người ứng tuyển, freelancer, luật sư, doanh nghiệp và người dùng hàng ngày.
Siêu dữ liệu ẩn gì bên trong PDF
Siêu dữ liệu PDF có thể bao gồm bất kỳ hoặc tất cả những điều sau:
Tên tác giả
Trường tác giả thường chứa tên liên kết với giấy phép phần mềm hoặc tài khoản người dùng hệ điều hành tạo tài liệu.
Ngày tạo và sửa đổi
Mỗi PDF ghi khi nào nó được tạo lần đầu và sửa đổi lần cuối. Điều này có thể tiết lộ bạn viết đề xuất "vừa xong" ba tuần trước.
Phần mềm sử dụng
Trường "Producer" và "Creator" ghi phần mềm nào tạo PDF. Điều này tiết lộ công cụ, hệ điều hành và đôi khi phiên bản phần mềm.
Tiêu đề và chủ đề tài liệu
Các trường này thường được tự động điền từ tài liệu gốc. PDF tạo từ Word có thể mang tiêu đề tệp Word, như "BẢN NHÁP - Báo cáo Doanh thu Q3 - BẢO MẬT" ngay cả khi PDF cuối cùng có tiêu đề khác.
Từ khóa
Một số phần mềm thêm từ khóa vào siêu dữ liệu, có thể chứa thuật ngữ tìm kiếm, danh mục hoặc thẻ chưa bao giờ dự định hiển thị cho người nhận.
Cảnh báo Nếu bạn tạo PDF bằng cách sửa đổi tài liệu của người khác, siêu dữ liệu có thể vẫn chứa thông tin tác giả gốc. Gửi tài liệu này có thể ngụ ý bạn không tự tạo, hoặc phơi bày danh tính tác giả gốc khi không dự định.
Rủi ro quyền riêng tư thực tế
Hồ sơ xin việc
Bạn gửi CV dạng PDF. Siêu dữ liệu tiết lộ nó được tạo trong Google Docs, sửa đổi lần cuối lúc 2:00 sáng. Trường tác giả ghi "Laptop Sinh viên."
Tài liệu pháp lý
PDF hợp đồng mang siêu dữ liệu cho thấy nó được tạo bởi luật sư ở văn phòng khác với văn phòng đại diện cho bạn.
Công việc freelance
Bạn giao đề xuất "tùy chỉnh" cho khách hàng. Siêu dữ liệu cho thấy nó được tạo sáu tháng trước và trường tiêu đề ghi "Template - Đề xuất Chuẩn."
Bạn có biết? Năm 2003, chính phủ Anh xuất bản hồ sơ về Iraq dưới dạng tài liệu Word. Siêu dữ liệu tiết lộ tên các công chức đã chỉnh sửa, bao gồm tác giả gốc có văn bản đã bị sửa đổi — phát hiện này đóng góp vào bê bối chính trị.
Cách kiểm tra PDF tiết lộ gì
Trước khi chia sẻ bất kỳ PDF nào ra bên ngoài, bạn nên kiểm tra siêu dữ liệu.
Mẹo Xem chính xác PDF tiết lộ gì với Trình xem siêu dữ liệu PDF. Hiển thị mọi trường siêu dữ liệu trong tệp.
Cách xóa siêu dữ liệu PDF
Khi biết có gì bên trong, bạn cần xóa trước khi chia sẻ. Xóa siêu dữ liệu nghĩa là loại bỏ tất cả trường không cần thiết: tác giả, tiêu đề, chủ đề, từ khóa, phần mềm tạo và ngày.
Sau khi xóa, PDF trông giống hệt bản gốc. Nội dung không bị thay đổi. Chỉ siêu dữ liệu ẩn được loại bỏ.
Mẹo Xóa siêu dữ liệu PDF trước khi chia sẻ: Cách xóa siêu dữ liệu PDF. Công cụ chạy trong trình duyệt, xử lý tệp cục bộ và không bao giờ tải tài liệu lên máy chủ.
Danh sách kiểm tra chia sẻ PDF an toàn
Trước khi chia sẻ bất kỳ PDF nào ra ngoài:
- Kiểm tra siêu dữ liệu. Dùng trình xem siêu dữ liệu để xem tệp chứa thông tin gì.
- Kiểm tra trường tác giả. Có phải tên bạn? Tên đồng nghiệp? Tên máy tính?
- Kiểm tra tiêu đề và chủ đề. Có chứa tên dự án nội bộ, "BẢN NHÁP" hoặc chữ không mong muốn?
- Kiểm tra ngày tạo và sửa đổi. Có tiết lộ thời gian bạn muốn giữ kín?
- Xóa siêu dữ liệu. Loại bỏ tất cả trường không cần thiết.
- Xác minh phiên bản sạch. Kiểm tra lại tệp đã xóa để xác nhận siêu dữ liệu đã được loại bỏ.
Cảnh báo Siêu dữ liệu không phải dữ liệu ẩn duy nhất trong PDF. Chữ bị biên tập chỉ đơn giản phủ hộp đen (thay vì xóa đúng cách) đôi khi có thể phục hồi bằng cách chọn và sao chép chữ bên dưới. Luôn dùng công cụ biên tập đúng cho nội dung nhạy cảm.
Biến thành thói quen
Cách tiếp cận tốt nhất với siêu dữ liệu PDF là biến việc xóa thành bước thường xuyên, như đọc lại. Mỗi khi chuẩn bị PDF để chia sẻ ra ngoài, dành ba mươi giây để kiểm tra và xóa siêu dữ liệu.
Kiểm tra PDF tiết lộ gì ngay:
Cả hai công cụ đều miễn phí, chạy trong trình duyệt và tệp không bao giờ rời khỏi thiết bị.