Mỗi file PDF đều mang theo siêu dữ liệu ẩn -- tên tác giả, phần mềm sử dụng để tạo, ngày tạo và sửa đổi, và đôi khi cả tên công ty. Trước khi chia sẻ tài liệu ra bên ngoài, nên xóa những thông tin này. Công cụ Siêu dữ liệu PDF cho phép bạn xem và dọn dẹp siêu dữ liệu trong vài giây.
Bạn cần gì
- Một file PDF bạn muốn dọn dẹp
- Một trình duyệt web
- Không cần tài khoản hay cài đặt phần mềm
Hướng dẫn từng bước
Mở công cụ Siêu dữ liệu PDF
Truy cập công cụ Siêu dữ liệu PDF. Công cụ chạy hoàn toàn trong trình duyệt và sẵn sàng ngay lập tức.
Tải lên PDF và xem siêu dữ liệu
Nhấp vào vùng tải lên hoặc kéo thả file PDF. Công cụ sẽ hiển thị tất cả trường siêu dữ liệu tìm thấy trong file: tiêu đề, tác giả, chủ đề, từ khóa, ứng dụng tạo, trình sản xuất, ngày tạo và ngày sửa đổi.
Xóa siêu dữ liệu và tải xuống
Xóa các trường bạn muốn gỡ bỏ, hoặc xóa tất cả siêu dữ liệu cùng lúc. Sau đó tải xuống PDF đã dọn dẹp. Nội dung tài liệu giữ nguyên -- chỉ siêu dữ liệu ẩn bị xóa.
Lưu ý PDF không bao giờ rời khỏi trình duyệt. Tất cả việc xem và xóa siêu dữ liệu diễn ra cục bộ trên thiết bị của bạn.
PDF chứa siêu dữ liệu gì?
File PDF có thể lưu trữ một lượng thông tin đáng ngạc nhiên mà bạn có thể không nhận ra:
| Trường | Tiết lộ điều gì |
|---|---|
| Tác giả | Tên hoặc tên người dùng của bạn |
| Trình tạo | Ứng dụng sử dụng (ví dụ: Microsoft Word, Google Docs) |
| Trình sản xuất | Thư viện PDF sử dụng (ví dụ: macOS Quartz, Adobe PDF Library) |
| Ngày tạo | Khi tài liệu được tạo lần đầu |
| Ngày sửa đổi | Khi chỉnh sửa lần cuối |
| Tiêu đề | Tiêu đề tài liệu (đôi khi tự động điền từ tên file) |
| Chủ đề | Dòng chủ đề, nếu được đặt |
| Từ khóa | Từ khóa tìm kiếm nhúng trong file |
Mẹo Trước khi dọn dẹp, hãy dành chút thời gian đọc siêu dữ liệu hiện có. Bạn có thể ngạc nhiên về những gì PDF tiết lộ về bạn. Đây là bài tập tốt cho thấy tại sao việc dọn dẹp quan trọng.
Tại sao nên xóa siêu dữ liệu PDF?
Quyền riêng tư
Tên, tên người dùng, hoặc địa chỉ email có thể được nhúng trong trường tác giả. Khi chia sẻ tài liệu công khai hoặc với người ngoài tổ chức, điều này tiết lộ danh tính không cần thiết.
Bảo mật
Trường trình tạo và trình sản xuất tiết lộ phần mềm bạn sử dụng, phiên bản nào, và thậm chí hệ điều hành. Kẻ tấn công có thể sử dụng thông tin này để nhắm vào lỗ hổng đã biết trong phiên bản phần mềm cụ thể.
Tính chuyên nghiệp
Siêu dữ liệu như "MacBook Pro của Minh" trong trường tác giả hoặc "Bản nháp v3 CUỐI CÙNG CUỐI CÙNG" trong tiêu đề trông thiếu chuyên nghiệp. Dọn dẹp siêu dữ liệu trước khi phân phối đảm bảo tài liệu trình bày sạch sẽ.
Pháp lý và tuân thủ
Một số ngành và khung quy định yêu cầu xóa siêu dữ liệu khỏi tài liệu trước khi phân phối ra ngoài. Các công ty luật, nhà cung cấp dịch vụ y tế, và cơ quan chính phủ thường có chính sách dọn dẹp siêu dữ liệu.
Ngăn chặn theo dõi chỉnh sửa
Ngày sửa đổi và lịch sử phiên bản có thể tiết lộ số lần tài liệu được chỉnh sửa và thời điểm. Trong đàm phán hoặc bối cảnh pháp lý, thông tin này có thể bị sử dụng chống lại bạn.
Quan trọng Dọn dẹp siêu dữ liệu chỉ xóa các trường từ từ điển thông tin PDF. Nó không xóa nội dung trong các trang hiển thị, nhận xét, chú thích, hoặc file nhúng. Để dọn dẹp kỹ lưỡng, hãy xem xét nội dung tài liệu riêng biệt.
Khi nào nên dọn dẹp siêu dữ liệu
- Trước khi chia sẻ ra ngoài: Bất cứ khi nào PDF rời khỏi tổ chức.
- Trước khi đăng trực tuyến: Tài liệu đăng trên website hoặc kho công khai.
- Trước khi nộp hồ sơ pháp lý: Tòa án và đối phương không nên thấy lịch sử chỉnh sửa nội bộ.
- Trước khi gửi cho khách hàng: Trình bày tài liệu sạch sẽ, chuyên nghiệp.
Câu hỏi thường gặp
Xóa siêu dữ liệu có thay đổi giao diện PDF không? Không. Siêu dữ liệu hoàn toàn tách biệt với nội dung hiển thị. Xóa nó không ảnh hưởng gì đến văn bản, hình ảnh, định dạng hay bố cục tài liệu.
Tôi có thể chỉnh sửa siêu dữ liệu thay vì xóa không? Có. Công cụ cho phép bạn sửa đổi từng trường riêng lẻ. Bạn có thể đặt tên tác giả hoặc tiêu đề mới trong khi xóa mọi thứ khác.
Siêu dữ liệu có giống dữ liệu EXIF không? Chúng là khái niệm tương tự. Dữ liệu EXIF là siêu dữ liệu nhúng trong file ảnh (ảnh chụp). Siêu dữ liệu PDF phục vụ cùng mục đích cho tài liệu. Nếu bạn làm việc với ảnh, hãy xem công cụ Trình xem EXIF và Trình xóa EXIF.
Công cụ này có xóa văn bản ẩn hoặc lớp ẩn không? Không. Công cụ xử lý các trường siêu dữ liệu PDF tiêu chuẩn. Lớp văn bản ẩn, nội dung đã che, hoặc tệp đính kèm nhúng cần công cụ chỉnh sửa PDF nâng cao hơn.
Bước tiếp theo
Sau khi dọn dẹp siêu dữ liệu, bạn có thể muốn thêm watermark để đánh dấu trạng thái tài liệu, bảo vệ bằng mật khẩu trước khi chia sẻ, hoặc nén để giảm kích thước file.