Là một người thường xuyên tìm kiếm tư liệu từ Internet, nếu gặp 1 trang web chứa nội dung yêu thích và có giá trị, bạn sẽ thường xuyên ghé thăm để đọc nội dung đó. Tuy nhiên vấn đề đặt ra là không phải lúc nào trang web đó cũng tồn tại (có thể trang web bị hết hạn và chủ sở hữu không muốn gia hạn thêm) hoặc không phải lúc nào tốc độ Internet cũng ổn định để truy cập và xem nội dung của nó. Lưu toàn bộ nội dung trang web có lẽ là lựa chọn tôi ưu trong trường hợp này. Adobe Acrobat 9.0 sẽ giúp bạn dễ dàng làm việc đó.
Đầu tiên, download Acrobat Acrobat Pro bản dùng thử tại đây.
Để chuyển đổi trang web sang PDF, bạn mở Acrobat Pro 9. Click vào File chọn Create PDF rồi chọn tiếp From Web Page. Hộp thoại Creat PDF from the Web Page sẽ được hiển thị. Điền địa chỉ của trang web mà bạn muốn sao chép nội dung vào khung URL.
Mặc định, Acrobat chỉ ghi lại nội dung của trang web ở cấp cao nhất (thông thường là trang chủ). Click vào dấu mũi tên ở cạnh mục Capture Multiple levels (vùng khoanh đỏ) để mở rộng tùy chọn. Đánh dấu vào 2 tùy chọn: Stay on same path và Stay on same server hiện ra dưới đó để Adobe chỉ download những nội dung chính trên trang web chứ không download các nội dung quảng cáo hay các phần liên kết bên ngoài. Bạn có thể điền cấp độ của trang web mà bạn muốn lưu lại vào khung Get only (đối với website nào có nhiều trang) hoặc tùy chọn Get Entire để lưu toàn bộ các trang web bên trong.
Tuy nhiên, với tùy chọn lưu toàn bộ nội dung trang web, file PDF mà bạn lưu được sẽ có 1 dung lượng khổng lồ và tốc độ lưu file sẽ rất chậm. Adobe cung cấp cho bạn nhiều lựa chọn để điều chỉnh dung lượng thời gian để lưu file sao cho hợp lý. Tại cửa sổ Creat PDF From Webpage ở trên, bạn click vào Settings rồi click tiếp vào nút Settings trên cửa sổ Web Page Conversion Settings hiện ra sau đó. Hộp thoại HTML Conversion Settings xuất hiện, bạn đánh dấu bỏ tùy chọn Convert Images và chọn Disable MultiMedia Capture tại mục MultiMedia Content để bỏ qua hình ảnh và các file media có trong nội dung trang web. Điều này sẽ tiết kiệm dung lượng và thời gian để lưu file nhưng có thể sẽ mất đi những thông tin quan trọng có trên trang web.
Nhấn OK để quay trở lại hộp thoại Creat PDF from Webpage (hình 1). Cuối cùng, click vào nút Creat để bắt đầu quá trình lưu và chuyển đổi nội dung trang web sang PDF. Adobe sẽ xuất hiện cửa sổ Download Status để hiển thị quá trình cũng như sao chép và chuyển đổi nội dung website. Trong trường hợp bạn sao chép cả nội dung các file media có trên trang web, nếu Adobe có khả năng đọc được các file đó, Adobe sẽ hỏi bạn có muốn lưu chúng vào nội dung file PDF hay không, nếu không muốn, bạn chọn Yes để khóa các file media từ website, ngược lại, bạn chọn No.
Có thể nói rằng, phiên bản mới nhất này của Adobe Acrobat đã bổ sung rất nhiều tính năng bổ ích và hữu dụng. Nếu muốn sử dụng phiên bản đầy đủ, bạn có thể tìm mua tại các đại lý tin học. |
Lưu nội dung toàn bộ trang web dưới dạng PDF
23 12 2008Phản hồi : Leave a Comment »
Thẻ: pdf
Chuyên mục : Thủ thuật
PDFTK Builder – Tiện ích tuyệt vời dành cho file PDF
23 12 2008
Với tính năng bảo mật cao cũng như khả năng trình bày vượt trội, PDF là định dạng văn bản rất phổ biến ngày nay. Tuy nhiên, cũng chính vì tính năng bảo mật cao và hạn chế gần như là tối đa khả năng chỉnh sửa của người dùng nên thường rất khó can thiệp để chỉnh sửa hay thay đổi nội dung file pdf. Dân trí đã từng giới thiệu đến bạn tiện ích Text Mining Tools để trích xuất nội dung và Some PDF Image Extrach để trích xuất hình ảnh từ file PDF. Tuy nhiên, nếu cảm thấy như vậy vẫn là chưa đủ, bạn có thể nhờ đến PDFTK Builder, một tiện ích tuyệt vời dành cho file pdf.
PDTK Builder là tiện ích miễn phí, mã nguồn mở, cho phép gộp chung nhiều file pdf làm một, chèn nội dung từ file này vào file khác, sắp xếp cũng như xóa các trang có trong file, cắt 1 file ra làm nhiều phần nhỏ… và còn rất nhiều tính năng khác. Download PDTK Builder tại đây. Nếu bạn muốn nghiên cứu thêm, có thể download mã nguồn của chương trình tại đây (được viết bởi ngôn ngữ Delphi)
Sau khi download, cài đặt và kích hoạt chương trình, bạn sẽ nhận thấy giao diện của nó trông rất đơn giản với 4 tab chính:
1. Collate: tab này cho phép bạn sắp đặt lại các trang trên file pdf (sắp xếp lại thứ tự, xóa hoặc chèn thêm trang…). Click vào nút Add để chọn file pdf cần tiến hành.
File sau khi được chọn sẽ xuất hiện ở khung Source PDF Documents. Để sắp xếp lại thứ tự các trang, bạn chỉ việc điền số thứ tự của các trang mà mình muốn sắp xếp vào khung Pages. Chẳng hạn, nếu bạn có 1 file pdf với 6 trang, bạn có thể điền “6,5,4,3,2,1” để đảo ngược thứ tự các trang có trong file hoặc điền “2,1,3,4,5,6” để đưa trang 2 lên đầu. (chú ý: các số phải cách nhau bằng dấu phẩy).
Nếu muốn xóa đi 1 trang nào đó trong file, bạn điền thứ tự các trang và bỏ qua trang đó vào khung Pages. Chẳng hạn để xóa trang 5 khỏi file, bạn điền 1,2,3,4,6 vào khung Pages. Trong trường hợp nếu file có quá nhiều trang, bạn có thể sử dụng chú pháp “trang đầu-trang cuối” để tiết kiệm thời gian. Chẳng hạn với 1 file có 12 trang và nếu bạn điền “2-6,9,10” vào khung Pages thì các trang 1, 7, 8, 11 và 12 sẽ bị loại bỏ khỏi file.
- Nếu bạn muốn gộp chung nhiều file pdf vào làm 1, bạn click Add, chọn các file muốn gộp chung để đưa vào danh sách. Nếu bạn chỉ đơn giản muốn gộp file này “nối đuôi” vào file kia thì chỉ việc sắp xếp thứ tự của chúng trên danh sách và click vào Save as để lưu file mới chứa nội dung của các file.
Tuy nhiên, nếu bạn muốn gộp file theo kiểu 1 vài trang của file này lồng vào file kia thì sẽ tiến hành có phần phức tạp hơn. Chẳng hạn bạn có 1 file gồm 6 trang và 1 file gồm 9 trang. Bạn muốn file gộp chung của 2 file sẽ có kiểu: 2 trang đầu của file 1, 9 trang sau của file 2 và 4 trang cuối là của file 1. (có tổng cộng 15 trang). Để làm điều này, đầu tiên, bạn click Add để đưa file 1 và file 2 vào danh sách. Tiếp theo, bạn đưa tiếp file 1 vào danh sách thêm lần nữa (chúng ta sẽ thấy có thứ tự như hình ảnh)
Bây giờ, tại khung Pages của file 1, bạn điền “1,2” (để lấy 2 trang đầu tiên của file 1). Tại khung Pages của file 2, bạn điền “1-9” để lấy toàn bộ 9 trang của file 2 và cuối cùng, ở file 1 thứ 3, bạn điền “3-6” để lấy nốt 4 trang cuối của file 1.
Sau khi đã tiến hành theo ý muốn, bạn click vào Save as và chọn vị trí để lưu file sau khi đã sửa đổi. File pdf mới của bạn sẽ có thứ tự các trang và nội dung sẽ được như bạn đã sắp xếp.
2. Split: Nếu tab Collate cho phép bạn gộp file hay sắp xếp lại các trang thì tab Split là nơi để bạn cắt 1 file pdf ra làm nhiều phần nhỏ. Mỗi phần là 1 trang của file pdf nguyên mẫu và bạn vẫn có thể truy cập vào mỗi trang này 1 cách bình thường.
Để làm được điều này, chỉ cần click vào Source PDF file, chọn file cần chia và nhấn vào Save. Chương trình sẽ tự động tạo ra các file con với tên file là tên file gốc kèm theo số trang tương ứng. Chẳng hạn nếu bạn cắt file có tên “file 1” thì các file con sẽ có dạng “file 1_001”, “file 2_002”… (dãy số kèm theo tên file chính là số thứ tự của trang nằm trên file gốc)
3. Background/Stamps: đây là tab giúp bạn đóng “dấu ấn cá nhân” của mình lên nội dung file pdf. - Chức năng Background sẽ cho phép bạn đưa hình nền vào mỗi trang hay vào trang đầu tiên của file pdf. - Chức năng Stamp sẽ tương tự như Backgroup, chỉ có khác là nó chỉ đóng dấu lên đỉnh của mỗi trang (thay vì ở giữa trang như Backgroup).
Điểm hạn chế của tính năng này đó là không cho phép bạn chọn Backgroup hay Stamp từ các hình ảnh mà phải từ các file pdf khác. Do vậy, bạn phải tự mình tạo ra file pdf chứa biểu tượng của mình để sử dụng.
Tính năng này sẽ đặc biệt hữu ích cho những công ty hay những trang web muốn đóng dấu bản quyền cho những tài liệu của mình.
4. Rotate: Trong quá trình scan tài liệu để làm ebook (định dạng file pdf), 1 vài trang tài liệu có thể bị đảo lộn và sẽ rất khó khăn để đọc được chúng. Tab Rotate sẽ giúp bạn khắc phục tình trạng này.
- Click vào Source PDF Document để chọn filep pdf cần tiến hành. - Điền số thứ tự của trang cần tiến hành thay đổi góc nhìn vào khung Rotate Pages from… to… - Chọn góc xoay (chẳng hạn nếu tài liệu bị dựng đúng thì có thể xoay ngược lại 90o để trở lại góc nhìn bình thường.
Và cuối cùng click vào Save As file để lưu kết quả.
Ngoài 4 tính năng chính nêu trên, PDFTK còn cho phép bạn thiết lập mật khẩu cho file pdf sau khi chỉnh sửa của mình, hủy bỏ chức năng in hay chỉnh sửa cũng như sao chép nội dung của file đó để có thể bảo đảm an toàn hơn cho nội dung của file.
Tóm lại, PDFTK là tiện ích tuyệt vời dành cho PDF. Hy vọng nó sẽ giúp ích cho bạn trong việc chỉnh sửa hay tối ưu những file pdf của mình khi cần thiết. Rất đơn giản để sử dụng, bạn chỉ việc click vào Source PDF Document để chọn file cần chèn hình nền và click vào Background or Stamp PDF Page để chọn file pdf có chứa hình nền hoặc biểu tượng. Lựa chọn Backgroup hay Stamp ở bên dưới để sử dụng tính năng tương ứng, đánh dấu vào mục Add Backgroup or Stamp to first Page only nếu chỉ muốn đóng dấu lên trang đầu tiên và cuối cùng click Save As để lưu file. |
Phản hồi : Leave a Comment »
Thẻ: pdf
Chuyên mục : Thủ thuật
Trích xuất đoạn văn bản của file pdf
16 12 2008Khi xem nội dung một tập tin PDF, bạn cần sao chép một đoạn văn bản trong toàn bộ file thì cũng phải qua nhiều thao tác, nhưng nếu sử dụng Text Mining Tool thì công việc trở nên đơn giản hơn.
Bạn có thể tải phần mềm miễn phí trực tiếp tại đây, dung lượng 8,39MB và yêu cầu hệ thống cài sẵn .NET FrameWork 2.0 trở lên.
Sau khi tải về, bạn thực thi tập tin TextMiningTool.exe trong thư mục giải nén để chạy chương trình. Giao diện chương trình rất đơn giản, để thực hiện việc lấy một đoạn text nào của tập tin PDF bạn thực hiện như sau:
+ Nhấn nút Open chỉ đường dẫn để mở một file PDF chứa đoạn text muốn sao chép. Sau đó bôi đen đoạn text muốn sao chép và nhấn tổ hợp phím Ctrl + C (hoặc có thể nhấn vào nút Clipboard để lưu vào bộ nhớ Clipboard).
+ Mở một ứng dụng có khả năng soạn thảo văn bản như Notepad hoặc Word rồi dán nội dung đoạn text vừa copy vào ó. Thế là bạn đã có đoạn văn bản cần chép, tại đây bạn hoàn toàn có thể thêm bớt, chỉnh sửa đoạn text đó dễ dàng.
Phản hồi : Leave a Comment »
Thẻ: pdf
Chuyên mục : Thủ thuật
Trích xuất ảnh trong file PDF dễ dàng
30 11 2008PDF là định dạng file văn bản phố biến nhất hiện nay trên Internet. Tuy nhiên, khi nhận được 1 file pdf, bạn không thể nào lấy được hình ảnh bên trong. Với phần mềm miễn phí Some PDF Image Extract, việc này có thể thực hiện nhanh chóng và dễ dàng mà chất lượng ảnh không hề giảm.
>> Chuyển ảnh từ file PDF thành JPG
Giao diện Some PDF Image Extract
Cách thức sử dụng chương trình rất đơn giản, để tiến hành bạn thực hiện như sau:
Vào chọn biểu tượng tài liệu mở đầu tiên ở hàng chứa các công cụ (hoặc Ctrl+O), chỉ đến đường dẫn của tài liệu PDF cần mở rồi nhấn Open, chương trình hỗ trợ mở nhiều tài liệu PDF cùng một lúc. Hoặc bạn cũng có thể chọn cả thư mục chứa nhiều tài liệu file PDF cùng lúc ở biểu tượng thứ 2 (nhấn Ctrl+D). Nếu muốn xóa bớt file nào bạn đánh dấu vào nó và nhấn vào biểu tượng chữ X màu đỏ.
Tiếp theo, đánh dấu vào những tài liệu PDF cần tiến hành trích xuất hình ảnh rồi nhấn nút tam giác màu đen ở phía góc dưới cùng bên trái cho chương trình thực hiện chuyển đổi. Khi đã xong, mặc định chương trình sẽ mở thư mục chứa file trích xuất ra cho bạn, bạn chỉ cần mở thư mục chứa những file đã xuất ra và lấy ảnh mà thôi (mặc định nó để trong thư mục chứa file PDF gốc)
Ngoài ra, nếu muốn điều chỉnh một số tùy chọn cho chương trình bạn chuyển sang cột bên phải với một số tùy chọn như sau:
+ Page Range: lựa chọn khả năng trích xuất file ảnh trong file PDF như tất cả trang hoặc từng trang bạn chọn.
+ Open Result: nó sẽ tự động mở thư mục sau khi trích xuất xong nếu đặt ở lựa chọn Yes
+ Output Directory: chỉ vị trí lưu ảnh sau khi trích xuất.
+ Output mode: chọn định dạng ảnh sau khi trích xuất.
+ Jpeg Quality và Jpeg Gray Scale: chọn chất lượng ảnh sau khi xuất (chỉ hỗ trợ xuất ảnh định dạng Jpeg mà thôi). Dung lượng ảnh và chất lượng ảnh cao hay thấp là phụ thuộc chính vào lựa chọn này.
Bạn có thể tải phần mềm về tại đây, tương thích với hệ điều hành Windows 2000 trở lên (hỗ trợ cả Vista).
TRUNG TÂM
Phản hồi : Leave a Comment »
Thẻ: pdf
Chuyên mục : Thủ thuật
Biến hóa định dạng file văn bản PDF
27 10 2008
Thông thường, các file định dạng PDF sẽ không cho phép bạn chỉnh sửa hay trích dẫn cũng như sao chép nội dung trong file. Do đó, trong trường hợp bạn cần trích xuất 1 đoạn nội dung trong file hay chuyển đổi file sang các định dạng văn bản khác như .doc,. txt hay rtf… thì Text-Mining-Tool sẽ là lựa chọn thích hợp.
Text-Mining-Tool là tiện ích miễn phí, cho phép bạn xem và trích xuất nội dung từ các file văn bản như pdf, doc, rtf.. mà không yêu cầu cài đặt bất kỳ chương trình đọc file nào. Bạn có thể download chương trình tại đây (sau khi giải nén, bạn kích hoạt file TextMiningTool.exe để sử dụng ngay mà không cần cài đặt). Chương trình yêu cầu máy tính của bạn phải có .NET Framework 2.0, download tại đây.
Chương trình có giao diện đơn giản và rất dễ sử dụng. Tại giao diện chính, kích vào Open, chọn file mà bạn muốn chuyển đọc hay trích xuất nội dung. Bây giờ, cửa sổ chính của chương trình sẽ hiển thị toàn bộ nội dung của file mà bạn đã chọn.
Để trích xuất 1 đoạn nội dung, bạn bôi đen đoạn nội dung đó, nhấn tổ hợp phím Ctrl - C để copy vào clipboard, mở chương trình soạn thảo bất kỳ và nhấn Ctrl - V để dán đoạn nội dung vừa sao chép. Trong trường hợp muốn copy toàn bộ nội dung của file được mở, bạn click vào nút ClipBoard trên thanh menu rồi mở chương trình soạn thảo văn bản để dán toàn bộ nội dung vừa sao chép.
Ngoài ra, nếu muốn chuyển đổi file sang 1 định dạng mới, bạn click vào nút Save trên thanh Menu. Cửa sổ lưu file hiện ra, bạn đặt tên file mới vào mục File name kèm theo phần mở rộng của định dạng file. Chẳng hạn bạn muốn chuyển đổi 1 file pdf sang file văn bản của Microsft Word, bạn click Open để chọn file pdf, click Save và đặt tên file kèm theo .doc tại mục File name.
Chúng ta có thể dễ dàng nhận ra điểm hạn chế của chương trình ở đây đó là không cho phép bạn chọn định dạng văn bản sẵn có lúc save mà phải tự mình chọn định dạng tương ứng. Điều này sẽ hơi khó khăn cho những ai không nắm rõ về các định dạng file. Ngoài ra, 1 điểm hạn chế nữa của chương trình đó là không thể hiển thị các hình ảnh có trong nội dung của văn bản, bất kể là văn bản với định dạng file nào.
Tuy nhiên, cần phải thừa nhận rằng chương trình này đơn giản và rất dễ sử dụng. Hy vọng với sự giúp đỡ của Text-Mining-Tool, bạn sẽ không còn phải gặp khó khăn khi cần trích xuất nội dung từ những văn bản định dạng pdf. Ngoài ra, chương trình còn giúp bạn dễ dàng đọc file mà không cần phải cài đặt thêm bất kỳ chương trình đọc file nào khác.
Phản hồi : Leave a Comment »
Thẻ: pdf
Chuyên mục : Thủ thuật
Xem trực tuyến file PDF với PDFMENOT
18 10 2008

Thông thường, để xem được 1 file PDF, bạn sẽ download file đó về máy, sử dụng các tiện ích đọc file PDF để mở. Tuy nhiên, nếu máy tính của bạn chưa cài đặt bất kỳ 1 tiện ích mở file PDF nào, thì bạn vẫn còn có cách để xem trực tuyến file PDF mà ko cần phải download nó về máy cũng như cài đặt thêm bất kỳ phần mềm nào.
PDFmenot là một dịch vụ miễn phí cho phép bạn xem file PDF trực tuyến cho dù file được lưu trữ trong máy tính hay trên 1 server nào đó.
Để sử dụng, dịch vụ, bạn truy cập vào trang web. Tại đây có 2 lựa chọn:
- Để xem 1 file PDF được chứa trên 1 server nào đó, bạn copy địa chỉ chứa filep PDF đó và dán vào mục Enter the URL of a PDF file và click vào nút View PDF.
- Để xem 1 file PDF có sẵn trên máy tính của bạn, chỉ việc click vào Browse, chọn file PDF cần xem và click vào upload.
Sau khi upload thành công, nội dung của file pdf cần xem sẽ được hiển thị trong cửa sổ trình duyệt. Bạn điều chỉnh độ phóng to thu nhỏ của file bằng thanh trượt và điều chỉnh trang đang xem bằng nút bấm ở góc phải của trang web.
Một điều là dịch vụ này cho phép bạn upload nhiều file PDF hoàn toàn miễn phí, tương đương với một host PDF giành cho mọi người. Sau khi upload, bạn có thể lấy link của file PDF và gửi cho bạn bè hay đồng nghiệp. Thời hạn lưu trữ của file trên trang web là mãi mãi, do vậy chúng ta có thể hoàn toàn yên tâm về tuổi thọ đường link của mình. Ngoài ra, bạn cũng có thể sao chép đoạn mã HTML mà trang web cung cấp sau khi upload để chèn vào trong bất kì trang web nào mà bạn muốn. Điều này giúp cho người đọc có thể xem các file PDF bạn chia sẽ mà không cần đến bất kí một phần mềm đọc PDF nào cài đặt trong máy tính của họ hay trong cửa sổ trình duyệt.
Và nếu như bạn là một webmaster hay một blogger, thì PDFmenot cung cấp 1 đoạn mã Javascript để chèn vào website hay blog của mình. Bây giờ, người xem truy cập vào trang của bạn, dù có hay ko có cài đặt chương trình đọc PDF thì họ vẫn có thể xem được các file PDF một cách bình thường thông qua sự trợ giúp của PDFMenot.
Bạn chỉ việc chèn đoạn mã sau vào vị trí thích hợp trong trang web của mình:
<script type=”text/javascript” src=”http://pdfmenot.com/convert.js”></script>
Tóm lại, PDFMeNot là tiện ích cần thiết đối với những ai thường xuyên tìm kiếm ebook từ Internet, qua đó bạn có thể xem trước nội dung của những cuốn sách tìm kiếm trước khi quyết định có download nó về máy hay không.
Phản hồi : Leave a Comment »
Thẻ: pdf
Chuyên mục : Thủ thuật











Phản hồi gần đây