Wget là một trình quản lý tải xuống nguồn mở. Đây là một ứng dụng bảng điều khiển được phát triển chủ yếu cho Linux nhưng đã được chuyển thành công trên các hệ điều hành khác, bao gồm Windows và MacOS.
bất động sản
Nếu bạn không quen với wget, bạn chắc chắn nên thử. Nó rất mạnh mẽ. Nó cho phép tìm nạp các tệp từ các trang web bằng HTTP, HTTPS và FTP, các giao thức Internet mà chúng ta đang sử dụng ngày nay. Hành vi của nó được điều khiển bởi các đối số dòng lệnh.
Wget hỗ trợ nhiều tùy chọn khác nhau để truy xuất tệp trên các kết nối chậm hoặc không ổn định, bao gồm thử lại, tiếp tục ở nơi kết nối còn lại, v.v. Nó hỗ trợ tệp 'robots.txt' nên có thể hoạt động giống như một trình thu thập dữ liệu web. Nó chỉ có thể truy xuất các tệp đã sửa đổi, hỗ trợ ký tự đại diện, giới hạn loại tệp và phần mở rộng thông thường.
Wget hỗ trợ truy xuất đệ quy các trang web HTML và máy chủ FTP, cho phép bạn tạo một bản sao trang web. Đây là cách nó có thể được thực hiện.
Trước khi tiếp tục, bạn cần tải ứng dụng wget.
Nội dung trốn Tải Wget trên Windows Tải Wget trên Linux Debian/Ubuntu/Mint: CentOS/Redhat Arch Linux Linux trống Để tạo bản sao ngoại tuyến của một trang web bằng Wget,Tải Wget trên Windows
Tôi thường sử dụng các tệp nhị phân từ các nguồn này:
Cả hai đều làm công việc của mình.
Tải Wget trên Linux
Sử dụng trình quản lý gói của bản phân phối của bạn. Một số ví dụ (chạy chúng dưới quyền root):
Debian/Ubuntu/Mint:
|_+_|
CentOS/Redhat
|_+_|
Arch Linux
|_+_|
Linux trống
|_+_|
Để tạo bản sao ngoại tuyến của một trang web bằng Wget,
- Mở dấu nhắc lệnh/thiết bị đầu cuối.
- Trên Windows, nhập đường dẫn đầy đủ đến tệp wget.exe.
- Trên Linux, chỉ cần gõ wget.
- Bây giờ, hãy nhập các đối số sau để nhận được lệnh sau: |_+_|
- Thay thế |_+_| với URL trang web thực tế mà bạn muốn tạo bản sao.
Bạn xong việc rồi!
Dưới đây là các công tắc chúng tôi sử dụng:
- |_+_| - áp dụng một số tùy chọn để thực hiện tải xuống đệ quy.
- |_+_| – Không thu thập dữ liệu thư mục mẹ chỉ để lấy một phần của trang web.
- |_+_| - làm cho tất cả các liên kết hoạt động bình thường với bản sao ngoại tuyến.
- |_+_| - tải xuống các tệp JS và CSS để giữ lại kiểu trang gốc khi duyệt máy nhân bản cục bộ.
- |_+_| - thêm các tiện ích mở rộng thích hợp (ví dụ: html, css, js) vào tệp nếu chúng được truy xuất mà không có chúng.
Đó là nó.