Trình tạo Robots.txt

Trình tạo Robots.txt

Tạo tệp Robots.txt cho trang web của bạn một cách tự động và ngay lập tức, không cần tự viết mã nữa

Để trống nếu bạn không có.

Google
Google Image
Google Mobile
MSN Search
Yahoo
Yahoo MM
Yahoo Blogs
Ask/Teoma
GigaBlast
DMOZ Checker
Nutch
Alexa/Wayback
Baidu
Naver
MSN PicSearch

Đường dẫn liên quan đến gốc và phải chứa dấu gạch chéo "/".

Giới thiệu về công cụ tạo Robots.txt:

Khi bạn muốn ngăn một số trang trên trang web của mình được thu thập thông tin và lập chỉ mục bởi các công cụ tìm kiếm như Google hoặc bạn muốn không cho phép hình ảnh xuất hiện trên quy chế thu thập thông tin của mình hoặc bạn chỉ muốn tiết kiệm ngân sách thu thập thông tin trang web của mình, thì phương pháp tốt nhất cho tất cả những gì là sử dụng chức năng tệp Robots.txt.

Sử dụng tệp Robots.txt cho phép bạn kiểm soát nội dung trang web của mình, nó cung cấp cho bạn chức năng cho phép hoặc ngăn các trang, bài đăng, hình ảnh, Googlebots, Yahoo, Bing hoặc MSN từ hoặc được lập chỉ mục trên Google lập chỉ mục. Điều đó có nghĩa là bạn có thể không cho phép lập chỉ mục một số trang hoặc bạn có thể không cho phép toàn bộ trang web nhưng cho phép một số trang.

Vì vậy, nếu bạn có đăng nhập hoặc trang đăng ký hoặc thậm chí là các trang bảng điều khiển quản trị của mình và bạn không muốn chúng được lập chỉ mục và hiển thị trên các công cụ tìm kiếm, hãy xem xét thêm tệp Robots.txt vào trang web của bạn và thêm vai trò phù hợp với nó.

Trình tạo Robots.txt là gì?

Trình tạo Robots.txt của SEOStudio là một công cụ trực tuyến miễn phí giúp bạn tạo tệp Robots.txt thích hợp cho trang web của mình. Nó sẽ tự động tạo văn bản cho bạn và cho phép bạn tải xuống tệp để bạn tải nó lên máy chủ. Nó cũng sẽ cho phép bạn tùy chỉnh nó với một số tùy chọn bổ sung, chẳng hạn như loại bot nào nên được phép trên trang web của bạn và những thư mục hoặc tệp nào nên được loại trừ khỏi việc thu thập thông tin bởi bot của công cụ tìm kiếm hoặc không được lập chỉ mục bởi chúng.

Trình tạo Robots.txt là một cách dễ dàng để thêm tệp Robots.txt vào trang web của bạn mà không cần phải tự viết mã theo cách thủ công. Ý tưởng cơ bản đằng sau công cụ này là nó cho phép bạn tạo và xuất bản tệp Robots.txt chỉ trong vài giây mà không cần viết mã, điều này rất quan trọng đối với những người không có kiến ​​thức kỹ thuật về cách các tệp này hoạt động hoặc cách chúng nên được định dạng và những gì chúng nên bao gồm trong chúng.

Tất cả những gì bạn phải làm để tạo tệp Robots.txt của riêng mình là làm theo các bước bên dưới và sau đó tải tệp lên thư mục gốc của trang web hoặc ứng dụng của bạn.

Làm thế nào để sử dụng trình tạo SEOStudio Robots.txt?

Trình tạo Robots.txt trong SEOStudio rất dễ sử dụng và miễn phí, bạn có thể truy cập nó bằng cách truy cập trang web, sau đó nhấp vào công cụ Robots.txt Generator, sau đó làm theo các bước sau:

  1. Tùy chọn đầu tiên là cài đặt mặc định của tất cả các trang web. Nếu bạn muốn tất cả các URL của trang web không được phép và để một số trang được phép, thì hãy đặt mặc định thành Không cho phép. Còn không thì để mặc định là "(Cho phép).
  2. Bước tiếp theo là đặt độ trễ thu thập thông tin. Tùy chọn này được sử dụng khi bạn cần yêu cầu trình thu thập thông tin chạy chậm lại một chút để không làm quá tải máy chủ. trong hầu hết các máy chủ web nói chung, tùy chọn này là không cần thiết, nhưng nếu bạn chạy trang web của mình thực sự trên một máy chủ web tài nguyên ngân sách thấp, hãy xem xét sử dụng tùy chọn này.
  3. Trong tùy chọn thứ ba, bạn có thể thêm sơ đồ trang web của mình nếu bạn có. Khi thêm sơ đồ trang của trang web, nó tạo cơ hội tốt hơn cho trình thu thập thông tin web hiểu những gì nên lập chỉ mục và những gì không nên lập chỉ mục.
  4. Bây giờ bạn có thể muốn ngăn một số công cụ tìm kiếm lập chỉ mục trang web của bạn vì bất kỳ lý do gì. Điều này sẽ được thực hiện trên tùy chọn thứ tư, vì nó cung cấp cho bạn tùy chọn cho phép hoặc không cho phép tất cả các loại công cụ tìm kiếm như Google, Baidu, Yahoo, v.v.
  5. Tùy chọn thứ năm cho phép bạn không cho phép toàn bộ thư mục hoặc thư mục con và các URL của nó được lập chỉ mục bởi các công cụ tìm kiếm và bạn có thể thêm bao nhiêu thư mục con tùy thích. Ví dụ: (https://seostudio.tools/services/) các dịch vụ là thư mục con. Bạn có thể thêm / services / để ngăn thư mục con này và các trang sau nó được lập chỉ mục.
  6. Khi bạn đã thực hiện tất cả các tùy chọn trên, hãy nhấp vào Tạo . Khi bạn làm điều đó, công cụ sẽ ngay lập tức tạo tệp Robots.txt và sau đó bạn có thể sao chép mã và dán vào tệp Robots.txt cũ của mình hoặc tải tệp xuống và tải lên thư mục gốc trang web của bạn.

Tại sao sử dụng trình tạo Robots.txt của chúng tôi?

  • Một trong những điều tốt nhất về trình tạo Robots.txt của chúng tôi là nó cung cấp cho bạn tùy chọn để tinh chỉnh và chỉnh sửa tệp Robots.txt theo ý muốn.
  • Việc sử dụng trình tạo Robots.txt của chúng tôi rất dễ dàng và đơn giản, không có cửa sổ bật lên hấp dẫn và không gây hiểu lầm.
  • Công cụ của chúng tôi làm cho mã Robots.txt rất chính xác. Vì thế. nếu bạn là một người mới bắt đầu trong lĩnh vực này, bạn vẫn có thể sử dụng công cụ này mà không sợ mắc lỗi.
  • Công cụ này hoạt động nhanh chóng, bạn có thể tạo Robots.txt ngay lập tức.
  • Sau khi tạo mã Robots.txt, bạn có thể sao chép mã hoặc tải xuống dưới dạng tệp Robots.txt.
  • Công cụ tạo Robots.txt được sử dụng miễn phí và không giới hạn số lần.

Tệp Robots.txt là gì?

Tệp Robots.txt là một tệp văn bản có một tập hợp các hướng dẫn cho trình thu thập thông tin web được đặt trên thư mục gốc của trang web, nó giúp bạn kiểm soát hành vi của trình thu thập thông tin web. Bạn có thể sử dụng nó để ngăn trình thu thập thông tin lập chỉ mục các trang hoặc thư mục cụ thể trên máy chủ của bạn. Điều này đặc biệt hữu ích nếu bạn có nội dung mà bạn muốn giữ kín, chẳng hạn như danh sách nhân viên của bạn hoặc tài chính công ty.

Mục đích của tệp Robots.txt là gì?

Mục đích của tệp này là quản lý cách các công cụ tìm kiếm tương tác với nội dung trang web của bạn để bạn có thể kiểm soát những gì họ thấy, nơi họ đi và những gì họ không thấy. Nói cách khác, tệp Robots.txt là để cho các trình thu thập thông tin của công cụ tìm kiếm biết những phần nào trên trang web của bạn mà bạn không muốn chúng lập chỉ mục, để chúng có thể tập trung nỗ lực thu thập thông tin vào nội dung bạn muốn được lập chỉ mục.

Tại sao bạn cần một công cụ tạo Robots.txt?

Công cụ tạo tệp robots.txt có thể giúp bạn tạo tệp robots.txt cho trang web của mình chỉ với một vài cú nhấp chuột. Công cụ tạo mã sẽ nhanh chóng tạo mã cho bạn và sau đó tất cả những gì bạn cần làm là sao chép và dán mã đó vào thư mục gốc của trang web hoặc tải nó lên tệp robots.txt hiện có trên trang web của bạn nếu mã đó đã tồn tại ở đó.

Định dạng của tệp Robots.txt là gì và nó bao gồm những gì?

Định dạng đơn giản chung của tệp Robots.txt như được hiển thị bên dưới, nhưng nó có thể chứa nhiều chi tiết hơn như chúng tôi sẽ giải thích sau.

User-agent: *

Disallow:

Tệp Robots.txt nằm ở đâu?

Tệp Robots.txt nằm trong thư mục gốc của trang web của bạn. điều đó có nghĩa là nó nằm trong public_html / cho các máy chủ được chia sẻ và được quản lý và trong / var / www / html / cho các máy chủ VPS.

Làm cách nào để tải tệp Robots.txt lên máy chủ của bạn?

Sau khi bạn tạo và đặt vai trò Robots.txt, bây giờ là lúc tải tệp lên máy chủ. Làm theo hướng dẫn bên dưới để tải bất kỳ mã Robots.txt nào lên thư mục gốc của trang web của bạn.

Trên cPanel:

  • Đăng nhập vào trình quản lý tệp Cpanel của bạn.
  • Đi tới thư mục gốc của trang web nếu bạn muốn tải lên tệp Robots.txt trên đó.
  • Bấm vào nút tải lên.
  • Điều hướng đến tệp Robots.txt của bạn và tải nó lên, thế là xong.
  • Ngoài ra, bạn có thể tạo một tệp mới trên thư mục gốc của mình và đặt tên là “Robots.txt”. Tiếp theo, sao chép mã Robots.txt, dán nó vào bên trong tệp mới và lưu tệp. Bạn xong việc rồi.

Qua SFTP:

  • Đăng nhập vào máy chủ của bạn thông qua các ứng dụng khách SFTP như Filezilla và WinSCP.
  • Chuyển đến thư mục gốc của trang web mà bạn muốn tải lên tệp Robots.txt trên đó.
  • Kéo tệp Robots.txt và đưa tệp vào bên trong thư mục gốc, thế là xong.
  • Ngoài ra, bạn có thể tạo một tệp mới trên thư mục gốc của mình và đặt tên là “Robots.txt”. Tiếp theo, sao chép mã Robots.txt, dán nó vào bên trong tệp mới và lưu tệp. Bạn xong việc rồi.

Làm cách nào để chỉnh sửa tệp Robots.txt trên máy chủ hoặc trang web của bạn?

Để chỉnh sửa tệp Robots.txt trên máy chủ, trước tiên bạn cần tạo mã Robots.txt, hãy sử dụng công cụ tạo Robots.txt của chúng tôi để giúp bạn. Tiếp theo, bạn cần đăng nhập vào các tệp trên trang web của mình và đi đến thư mục gốc. Khi bạn ở đó, hãy tìm kiếm một tệp có tên “Robots.txt”. Khi bạn tìm thấy nó, hãy nhấp chuột phải và chỉnh sửa. Xóa mã cũ và dán mã mới, sau đó bấm lưu.

Các mẫu Robots.txt:

Mã mặc định:

User-agent: *

Disallow:

Không cho phép thu thập thông tin toàn bộ trang web:

User-agent: *

Disallow: /

Không cho phép thu thập thông tin thư mục và nội dung của thư mục:

User-agent: *

Disallow: /services/

Disallow: /forum/

Disallow: /services/seo/seo-consultancy/

Cho phép truy cập vào một trình thu thập thông tin (Googlebot-news trong ví dụ này):

User-agent: Googlebot-news
Allow: /

User-agent: *
Disallow: /

Cho phép truy cập vào tất cả ngoại trừ một trình thu thập thông tin (Googlebot-news trong ví dụ này):

User-agent: Googlebot-news

Disallow: /

User-agent: *

Allow: /

Không cho phép thu thập thông tin của một trang web:

User-agent: *

Disallow: /robots-txt-generator

Disallow: /seo/robots-txt-generator

Không cho phép thu thập thông tin toàn bộ trang web ngoại trừ một thư mục con:

User-agent: *

Disallow: /

Allow: /blog/

Chặn tất cả hình ảnh trên trang web của bạn khỏi Google Hình ảnh:

User-agent: Googlebot-Image

Disallow: /

Đọc thêm về điều đó trên Google .

Làm cách nào để không cho phép lập chỉ mục một thư mục con (thư mục con)?

Nếu bạn không cho phép lập chỉ mục một thư mục cụ thể, hãy chuyển đến thư mục gốc trên các tệp của trang web và chỉnh sửa tệp Robots.txt. Thêm dòng mã này (Không cho phép: / your-subfolder /) và thư mục con của trang web sẽ không được lập chỉ mục.

Tại sao tệp Robots.txt lại quan trọng đối với SEO?

Tệp Robots.txt là một trong những chiến thuật quan trọng đối với SEO vì nó cho các trình thu thập thông tin của công cụ tìm kiếm biết phải làm gì. Nó cho họ biết những trang nào cần thu thập thông tin và những trang nào không nên thu thập thông tin. Nó giúp kiểm soát xem trình thu thập thông tin của công cụ tìm kiếm có thể thu thập dữ liệu trang web của bạn hay không để trình thu thập thông tin tập trung vào nội dung quan trọng hơn để lập chỉ mục.