Broken link: Khái niệm, nguyên nhân và cách xử lý gọn

Broken Link là những con đường cụt vô hình, chúng làm Googlebot bối rối và đẩy người dùng vào ngõ cụt lỗi 404. Chúng ta thường chỉ tập trung vào việc tạo ra backlink mới, nhưng quên mất việc bảo trì những liên kết đã có. Hãy cùng Xuyên Việt Media tìm hiểu chính xác Broken Link là gì và cách bạn có thể khôi phục lại toàn bộ sức mạnh SEO đang bị thất thoát đó.”

Broken link là gì: Khái niệm link gãy

Broken Link (liên kết hỏng) là một liên kết trên website dẫn đến một trang không tồn tại hoặc không thể truy cập được. Khi người dùng hoặc công cụ tìm kiếm (như Google) nhấp vào broken link, họ thường gặp các lỗi như:

  • 404 Not Found: Trang đích không tồn tại.
  • 410 Gone: Trang đã bị xóa vĩnh viễn.
  • 500 Internal Server Error: Lỗi máy chủ.
  • 403 Forbidden: Không có quyền truy cập.
  • Timeout: Máy chủ không phản hồi.

Broken links có thể xuất hiện trong nội dung website (internal links), liên kết đến các trang bên ngoài (external links), hoặc trong backlink từ các website khác trỏ về site của bạn.

Ví dụ:

  • Với link nội bộ trong web Xuyên Việt Media: Có 1 bài A trỏ về bài B nhưng admin xóa bài B. Lúc này link bài B bị mất và gọi là broken link
  • Với link out trên web Xuyên Việt Media: Trong bài X trỏ về trang báo Dân Trí nhưng bài báo bị xóa. Lúc này tạo ra 1 link gãy
Broken link là gì
Broken link là gì

Vai trò của Broken Links trong SEO?

Broken links ảnh hưởng tiêu cực đến cả trải nghiệm người dùng (UX)hiệu suất SEO, đặc biệt trong White Hat SEO. Dưới đây là các tác động chính:

Tác động đến UX:

  • Người dùng gặp lỗi (như 404) sẽ cảm thấy thất vọng, giảm thời gian ở lại trên trang và tăng tỷ lệ thoát (bounce rate).
  • Theo Google Search Central (2025), trải nghiệm người dùng kém có thể làm giảm thứ hạng tìm kiếm.

Tác động đến SEO:

  • Crawlability: Broken links khiến bot của Google (Googlebot) khó thu thập dữ liệu, làm giảm hiệu quả index.
  • Link Juice: Liên kết hỏng làm gián đoạn dòng chảy của “link juice” (giá trị SEO từ backlinks), ảnh hưởng đến thứ hạng.
  • E-E-A-T: Website có nhiều broken links có thể bị xem là thiếu Trustworthiness (độ tin cậy), một yếu tố quan trọng trong E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness).
  • Theo Moz (2025 SEO Trends), website có nhiều lỗi kỹ thuật như broken links có thể mất 10-15% thứ hạng trong các truy vấn cạnh tranh.

Tác động đến traffic: Theo nghiên cứu của SEMrush (2024), broken links trên các trang có traffic cao có thể làm giảm 20-30% lưu lượng truy cập organic nếu không được sửa chữa.

Tác động từ Google Updates: Các cập nhật như March 2024 Core UpdateAugust 2025 Spam Update nhấn mạnh chất lượng website. Broken links là một dấu hiệu của website không được bảo trì tốt, có thể dẫn đến giảm thứ hạng.

Nguyên nhân gây ra broken link

Broken Links (Liên kết gãy) là một vấn đề kỹ thuật phổ biến và có thể xảy ra vì nhiều nguyên nhân khác nhau. Hầu hết các nguyên nhân này đều liên quan đến sự thay đổi của trang đích mà liên kết đó trỏ tới.

1. Nội dung bị xóa hoặc di chuyển mà không có chuyển hướng

Một trang web bị xóa hoặc URL của trang thay đổi (ví dụ: do tái cấu trúc website) mà không thiết lập chuyển hướng 301 để dẫn người dùng/công cụ tìm kiếm đến trang mới.
Ví dụ:
  • Trang  /product/giay-chay-bo bị xóa vì sản phẩm ngừng kinh doanh.
  • URL thay đổi từ /blog/seo-tips thành /blog/seo-guides mà không có redirect.
Gây lỗi 404 Not Found, làm gián đoạn trải nghiệm người dùng và giảm hiệu quả crawl của Googlebot.
Theo SEMrush (2024), đây là nguyên nhân phổ biến nhất, chiếm khoảng 40% broken links trên các website thương mại điện tử.
Nguyên nhân gây ra broken link
Nguyên nhân gây ra broken link

2. Sai cú pháp hoặc lỗi nhập URL

URL được nhập sai chính tả hoặc định dạng sai trong mã nguồn, nội dung, hoặc dữ liệu có cấu trúc (Schema Markup).
Ví dụ:
  • Liên kết viết sai: example.com/pgae thay vì example.com/page.
  • Liên kết thiếu giao thức: example.com/product thay vì https://example.com/product.
Dẫn đến lỗi 404 hoặc không thể truy cập, đặc biệt nếu liên kết được nhúng trong nội dung hoặc backlinks.
Moz (2025 SEO Trends) báo cáo rằng lỗi nhập URL chiếm 15-20% broken links trên các website lớn.

3. Website bên ngoài ngừng hoạt động hoặc thay đổi

Các liên kết external (trỏ ra ngoài website) dẫn đến trang không còn tồn tại do website đích bị xóa, di chuyển, hoặc ngừng hoạt động.
Ví dụ:
  • Bạn liên kết đến một bài viết trên blog bên ngoài (blog.com/seo-tips), nhưng blog đó đã bị xóa.
  • Trang đích đổi URL mà không có redirect (ví dụ: từ blog.com/old-post sang blog.com/new-post).
Gây lỗi 404 hoặc 410, làm giảm độ tin cậy của nội dung (Authoritativeness trong E-E-A-T).
Theo Ahrefs (2024), khoảng 30% external links trên các website trở thành broken links sau 2-3 năm do link decay.

4. Lỗi máy chủ hoặc cấu hình hosting

Sự cố máy chủ (server errors) hoặc cấu hình hosting sai dẫn đến các trang không thể truy cập được.
Ví dụ:
  • Lỗi 500 Internal Server Error do cấu hình server không đúng.
  • Timeout do máy chủ quá tải hoặc ngừng hoạt động tạm thời.
  • Lỗi DNS khiến domain không thể phân giải.
Làm gián đoạn cả người dùng và Googlebot, ảnh hưởng đến crawlability và thứ hạng.
Theo Google Search Central (2025), lỗi máy chủ chiếm khoảng 10% nguyên nhân broken links, đặc biệt trên các website sử dụng hosting kém chất lượng.

5. Cập nhật hoặc thay đổi CMS (Hệ thống quản trị nội dung)

Thay đổi cấu trúc URL, theme, hoặc plugin trong CMS (như WordPress, Shopify) mà không cập nhật liên kết hoặc thiết lập redirect.
Ví dụ:
  • Chuyển từ /post/123 sang /blog/post-title sau khi cập nhật WordPress.
  • Xóa plugin SEO làm mất các redirect tự động.
Gây ra hàng loạt lỗi 404 trên toàn website, đặc biệt nếu có nhiều trang.
SEMrush (2024) ghi nhận rằng 15% broken links trên các website WordPress xuất phát từ thay đổi cấu trúc URL.

6. Lỗi trong dữ liệu có cấu trúc (Schema Markup)

Liên kết trong dữ liệu có cấu trúc (như Schema Product, FAQPage) trỏ đến URL không tồn tại hoặc sai.
Ví dụ:
  • Schema Product chứa URL hình ảnh (image) không tồn tại: example.com/image-not-found.jpg.
  • Schema FAQPage trỏ đến URL trang không còn tồn tại.
Làm Google không hiển thị Rich Snippets, giảm CTR, và có thể gây lỗi trong Google Search Console.
Theo Google Search Central (2025), lỗi trong dữ liệu có cấu trúc là nguyên nhân phổ biến gây mất Rich Snippets, chiếm 5-10% vấn đề kỹ thuật.

7. Backlinks từ website khác trỏ đến trang không tồn tại

Các backlinks từ website bên ngoài trỏ đến URL đã bị xóa hoặc đổi trên website của bạn.
Ví dụ:
  • Một blog liên kết đến example.com/old-product, nhưng trang này đã bị xóa.
  • Backlink từ diễn đàn trỏ đến URL không còn tồn tại do tái cấu trúc site.
Làm mất giá trị SEO từ backlinks (link juice) và ảnh hưởng đến thứ hạng.
Ahrefs (2024) báo cáo rằng 66% backlinks trở thành broken sau 9 năm do link decay hoặc thay đổi URL.

8. Chặn truy cập hoặc cấu hình sai quyền

Trang bị chặn bởi robots.txt, .htaccess, hoặc các cài đặt bảo mật, dẫn đến lỗi 403 Forbidden hoặc 401 Unauthorized.
Ví dụ:
  • Trang bị chặn trong robots.txt: Disallow: /private-page/.
  • Cấu hình .htaccess sai, chặn truy cập vào một số URL.
Ngăn Googlebot thu thập dữ liệu, làm giảm khả năng index và hiển thị trên SERPs.
Ít phổ biến hơn (khoảng 5%), nhưng thường xảy ra trên website có bảo mật cao hoặc cấu hình sai.

Cách kiểm tra broken link trên toàn web

Kiểm tra Broken Link (Liên kết gãy) trên toàn bộ website là một công việc SEO kỹ thuật cần thiết để duy trì sức khỏe của website và đảm bảo trải nghiệm người dùng.

Dưới đây là các phương pháp hiệu quả nhất để tìm kiếm và xác định các liên kết gãy trên toàn web của bạn:

1. Sử dụng Google Search Console

Google Search Console (GSC) là công cụ quan trọng nhất để tìm các lỗi mà Googlebot đã phát hiện.

Cách kiểm tra:

  • Đăng nhập vào GSC và chọn website của bạn.
  • Vào mục “Pages” (Trang) dưới phần “Indexing” (Lập chỉ mục).
  • Cuộn xuống phần “Why pages aren’t indexed” (Lý do trang không được lập chỉ mục) và tìm kiếm các lỗi sau:
  1. 404: Đây là lỗi liên kết gãy phổ biến nhất. GSC sẽ cho bạn biết những trang nào đang trả về lỗi 404.
  2. Soft 404: Lỗi này xảy ra khi trang hiển thị nội dung cho người dùng nhưng lại trả về mã trạng thái 200 (OK) cho Google, khiến Googlebot bối rối.

GSC chỉ hiển thị những lỗi mà Google thực sự quan tâm, giúp bạn ưu tiên khắc phục các vấn đề ảnh hưởng trực tiếp đến khả năng lập chỉ mục của Google.

2. Công cụ Screaming Frog SEO Spider

Đây là công cụ thu thập dữ liệu (crawler) mạnh mẽ, giúp bạn mô phỏng cách Googlebot nhìn nhận website của mình.

Cách kiểm tra:

  • Tải xuống và cài đặt Screaming Frog SEO Spider (có phiên bản miễn phí giới hạn 500 URL).
  • Nhập URL gốc của website bạn vào thanh tìm kiếm và nhấn “Start”.
  • Sau khi quá trình thu thập hoàn tất, sử dụng bộ lọc:
  1. Chuyển đến tab “Response Codes” (Mã phản hồi).
  2. Lọc theo mã trạng thái “4xx Client Error” (chủ yếu là 404) và “5xx Server Error”.
  3. Xem cột “Inlinks” để biết trang nào trên website của bạn đang chứa liên kết gãy đó.

Phát hiện nhanh chóng cả liên kết nội bộ gãyliên kết ngoài gãy trên quy mô lớn, kể cả những lỗi mà Googlebot chưa kịp phát hiện.

3. Sử dụng Công cụ trả phí Ahrefs / SEMrush

Các công cụ trả phí này cung cấp báo cáo chuyên sâu và tiện lợi nhất.

Cách kiểm tra:

  • Sử dụng Site Audit (Kiểm tra Website) của Ahrefs hoặc SEMrush.
  • Sau khi kiểm tra, vào mục báo cáo “Internal Links” hoặc “Broken Links”.
  • Công cụ sẽ liệt kê các URL bị gãy, cho biết mức độ nghiêm trọng và trang nguồn nào đang liên kết đến chúng.

Các công cụ này thường phân loại lỗi theo mức độ ưu tiên, giúp bạn biết nên sửa lỗi nào trước. Chúng cũng giúp bạn tìm Broken External Links để sử dụng chiến thuật Broken Link Building.

4. PluginBroken Link Checker (web WP)

  • Tự động quét toàn bộ bài viết, trang, bình luận
  • Hiển thị link hỏng ngay trong dashboard
  • Cho phép sửa hoặc gỡ link trực tiếp

5. Dùng công cụ online miễn phí

  • BrokenLinkCheck.com
  • Dead Link Checker
Chỉ cần nhập domain → tool sẽ quét và báo danh sách link gãy.

Cách khắc phục nhanh broken link

Dưới đây là hướng dẫn chi tiết từng bước để khắc phục broken links nhanh chóng trong White Hat SEO, dựa trên Google Search Central, Moz, SEMrush, và các nguồn uy tín (cập nhật đến 9/2025).

1. Redirect 301 về trang liên quan

  • Nếu link hỏng từng dẫn đến bài viết, sản phẩm, dịch vụ → dùng redirect 301 về trang tương đương
  • Dùng plugin như Rank Math, Redirection, hoặc chỉnh .htaccess

2. Gỡ bỏ hoặc thay thế link trong nội dung

  • Vào bài viết/trang chứa link hỏng → xóa hoặc thay bằng link mới
  • Nếu link ngoài bị chết → tìm nguồn thay thế hoặc bỏ luôn
Tránh để người dùng click vào rồi gặp lỗi 404

3. Kiểm tra & xử lý hàng loạt bằng plugin

Nếu dùng WordPress:
  • Cài plugin Broken Link Checker
  • Quét toàn bộ site → hiển thị danh sách link lỗi
  • Sửa, redirect hoặc gỡ bỏ trực tiếp trong dashboard

4. Dùng Google Search Console để xử lý theo báo cáo

  • Vào GSC → tab “Pages” hoặc “Covers”
  • Xem lỗi 404 Not Found
  • Bấm vào từng URL → xác định nguồn → sửa hoặc redirect
Ưu tiên xử lý các link bị Googlebot phát hiện

5. Tạo trang 404 thân thiện + gợi ý nội dung

Nếu không thể redirect → tạo trang 404 có:

  • Lời xin lỗi
  • Gợi ý bài viết liên quan
  • Form tìm kiếm

Giữ người dùng ở lại website thay vì thoát ra

Sử dụng các công cụ như Google Search Console để theo dõi lỗi 404 và khắc phục nhanh chóng là chìa khóa để giữ cho website của bạn luôn “sạch” và tối ưu.

Liên kết gãy, hay Broken Link, là một vấn đề kỹ thuật phổ biến nhưng cực kỳ nguy hiểm trong SEO. Nó là hậu quả của việc đường dẫn URL không còn tồn tại hoặc bị thay đổi, dẫn đến lỗi 404 Not Found cho cả người dùng và công cụ tìm kiếm.

Broken Link gây ra tác hại kép: làm giảm nghiêm trọng trải nghiệm người dùng (UX) và làm suy yếu hiệu suất SEO của website bằng cách làm lãng phí tài nguyên thu thập dữ liệu (Crawl Budget) và chặn sự truyền tải Link Juice (sức mạnh liên kết).

Đánh giá post