'Thủ phạm' phía sau sự cố đứt kết nối của Facebook – Tin Công Nghệ Số hóa


Web Suamaytinhits.com có bài: 'Thủ phạm' phía sau sự cố đứt kết nối của Facebook – Tin Công Nghệ Số hóa Border Gateway Protocol (BGP), hệ thống định tuyến giúp người dùng truy cập các website nhanh nhất, được cho là nguyên nhân làm Facebook bị gián đoạn nhiều giờ. – Tin Công Nghệ

Từ 22h40 ngày 4/10 lại gần 5h sáng 5/10, đồng loạt công ty gồm Facebook, Instagram, WhatsApp, Messenger hàng loạt ngừng hoạt động. Đại diện mạng xã hội này cho biết, sai sót khi thay đổi cấu hình bộ định tuyến – được sử dụng để điều phối thông tin giữa các đơn vị dữ liệu – đã gây ra trạng thái gián đoạn.

Tuy Facebook không chia sẻ tin tức chi tiết, một số chuyên gia công nghệ đã phân tích lưu lượng và đánh giá sự cố liên quan đến BGP – giao thức tìm đường nòng cốt trên Internet.

BGP là gì?

Ở cấp độ cơ bản, BGP là một trong số hệ thống định tuyến mà Internet sử dụng để đưa thiết bị của người dùng truy cập đến website đích càng nhanh càng tốt. Chẳng hạn với Facebook, do có nhiều nhà cung cấp cửa hàng Internet với hệ thống router và máy chủ khác nhau, mỗi thiết bị đều có các đường đi không giống nhau để truy cập mạng xã hội. Nhiệm vụ của BGP là “chỉ đường” cho thiết bị để đáp ứng đó là tuyến đường tối ưu nhất.

BGP - thủ phạm khiến Facebook sập toàn cầu

Minh họa về BGP của The Verge .

Tầm quan trọng của BGP được ví như cơ quan kiểm soát không lưu trong nghề hàng không. Tuy nhiên, thực tế vai trò của hệ thống này lớn hơn nhiều, khi có thể vẽ bản đồ và chỉ dẫn máy tính, điện thoại truy cập các website, công ty Internet nhanh nhất.

Với BGP, Internet được chia thành các nút mạng lớn xem là các hệ thống tự trị (Autonomous Systems). Có thể hình dung mỗi điểm nút như 1 quần đảo trong quần đảo. Rất khó bắc hết các cây cầu qua các hòn đảo này, đặc biệt là khi khoảng cách giữa chúng quá xa. Câu hỏi đặt ra là làm ra sao để người sử dụng đi từ đảo A tới đảo X nhanh nhất. Lúc này, BGP chịu trách nhiệm định vị những hòn đảo nào người dùng phải đi qua để đến đích sớm nhất.

Do Internet liên tiếp thay đổi, bản đồ này cũng được cập nhật theo. Nếu không, hệ thống có thể vẫn dẫn người sử dụng theo tuyến cũ, khi đang đã có đường mới gần hơn. Việc lập bản đồ Internet là công việc khổng lồ, các Autonomous Systems sẽ “tham khảo” lẫn nhau để qui trình xảy ra nhanh hơn.

Tuy nhiên, sử dụng bản đồ không phải khi nào cũng đúng. Nó giống tình huống lái xe đi theo xác định GPS và bị lạc. Nếu một điểm gặp lỗi mà không được phát hiện, khu vực đó sẽ tắc nghẽn và lưu lượng đến máy server đích khó khăn hơn.

Ví dụ, một người cần truy cập website A. Máy chủ website này sử dụng dịch vụ của nhà mạng B, còn máy tính của người này lại dùng mạng của nhà cung cấp C. B và C không thể liên lạc trực diện mà có thể qua trung gian D hoặc E nào đó đang kết nối với A. Lúc này, BGP sẽ tính toán con đường tối ưu để người dùng truy cập A.

Vấn đề của Facebook

Theo báo cáo của Usenix đầu năm nay, Facebook hiện xây dựng hệ thống BGP riêng, cho phép người sử dụng truy cập nhanh các trung tâm của công ty. Trong sự cố hôm qua, Facebook thừa nhận lỗi diễn ra khi họ thay đổi cấu hình bộ định tuyến.

Sự cố được cho rằng có liên quan đến hệ thống DNS (Domain Name System). Theo lý giải từ hãng bảo mật Cloudflare, DNS cho người sử dụng biết họ đang di chuyển đâu và BGP chỉ cho họ cách đến đó. DNS đóng vai trò là điểm xuất phát, còn để đến đích, người dùng phải nhờ đến bản đồ BGP. Lỗi BGP có thể đã làm rối các yêu cầu DNS và là lý do toàn bộ cửa hàng Facebook chẳng thể hoạt động.

Theo The Verge , với hệ thống BGP riêng, nhân viên Facebook cũng có thể có thể đã tự tay xóa sổ loạt dịch vụ của mình do bản cập nhật BGP không hợp lệ. Trên Twitter, John Graham-Cumming, CTO của Cloudflare, cho thấy ông đã thấy nhiều bản cập nhật BGP từ Facebook (hầu hết trong những đó bị xóa theo lộ trình) trước lúc toàn bộ hệ thống của mạng xã hội này sập.

Giới bảo mật nhận định, Facebook sẽ cực khó khắc phục vấn đề trong thời gian ngắn nếu như nó liên quan đến BGP. “Facebook cần đảm bảo họ đang dùng các bản ghi chuẩn xác và các bản ghi kia đã được Internet thu thập, như vậy mọi người mới cũng có thể có thể truy cập công ty trở lại rất dễ dàng”, một chuyên gia nói.

Một sự cố đáng chú ý liên quan đến BGP từng diễn ra vào năm 2008 khi một ISP ở Pakistan vô tình chặn YouTube trên toàn thế giới, dù mục đích của nước này chỉ là cấm người dùng trong nước.

Bảo Lâm (theo The Verge )

Facebook, Instagram, WhatsApp, Sự cố, BGP, Công nghệ, Tin, Tin nóng

Nội dung 'Thủ phạm' phía sau sự cố đứt kết nối của Facebook – Tin Công Nghệ Số hóa được tổng hợp sưu tầm biên tập bởi: Sửa máy tính ITS. Mọi ý kiến vui lòng gửi Liên Hệ cho suamaytinhits.com để điều chỉnh. suamaytinhits.com tks.

Quảng Cáo
Đặt Banner Quảng cáo, Textlink, Guest Post
Liên Hệ Ngay: 1900636343

Bài Viết Liên Quan


Quảng Cáo
Đặt Banner Quảng cáo, Textlink, Guest Post
Liên Hệ Ngay: 1900636343

Bài Viết Khác