Google, Facebook đang lưu trữ dữ liệu thế nào
- Thứ năm - 31/05/2018 10:16
- In ra
- Đóng cửa sổ này
Trung tâm xử lý dữ liệu luôn là bài toán lớn và cần được tối ưu thường xuyên với các công ty công nghệ, đặc biệt là những hãng lưu trữ dữ liệu người dùng lớn như Facebook và Google. Theo BBC, năm 2017, Facebook phải xử lý mỗi ngày hàng tỷ lượt nhấn "thích" và hàng nghìn tỷ tin nhắn được gửi đi từ khoảng hơn 2 tỷ người dùng. Trong khi đó, trung tâm xử lý dữ liệu của Google cũng phải xử lý trung bình 40 triệu lượt tìm kiếm mỗi giây hay 3,5 tỷ lượt tìm kiếm mỗi ngày.
Bên trong một trung tâm dữ liệu của Facebook. |
Sở hữu lượng người dùng, dữ liệu và lần truy xuất dữ liệu khổng lồ nhưng cả Facebook và Google đều không đặt trung tâm dữ liệu (Data Center) ở quá nhiều nơi. Thậm chí, phần lớn chúng đều đang ở tại Mỹ.
Đến hết năm 2017, Facebook thông báo đã có 11 trung tâm dữ liệu trên toàn cầu nhưng có tới 6 trong số này là tại các bang ở Mỹ. Chỉ có hai trung tâm dữ liệu ở châu Á được đặt tại Hong Kong và Singapore. Google có nhiều hơn, với tổng cộng 15 trung tâm dữ liệu, trong đó có 8 đặt tại Mỹ, một ở Nam Mỹ, 4 tại châu Âu và hai ở châu Á là Đài Loan và Singapore.
Tuy nhiên, để trải nghiệm người dùng được nâng cao, thời gian truy xuất dữ liệu nhanh và ổn định hơn, các công ty này sử dụng đến mạng lưới CDN (Content Delivery Network). Để giảm khoảng cách truy cập từ người dùng đến máy chủ (server), mạng CDN sẽ lưu nội dung đệm (cache) tại các máy chủ ở nhiều địa điểm khác nhau, thường được gọi là PoP (Point of Presence). Mỗi PoP sẽ bao cồm các máy chủ lưu bộ nhớ đệm, chịu trách nhiệm cho việc truyền tải nội dung đến các người dùng ở gần nhất.
Không giống như Data Center có rất ít, Google và Facebook thiết lập máy chủ dạng PoP ở khắp nơi trên thế giới. Việt Nam cũng là một trong các quốc gia như vậy. Tháng 4/2017, ông Trương Minh Tuấn, Bộ trưởng Bộ Thông tin và Truyền thông cho biết nhiều doanh nghiệp trong nước đã cho Facebook, Google (Youtube) đặt máy chủ tại Việt Nam.
Trong đó, VNPT cho Google thuê 608 máy chủ, Facebook là 120 máy chủ. Viettel cho Google thuê 334 máy chủ, Facebook là 96 máy chủ. Còn theo thống kê mới nhất của Bộ Công an, đến tháng 1/2018, tổng cộng Google đã thuê gần 1.800 máy chủ, Facebook đã thuê 441 máy chủ của các doanh nghiệp Việt Nam.
Chi phí hàng đầu của các công ty như Google, Facebook liên quan đến xây dựng, bảo trì các trung tâm dữ liệu. |
Theo tiết lộ của một chuyên gia về hạ tầng mạng, các doanh nghiệp cung cấp mạng Internet của Việt Nam thường tạo điều kiện tối đa cho Google, Facebook đặt máy chủ ở trong nước. Thậm chí, có đơn vị còn không thu phí đặt chỗ máy chủ của các công ty này. Lý do là việc đặt máy chủ tại Việt Nam sẽ làm giảm băng thông đi quốc tế của các nhà cung cấp mạng này, từ đó tiết kiệm chi phí của họ với các đối tác quốc tế.
Cũng theo người này, dữ liệu thường nằm ở máy chủ trong mạng lưới CDN như đang đặt tại Việt Nam chủ yếu lưu trữ hình ảnh, video với dung lượng lớn. Các loại dữ liệu này chiếm băng thông cao và thời gian truy xuất lâu hơn. Trong khi đó, các dữ liệu thông tin người dùng vẫn nằm tại các trung tâm dữ liệu lớn của hãng. Trong một ví dụ cụ thể với Facebook, anh cho biết hình ảnh theo thông tin được lấy về từ một máy chủ có IP tại Việt Nam, còn khi truy xuất dữ liệu ở trang tin News Feed, máy chủ có IP tại Hong Kong.
Facebook và Google đều có kế hoạch mở rộng Data Center của mình mỗi năm nhưng điều kiện hàng đầu của các hãng này đều hướng tới việc cắt giảm chi phí. Tại châu Âu, các công ty này thường chọn những quốc gia ở Bắc Âu nhờ khí hậu lạnh, nguồn điện tốt và nhân công trình độ cao. Facebook từng giải thích lý do chọn Lulea (Thụy Điển) để đặt trung tâm dữ liệu bởi ở đây nhiệt độ luôn thấp, nhiều khi xuống tới âm 25 độ C, giảm chi phí phải làm mát máy móc. Vùng đất này cũng có nguồn thủy điện dư thừa và tìm kiếm các chuyên gia công nghệ thông tin tại đây cũng không khó.