Siêu máy tính AI của Google nhanh hơn chip Nvidia A100

Google đã công bố thông tin chi tiết mới về các siêu máy tính mà họ sử dụng để đào tạo các mô hình trí tuệ nhân tạo của mình, cho biết các hệ thống này vừa nhanh hơn vừa tiết kiệm năng lượng hơn so với các hệ thống tương đương của Nvidia.
Google đã thiết kế chip tùy chỉnh của riêng mình được gọi là Bộ xử lý Tensor (TPU). Nó sử dụng những con chip đó cho hơn 90% công việc của công ty về đào tạo trí tuệ nhân tạo, quy trình cung cấp dữ liệu thông qua các mô hình để làm cho chúng trở nên hữu ích trong các tác vụ như trả lời truy vấn bằng văn bản giống con người hoặc tạo hình ảnh.
Google TPU hiện đang ở thế hệ thứ tư. Google hôm thứ ba đã xuất bản một bài báo khoa học mô tả chi tiết cách họ kết nối hơn 4.000 con chip lại với nhau thành một siêu máy tính bằng cách sử dụng các công tắc quang học do chính họ phát triển để giúp kết nối các máy riêng lẻ.
Cải thiện các kết nối này đã trở thành điểm cạnh tranh chính giữa các công ty chế tạo siêu máy tính AI vì cái gọi là mô hình ngôn ngữ lớn hỗ trợ các công nghệ như Bard của Google hay ChatGPT của OpenAI đã bùng nổ về kích thước, nghĩa là chúng quá lớn để lưu trữ trên một con chip.
Thay vào đó, các mô hình phải được chia thành hàng nghìn chip, sau đó các chip này phải hoạt động cùng nhau trong nhiều tuần hoặc hơn để huấn luyện mô hình. Mô hình PaLM của Google – mô hình ngôn ngữ được tiết lộ công khai lớn nhất cho đến nay – đã được đào tạo bằng cách chia nó thành hai trong số 4.000 siêu máy tính chip trong 50 ngày.
Google cho biết các siêu máy tính của họ giúp dễ dàng cấu hình lại các kết nối giữa các chip một cách nhanh chóng, giúp tránh các sự cố và điều chỉnh để tăng hiệu suất.
Mặc dù Google hiện mới công bố thông tin chi tiết về siêu máy tính của mình, nhưng nó đã được áo dụng bên trong công ty từ năm 2020 tại một trung tâm dữ liệu ở Hạt Mayes, Oklahoma. Google cho biết công ty khởi nghiệp Midjourney đã sử dụng hệ thống này để đào tạo mô hình của mình.Mô hình này tạo ra những hình ảnh mới sau khi được cung cấp một vài từ khóa.
Trong bài báo, Google cho biết đối với các hệ thống có kích thước tương đương, chip của họ nhanh hơn tới 1,7 lần và tiết kiệm năng lượng hơn 1,9 lần so với hệ thống dựa trên chip A100 của Nvidia.
Huy Nam