Google phát triển chip AI nhanh gấp 24 lần siêu máy tính

Discussion in 'Khám phá - Phát minh' started by bboy_nonoyes, Apr 11, 2025 at 6:06 PM.

  1. bboy_nonoyes

    bboy_nonoyes Administrator Staff Member

    (Lượt xem: 46)

    MỹCông suất tính toán 42,5 exaflop của bộ xử lý Ironwood biến nó thành nền tảng cho những mô hình AI cao cấp của Google, bao gồm Gemini 2.5.


    [​IMG]

    Bộ xử lý Ironwood của Google. Ảnh: Google


    Google giới thiệu Bộ xử lý Tensor (TPU) hiệu quả nhất của hãng mang tên Ironwood, được thiết kế chuyên dành cho các mô hình AI. TPU này được chế tạo để giúp mô hình AI hoạt động nhanh và thông minh hơn, đặc biệt là công việc đòi hỏi lập luận hoặc dự đoán. Khác với những phiên bản tiền nhiệm được thiết kế để huấn luyện mô hình Ai từ đầu, Ironwood ra đời để phục vụ hoạt động suy diễn, Interesting Engineering hôm 10/4 đưa tin.

    Ra mắt tại sự kiện Google Cloud Next ’25, mẫu TPU thế hệ thứ 7 cung cấp công suất tính toán nhanh gấp 24 lần so với bất kỳ siêu máy tính nào trên thế giới khi triển khai ở quy mô lớn. "Ironwood sẽ hỗ trợ giai đoạn tiếp theo của AI tạo sinh cũng như yêu cầu tính toán và liên lạc khổng lồ của nó", Amin Vahdat, phó chủ tịch Google kiêm tổng giám đốc phụ trách ML, hệ thống và AI đám mây, cho biết. "Đây là những gì chúng tôi gọi là 'kỷ nguyên suy diễn' khi tác nhân AI chủ động truy cập và sản sinh dữ liệu nhằm phối hợp cung cấp hiểu biết và giải đáp, thay vì chỉ dữ liệu".

    Ironwood đi kèm một loạt thông số kỹ thuật ấn tượng. Bộ xử lý này có thể cung cấp công suất tính toán 42,5 exaflop khi nâng quy mô lên 9.216 chip/khoang, vượt xa siêu máy tính nhanh nhất thế giới El Capitan (1,7 exaflop). Ironwood cũng sở hữu Bộ nhớ băng thông cao (HBM) 192 GB, gấp 6 lần so với Trillium, TPU thế hệ trước đó của Google, công bố năm ngoái. Ironwood có thể đạt 7,2 terabit/giây mỗi chip về mặt băng thông bộ nhớ, tăng gấp 4,5 lần so với Trillium.

    Google cũng mô tả Ironwood như nền tảng cho tất cả mô hình AI cao cấp của hãng, bao gồm Gemini 2.5. Tại hội thảo, Google giới thiệu Gemini 2.5 Flash, phiên bản chi phí rẻ hơn của mô hình đầu bảng, điều chỉnh độ sâu lập luận dựa trên mức độ phức tạp của gợi ý. Trong khi Gemini 2.5 Pro nhắm tới công việc cao cấp như phát hiện thuốc và lập mô hình tài chính, Flash được tối ưu hóa để sử dụng nhanh chóng hàng ngày, khi tốc độ trở thành yếu tố quan trọng nhất. Ironwood là một phần trong chiến lược cơ sở hạ tầng AI lớn hơn của Google. Công ty cũng giới thiệu Cloud WAN, hệ thống quản lý cho phép cơ sở kinh doanh tiếp cận trực tiếp cơ sở hạ tầng thuộc mạng lưới của Google.

    An Khang (Theo Interesting Engineering)​


    Adblock test (Why?)
    Nguồn VNExpress
     
  2. Facebook comment - Google phát triển chip AI nhanh gấp 24 lần siêu máy tính

Share This Page