Dùng chip Trung Quốc để huấn luyện AI, một công ty cắt giảm 20% chi phí so với dùng NVIDIA

Admin

Cho dù chưa thể thay thế hoàn toàn phần cứng của NVIDIA, các chip AI từ Trung Quốc đang làm giảm đáng kể sự phụ thuộc của Trung Quốc vào ông Vua chip AI này.

Ant Group, tập đoàn công nghệ tài chính khổng lồ được Alibaba hậu thuẫn, vừa công bố một thành tựu quan trọng trong lĩnh vực trí tuệ nhân tạo (AI) khi thành công huấn luyện mô hình bằng cách sử dụng chip bán dẫn sản xuất trong nước.

Một nguồn tin cho biết Ant Group đã tận dụng chip từ hai gã khổng lồ công nghệ Trung Quốc là Alibaba và Huawei để huấn luyện mô hình AI của họ, đạt được hiệu suất tương đương với những gì có được khi sử dụng chip H800 của NVIDIA. Điểm nổi bật trong thành tựu của Ant Group là việc giảm 20% chi phí so với việc sử dụng phần cứng của NVIDIA.

Dùng chip Trung Quốc để huấn luyện AI, một công ty cắt giảm 20% chi phí so với dùng NVIDIA- Ảnh 1.

Mặc dù Ant Group vẫn tiếp tục sử dụng phần cứng của NVIDIA cho một số tác vụ phát triển AI nhất định, công ty này hiện đang ngày càng dựa vào các giải pháp thay thế - đặc biệt là chip từ AMD và các nhà sản xuất Trung Quốc - cho các mô hình mới nhất của họ. Bước chuyển hướng chiến lược này phản ánh xu hướng rộng lớn hơn trong ngành công nghệ Trung Quốc, một phần do các lệnh trừng phạt ngày càng thắt chặt của Mỹ hạn chế việc tiếp cận GPU tiên tiến nhất của NVIDIA.

Quá trình huấn luyện AI hiệu suất cao đòi hỏi sức mạnh tính toán đáng kể, và GPU của NVIDIA từ lâu đã là tiêu chuẩn vàng trong ngành công nghiệp. Tuy nhiên, với việc tiếp cận chip của NVIDIA ngày càng bị hạn chế, các công ty Trung Quốc đã tăng cường đầu tư vào công nghệ bán dẫn của riêng họ và đa dạng hóa nguồn cung cấp phần cứng. Sự phát triển này chứng minh khả năng AI ngày càng tăng của Trung Quốc và cho thấy các giải pháp thay thế trong nước và không phải của Mỹ đối với GPU của NVIDIA đang trở nên khả thi cho việc huấn luyện AI quy mô lớn.

Dùng chip Trung Quốc để huấn luyện AI, một công ty cắt giảm 20% chi phí so với dùng NVIDIA- Ảnh 2.

Chip AI Hanguang 800 của Alibaba

Theo báo cáo, Ant Group đã sử dụng phương pháp "Mixture of Experts" (MoE) để huấn luyện mô hình, một kỹ thuật chia các tác vụ thành các tập dữ liệu nhỏ hơn, tương tự như việc có một nhóm chuyên gia với mỗi người tập trung vào một phần của công việc. Công ty cho biết chi phí huấn luyện khoảng 6,35 triệu nhân dân tệ (880.000 USD) để huấn luyện 1 nghìn tỷ token sử dụng phần cứng hiệu suất cao, nhưng cách tiếp cận được tối ưu hóa của họ sẽ giảm xuống còn 5,1 triệu nhân dân tệ khi sử dụng phần cứng có thông số kỹ thuật thấp hơn.

Bước đột phá này cũng làm dấy lên sự so sánh với DeepSeek AI của Trung Quốc, công ty gần đây đã vượt trội hơn GPT-4 của OpenAI trong một số tiêu chuẩn đánh giá. Nếu bước đột phá của Ant Group thể hiện một bước tiến tương tự về hiệu quả huấn luyện AI, nó có thể đánh dấu một bước nữa hướng tới việc giảm sự phụ thuộc vào công nghệ phương Tây. Tuy nhiên, vẫn còn nhiều câu hỏi về việc liệu chip Trung Quốc và các nhà cung cấp thay thế như AMD có thể mở rộng quy mô hiệu quả và liệu chúng có thể phù hợp với hiệu suất dài hạn và hỗ trợ hệ sinh thái của NVIDIA hay không.

Dùng chip Trung Quốc để huấn luyện AI, một công ty cắt giảm 20% chi phí so với dùng NVIDIA- Ảnh 3.

Chip AI Ascend 910C của Huawei

Trong khi các chi tiết cụ thể về chip được sử dụng trong quá trình huấn luyện AI của Ant Group vẫn chưa được tiết lộ, các báo cáo cho thấy phần cứng AI nội bộ của Alibaba và chip dòng Ascend của Huawei đã đóng vai trò quan trọng. Ant Group đã công bố một bài báo nghiên cứu trong tháng này, trong đó cho biết mô hình của họ đôi khi vượt trội hơn Meta Platforms Inc. trong một số tiêu chuẩn đánh giá nhất định. Mô hình Ling-Lite và Ling-Plus của công ty cũng được báo cáo là vượt trội hơn các mô hình tương đương của DeepSeek trong các tiêu chuẩn đánh giá ngôn ngữ Trung Quốc.

Ant Group có kế hoạch tận dụng bước đột phá gần đây trong các mô hình ngôn ngữ lớn mà họ đã phát triển, Ling-Plus và Ling-Lite, cho các giải pháp AI công nghiệp bao gồm chăm sóc sức khỏe và tài chính. Công ty đã mua nền tảng trực tuyến Trung Quốc Haodf.com năm nay để tăng cường dịch vụ AI trong lĩnh vực chăm sóc sức khỏe. Ant đã tạo ra AI Doctor Assistant để hỗ trợ 290.000 bác sĩ của Haodf với các tác vụ như quản lý hồ sơ y tế.

Nếu các công ty Trung Quốc khác có thể sao chép những kết quả này, điều đó có thể thúc đẩy tham vọng AI của Trung Quốc và giảm sự phụ thuộc của quốc gia này vào công nghệ nước ngoài. Liệu những chip AI trong nước và thay thế này có thể duy trì tính cạnh tranh trong dài hạn vẫn là một câu hỏi mở. Nhưng sự phát triển này là một dấu hiệu rõ ràng về nỗ lực của Trung Quốc hướng tới độc lập công nghệ, đặc biệt trong bối cảnh căng thẳng thương mại và công nghệ ngày càng gia tăng giữa Trung Quốc và Mỹ.