Banner Quảng Cáo

AI giá rẻ DeepSeek của Trung Quốc đe dọa sự thống trị của Mỹ

MonsterX0Tháng 1 27, 2025
256 lượt xem

Cuối tháng 12/2024, DeepSeek gây bất ngờ khi công bố mô hình ngôn ngữ lớn (LLM) DeepSeek V3 miễn phí. Dù còn một số vấn đề liên quan đến phản hồi, mô hình hiện được đánh giá rất cao khi chỉ mất hai tháng để xây dựng với chi phí chưa đến 6 triệu USD, đồng thời dùng GPU H800 vốn được Nvidia hạ cấp sức mạnh để tuân thủ lệnh cấm của Mỹ, thay vì những mẫu chip AI mạnh nhất thị trường.

Được ví như “gã khổng lồ thầm lặng”, DeepSeek đang khiến Thung lũng Silicon lo lắng khi sở hữu AI mạnh mẽ dù được xây dựng với chi phí thấp.

Mô hình AI “giá rẻ”

DeepSeek tiết lộ, họ mất 5,6 triệu USD để đào tạo một trong những mô hình mới nhất của mình, thấp hơn nhiều so với mức 100 triệu đến 1 tỷ USD mà Dario Amodei, giám đốc điều hành của startup AI Anthropic đưa ra hồi năm ngoái cho chi phí để xây dựng 1 mô hình.

Barrett Woodside, đồng sáng lập công ty phần cứng AI Positron tại San Francisco, cho biết ông và đồng nghiệp của mình đã bàn tán sôi nổi về DeepSeek. “Thật là tuyệt vời,” Woodside vừa nói vừa chỉ vào các mô hình mã nguồn mở của DeepSeek, trong đó mã phần mềm đằng sau mô hình AI được cung cấp miễn phí.”

Mặc dù mô hình của DeepSeek là miễn phí, nhưng người dùng sẽ mất phí để kết nối ứng dụng của mình với mô hình và cơ sở hạ tầng tính toán của DeepSeek. Ví dụ như trường hợp một doanh nghiệp muốn khai thác công nghệ để cung cấp câu trả lời AI cho câu hỏi của khách hàng.

Đầu năm ngoái, DeepSeek đã giảm giá dịch vụ này xuống chỉ bằng một phần so với các nhà cung cấp khác. Điều này cho thấy ngành công nghiệp ở Trung Quốc đã bắt đầu cuộc chiến giá cả.

Người dùng quan tâm về giá

Anthony Poo, đồng sáng lập một công ty khởi nghiệp đặt trụ sở ở Thung lũng Silicon, cho biết công ty của ông đã chuyển từ mô hình Claude của Anthropic sang sử dụng mô hình của DeepSeek vào tháng 9. Các thử nghiệm cho thấy DeepSeek hoạt động tương tự chỉ với khoảng một phần tư chi phí.

“Mô hình của OpenAI là tốt nhất về hiệu suất, nhưng chúng tôi không muốn trả tiền cho những tính năng mà chúng tôi không cần”, Poo nói.

Một số nhà nghiên cứu cho rằng mô hình DeepSeek thiếu một số tính năng nhất định của các đối thủ đắt tiền hơn, chẳng hạn như duy trì ngữ cảnh trong các cuộc hội thoại dài.

Arnaud Bertrand, người sáng lập HouseTrip và Me & Qi, so sánh trên X: “Về cơ bản, điều này giống như ai đó phát hành điện thoại có sức mạnh bằng với iPhone, nhưng bán với giá 30 USD thay vì 1.000 USD”.

″Mô hình DeepSeek mới thực sự ấn tượng. Họ đã biết cách thực hiện hiệu quả một mô hình nguồn mở có khả năng suy luận, đạt hiệu quả tính toán siêu việt”, CEO Microsoft Satya Nadella phát biểu tại Diễn đàn Kinh tế Thế giới ở Davos ngày 22/1 khi nói về AI mới của DeepSeek. “Chúng ta nên xem xét những diễn biến ở Trung Quốc một cách rất, rất nghiêm túc”.

Thung lũng Silicon phải bất ngờ

Ngày 20/1, DeepSeek đã cho ra mắt R1, một mô hình chuyên biệt được thiết kế cho các nhiệm vụ yêu cầu suy luận và giải quyết vấn đề phức tạp.

“Deepseek R1 là một trong những phát triển đáng kinh ngạc và ấn tượng nhất mà tôi từng thấy,” Marc Andreessen, nhà đầu tư mạo hiểm Thung lũng Silicon từng tham gia cố vấn cho Tổng thống Trump nhận xét trong một bài đăng trên X.

Hiện tại, cả 2 mô hình R1 và V3 của Deepseek đều nằm trong top 10 trên Chatbot Arena, nền tảng do các nhà nghiên cứu tại Đại học California, Berkeley tổ chức nhằm đánh giá hiệu suất chatbot. Gemini của Google giữ vị trí đầu bảng, trong khi DeepSeek vượt qua mô hình Claude của Anthropic và Grok do xAI của Elon Musk phát triển.

Các chuyên gia cho rằng công nghệ của DeepSeek vẫn kém hơn so với OpenAI và Google nhưng thừa nhận công ty Trung Quốc là đối thủ sát sườn dù sử dụng chip kém tiên tiến hơn, với số lượng ít hơn, và trong một số trường hợp còn bỏ qua những bước mà các nhà phát triển Mỹ coi là cần thiết.

Trong số 7 startup AI lớn của Trung Quốc, DeepSeek kín tiếng nhất, nhưng luôn tạo được ấn tượng theo cách không ngờ tới. Không như nhiều công ty lớn đốt tiền thông qua các khoản trợ cấp, DeepSeek tự chủ tài chính và sớm có lãi. Thành công này bắt nguồn từ sự đổi mới toàn diện của công ty trong kiến trúc mô hình AI, đặc biệt việc sáng tạo ra kiến trúc MLA (multi-head latent attention) mới giúp giảm mức sử dụng bộ nhớ xuống 5-13% so với kiến trúc MHA đang có trên các LLM mạnh nhất trên thế giới. Ngoài ra, một cấu trúc khác của công ty là DeepSeekMoESparse cũng giúp giảm chi phí tính toán, dẫn đến giảm tổng chi phí.

Theo một số nguồn tin, tại Thung lũng Silicon, DeepSeek được gọi là “thế lực bí ẩn từ phương Đông” từ khi mô hình DeepSeek V2 được giới thiệu năm ngoái. Khi đó, các nhà phân tích của SemiAnalysis đánh giá đây “có thể là mô hình ấn tượng nhất năm”, còn cựu nhân viên OpenAI Andrew Carr cho rằng sản phẩm “đầy trí tuệ và đáng kinh ngạc”. Jack Clark, cựu giám đốc chính sách của OpenAI và đồng sáng lập Anthropic, tin DeepSeek “đã thuê một nhóm thiên tài vượt sức tưởng tượng” để phát triển các mô hình, đồng thời so sánh chúng “có quy mô lớn ngang ngửa với máy bay không người lái và ôtô điện”.

Thực sự, AI giá rẻ của Trung Quốc đang đe dọa sự thống trị của Mỹ, thậm chí có khả năng khắc chế đòn đánh “chíp bán dẫn” của Mỹ với Trung Quốc.

Các kênh thông tin của chúng tôi

Disclaimer: Thông tin trong bài viết không phải là lời khuyên đầu tư từ Coin98 Insights. Hoạt động đầu tư tiền mã hóa chưa được pháp luật một số nước công nhận và bảo vệ. Các loại tiền số luôn tiềm ẩn nhiều rủi ro tài chính.