ISSN-2815-5823
Việt Anh
Thứ tư, 06h00 05/02/2025

Mô hình trí tuệ nhân tạo (AI) mới của DeepSeek tạo nên những tranh cãi trong giới công nghệ

(KDPT) - Mới đây, DeepSeek đã thu hút sự chú ý của cả thế giới khi giới thiệu một trong những thành tựu của công ty là một mô hình AI rất mạnh mẽ, với chi phí chế tạo ít hơn nhiều so với các mô hình AI nổi tiếng khác như ChatGPT, Gemini.

"Cơn gió lạ" công nghệ DeepSeek xuất hiện như thế nào?

DeepSeek là một công ty khởi nghiệp, do công ty giao dịch chứng khoán Trung Quốc High-Flyer thành lập và nắm quyền sở hữu. Cả High-Flyer và DeepSeek đều do Liang Wenfeng, một doanh nhân người Trung Quốc điều hành. Mục tiêu của công ty là xây dựng hệ thống AI tương tự như chatbot ChatGPT của công ty OpenAI hoặc Gemini của Google.

Năm 2021, DeepSeek đã mua hàng nghìn chip máy tính từ nhà sản xuất chip Nvidia của Mỹ, đặt những viên gạch đầu tiên cho nỗ lực tạo ra hệ thống AI mạnh mẽ. Tại Trung Quốc, công ty này nổi tiếng với chính sách thu hút các nhà nghiên cứu AI trẻ và tài năng từ những trường đại học hàng đầu ở trong nước, hứa hẹn mức lương cao và cơ hội làm việc trong các dự án nghiên cứu tiên tiến.

Mục tiêu của DeepSeek là xây dựng hệ thống AI tương tự như chatbot ChatGPT của công ty OpenAI. (Ảnh: DeepSeek)
Mục tiêu của DeepSeek là xây dựng hệ thống AI tương tự như chatbot ChatGPT của công ty OpenAI. (Ảnh: DeepSeek)

Trong vài năm qua, DeepSeek đã phát hành một số mô hình ngôn ngữ lớn. Đây là loại công nghệ hỗ trợ các chatbot như ChatGPT và Gemini. Ngày 10/1 vừa qua, công ty đã phát hành ứng dụng chatbot miễn phí đầu tiên dựa trên một mô hình mới có tên là DeepSeek-V3.

Với tính năng ưu việt và giá cả hợp lý, DeepSeek nhanh chóng gây sốt toàn cầu và được đánh giá là đối thủ đáng gờm của ChatGPT, Gemini và Claude AI. Công cụ AI này hiện đang trở thành tâm điểm chú ý, thu hút đông đảo người dùng trải nghiệm. Không nằm ngoài xu hướng, Gen Z cũng nhanh chóng "bắt trend", thử nghiệm DeepSeek và đưa ra những đánh giá chân thực nhất từ góc nhìn của thế hệ "cộng sinh" cùng AI.

Đặc biệt, dù nội dung code khá dài, AI này không bị ngắt quãng, giúp người dùng có trải nghiệm mượt mà, suy nghĩ liền mạch hơn. So với ChatGPT, DeepSeek tỏ ra nhỉnh hơn khi không chỉ đưa ra câu trả lời mà còn trình bày lối tư duy, suy luận dựa trên dữ liệu hiện có. Điều này mang lại cảm giác như đang "học nhóm", thay vì chỉ đơn thuần nhận kết quả từ một AI.

Bức tranh công nghệ toàn cầu sẽ có những chấm phá mới

Trong suốt nhiều thập kỷ, các công ty công nghệ Mỹ như Google, Microsoft, Amazon, và OpenAI đã chiếm lĩnh phần lớn thị trường AI và điện toán đám mây. Một sản phẩm như DeepSeek từ quốc gia khác có thể thay đổi luật chơi, làm suy yếu vị thế của các công ty này, đồng thời thúc đẩy sự cạnh tranh toàn cầu.

Bên cạnh đó, với sự xuất hiện của DeepSeek thì các công ty lớn tại Mỹ đang lo lắng vì nguy cơ mất vị thế trên bản đồ công nghệ thế giới. Nhiều năm qua, các công ty công nghệ đến từ Mỹ đã chiếm lĩnh thị trường nhờ sở hữu hạ tầng, dữ liệu và nhân lực vượt trội. Nếu DeepSeek đến từ quốc gia khác với công nghệ đột phá, điều này có thể làm giảm khả năng độc quyền của các công ty Mỹ, buộc họ phải cải tiến nhanh hơn và điều chỉnh chiến lược để duy trì vị thế.

DeepSeek đang đe dọa vị thế thống trị của các công ty công nghệ tại Mỹ. (Ảnh minh họa)
DeepSeek đang đe dọa vị thế thống trị của các công ty công nghệ tại Mỹ. (Ảnh minh họa)

Và một điều quan trọng hơn, nếu DeepSeek có khả năng thu thập và phân tích thông tin vượt trội, nó có thể làm dấy lên mối lo ngại ở Mỹ rằng dữ liệu toàn cầu, vốn là "mỏ vàng" của các công ty Mỹ, có thể rơi vào tay các công ty hoặc quốc gia đối thủ. Vì vậy, DeepSeek có thể buộc Mỹ phải điều chỉnh chiến lược công nghệ và đầu tư mạnh mẽ hơn vào nghiên cứu AI để duy trì lợi thế cạnh tranh. Điều này bao gồm cả việc thúc đẩy hợp tác quốc tế hoặc kiểm soát chặt chẽ hơn các công ty công nghệ nước ngoài hoạt động trên đất Mỹ.

Công nghệ DeepSeek-V3 đặt lên bàn cân so với những đối thủ khác liệu có tốt hơn?

Theo các bài kiểm tra tiêu chuẩn, DeepSeek-V3 có thể trả lời nhiều câu hỏi, giải quyết các vấn đề logic và viết các chương trình máy tính, với hiệu quả tương đương bất kỳ sản phẩm AI nào đã có trên thị trường.

Ngay trước khi DeepSeek phát hành công nghệ của mình, OpenAI đã hé lộ thông tin về một hệ thống mới mang tên OpenAI o3, có vẻ mạnh hơn DeepSeek-V3. Nhưng OpenAI vẫn chưa cho đại bộ phận công chúng tiếp cận với hệ thống mới này.

OpenAI o3 được thiết kế để tự đưa ra "suy luận" (reason) thông qua các vấn đề liên quan đến toán học, khoa học và lập trình máy tính. Nhiều chuyên gia khi đó lên tiếng rằng DeepSeek chưa xây dựng một mô hình suy luận theo hướng này, thứ được xem như tương lai của AI. Nhưng chỉ tới ngày 20/1, DeepSeek đã phát hành mô hình với khả năng suy luận có tên là DeepSeek R1 và nó cũng gây ấn tượng rất tốt.

Đây dường như là điều khiến các nhà đầu tư Mỹ và những người khác lo sợ, vì điều này sẽ gây tác động tới thị trường chứng khoán. Dường như họ đã nhận ra tầm quan trọng của công nghệ mới mà DeepSeek giới thiệu.

Theo tờ New York Times trích phân tích của các kỹ sư AI hàng đầu tại Mỹ, bài báo khoa học của DeepSeek đã nêu ra nhiều cách thức thông minh và ấn tượng để xây dựng công nghệ AI mạnh, với ít chip hơn. Nói ngắn gọn thì các kỹ sư của DeepSeek đã thể hiện một phương thức tiếp cận hiệu quả hơn, trong việc sử dụng chip để phân tích dữ liệu.

GS. Tim Dettmers, một nhà nghiên cứu tại Viện Trí tuệ nhân tạo Allen ở Seattle và là giáo sư khoa học máy tính tại Đại học Carnegie Mellon, đánh giá: "Rõ ràng là không chỉ những công ty lớn như OpenAI, mà những doanh nghiệp khác cũng có thể xây dựng những hệ thống AI phức tạp".

Sẽ còn nhiều công ty công nghệ nổi lên tạo "địa chấn" như DeepSeek

DeepSeek đã khuấy động thị trường toàn cầu và gây sốc cho Thung lũng Silicon, nhưng đây chỉ là một trong nhiều công ty trí tuệ nhân tạo (AI) của Trung Quốc có tiềm năng tạo địa chấn.

Đầu tiên phải kể đến Alibaba Cloud, một công ty con của Alibaba. Vào ngày 29/1/2025 đã phát hành phiên bản cập nhật mô hình AI Qwen 2.5, có tên là Qwen 2.5-Max. Theo Alibaba Cloud, Qwen 2.5-Max vượt trội hơn DeepSeek V3 và Llama 3.1 của Meta. Một số nhà phân tích đánh giá, việc Alibaba Cloud chọn phát hành Qwen 2.5-Max ngay khi các doanh nghiệp ở Trung Quốc đóng cửa nghỉ Tết Nguyên đán, phản ánh áp lực mà DeepSeek gây ra cho thị trường trong nước.

Hay như ByteDance, công ty mẹ của TikTok, ngày 29/1 đã ra mắt Doubao-1.5-pro, được cho có thể vượt trội hơn o1 của OpenAI trong một số bài kiểm tra nhất định về việc hiểu và phản hồi câu lệnh phức tạp.

Bên cạnh đó, công ty công nghệ Tencent vốn nổi tiếng bởi trò chơi và ứng dụng nhắn tin WeChat. Nhưng gần đây, công ty này cũng có những bước tiến đáng kể trong lĩnh vực AI. Mô hình chủ lực của họ là ứng dụng tạo văn bản thành video có tên Hunyuan. Tencent cho biết Hunyuan có thể hoạt động tốt như Llama 3.1 của Meta.

Theo Ông Matt Sheehan, một thành viên của Quỹ Carnegie vì Hòa bình Quốc tế đánh giá: "Nếu chính phủ Mỹ cho rằng tất cả những gì cần làm là đánh bại DeepSeek và sau đó sẽ ổn, thì họ sẽ phải ngạc nhiên". Trong những tuần gần đây, các công ty công nghệ Trung Quốc khác đã nhanh chóng công bố mô hình AI mới nhất của họ kèm quảng bá rằng chúng ngang bằng với các mô hình do DeepSeek và OpenAI phát triển./.



Kinhdoanhvaphattrien.vn | 05/11/2023

eMagazine
 
kinhdoanhvaphattrien.vn | 09/02/2025