Liên tiếp các màn ra mắt về AI trong chưa đầy 2 ngày
Ngành AI toàn cầu đã chứng kiến cuộc cạnh tranh sôi nổi trong vòng 36 giờ khi lần lượt OpenAI, Google, ByteDance đã tổ chức sự kiện, phô diễn sức mạnh AI mới.
Nhìn vào cuộc chạy đua trong 3 ngày qua, có thể thấy ngành công nghiệp AI của Trung Quốc và Mỹ dường như đã tới ngã ba. Trong khi Google và OpenAi trình diễn những công nghệ vượt xa trí tưởng tượng thì ByteDance lại có giải pháp tiếp cận khác khi cung cấp mô hình với giá rẻ bất ngờ, sẵn sàng để người dùng có cơ hội tiếp cận trên diện rộng.
AGI đang đến gần
Ngày 14/5, OpenAI tổ chức Hội nghị mùa xuân. Theo đồn đoán của nhiều người, GPT-5 hoặc công cụ tìm kiếm GPT sẽ ra mặt song CEO Sam Altman chỉ đem đến bản cập nhật GPT-4o. Dẫu vậy, giới công nghệ vẫn có cơ hội ấn tượng với khả năng tương tác đa phương giữa âm thanh, văn bản và hình ảnh theo thời gian thực. Tương tự như thời gian phản hồi của 2 người đang nói chuyện, mô hình có thể phản hồi giao tiếp âm thanh, giống với thời gian phản hồi của 2 người đang nói chuyện hay bước tiến vượt bậc về âm thành khi thể hiện được cảm xúc thay đổi giọng điệu.
Open AI cho biết tên gọi GPT-4o có chữ “o” là viết tắt của thuật ngữ chuyên ngành “omni” (toàn năng). Đó là một bước tiến mới, tiến đến sự tương tác giữa máy tính và con người theo một cách tự nhiên.
Sam Altman cho biết GPT-4o là tập hợp toàn bộ những gì mà họ đã học được trong những năm qua. OpenAI đã tìm hiểu các mô hình hình ảnh, văn bản, âm thanh và làm việc chăm chỉ để kết hợp chúng lại. Mô hình ngôn ngữ lớn hiệu quả ngày nay không chỉ là tìm ra bước đột phá vĩ đại mà là làm thế nào để kết hợp nhiều phần với nhau.
GPT-4o không chỉ trò chuyện mà còn có thể diễn giải biểu đồ, trợ giúp mã hóa, diễn giải cảm xúc hay phân tích hình ảnh qua camera. Ngoài ra, vẫn duy trì được giọng điệu vui vẻ. Giới phân tích cho biết, OpenAI mô hình mới có thể tương tác như con người một cách rất đáng ngờ. Đó là một bước đột phá mới cho thấy AGI đang đến gần.
Google chưa tạo được sự hứng thú như kỳ vọng
Sau khi OpenAI có màn trình diễn ấn tượng được một ngày, Google cũng ra mắt loạt AI mới ở sự kiện I/O rạng sáng 15/5 (giờ Hà Nội). Công ty đã có câu trả lời l với AI Sora được đối thủ ra mắt cách đó 3 tháng là Veo.
Thế nhưng, hiệu ứng từ video được tạo bằng tính năng này không gây được ấn tượng lớn như đối thủ về khung cảnh phức tạp, độ chân thực đến chuyển động máy quay.
Không chỉ là trợ lý AI có thể làm được mọi việc, Astra còn có thể tương tác theo thời gian thực tương tự như các GPT-4o có thể làm được. Theo Google, công cụ hướng đến mục tiêu trở thành tác nhân AI “trung thực và tốt nhất”. Mặt khác, Gemini được đưa vào hầu hết dịch vụ của Google khi được nâng cấp lên bản 1.5. Gemini cũng được tích hợp sâu trên công cụ tìm kiếm Google Search, không đơn thuần trả về thông tin kèm liên kết trích dẫn, mà còn lời truy vấn theo ngôn từ tự nhiên, gợi ý nội dung mới, thông tin liên quan dựa trên từ khóa tìm kiếm.
Sự kiện của Google không gây được nhiều hứng thú với người tham gia, không giống với màn ra mắt ấn tượng của OpenAI bởi đa số là phát lại video đã được chuẩn bị sẵn thay vì trình diễn trực tiếp. Ngoài ra, các mô hình AI này vẫn đang trong giai đoạn thử nghiệm, chưa sẵn sàng cho người dùng phổ thông.
Ở video được chuẩn bị bởi chính Google, Gemini đã hướng dẫn nhiếp ảnh gia xử lý tình trạng kẹt phim ở máy ảnh. Thế nhưng, theo đánh giá của Verge, đó là hướng dẫn rất tệ khi AI này khuyên rằng nên mở phía sau và gỡ phím nhẹ nhàng ra.
Trực tiếp tham gia sự kiện, Andrew Lanxon, phóng viên công nghệ của Cnet cho biết ngay cả những nhà báo công nghệ giàu kinh nghiệm cũng phải gãi đầu gãi tai sau bài thuyết trình kéo dài 2 giờ về Gemini và các công cụ AI khác.
Có tới hàng chục mô hình AI mới được ra mắt bởi Google, song Lanxon cho rằng công ty nên gây sự hào hứng hơn cho người dùng hàng ngày với những tiềm năng của sản phẩm, và hiểu được AI sẽ giúp ích cho cuộc sống con người như thế nào một cách chính xác.
ByteDance gây sốc
Cách đó nửa vòng trái đất và 12 giờ sau, ByteDance là gã khổng lồ công nghệ tiếp theo tổ chức hội nghị công nghệ trên quy mô lớn. Giống như cách tiếp cận của Google, công ty này đã ra mắt 8 phiên bản khác nhau của mô hình ngôn ngữ lớn Doubao. Giới công nghệ đã bị sốc khi giá của dịch vụ này “cạnh tranh không tưởng” với các đối thủ.
Dẫn lời Tan Dai, chủ tịch mảng dịch vụ điện toán đám mây Volcano Engine của ByteDance, SCMP cho biết chi phí thấp nhất của Doubao Pro là 0,0008 nhân dân tệ (0,011 cent Mỹ) cho 1.000 lời nhắc token. So với GPT-4 của OpenAI thì giá này thấp hơn 98,9%. GPT-4 hiện nay có giá 0,42 nhân dân tệ cho 1.000 token, trong đó Tongyi Qianwen và Ernie của Baidu của Alibaba tính phí 0,12 nhân dân tệ.
Theo nhận định của giới phân tích, việc giảm giá thấp hơn 99,8% của ByteDance đã khơi mào cho một cuộc chiến mới về công nghệ trí tuệ nhân tạo. Mặt khác, Washington Post thông tin rằng công ty đang dành toàn bộ nguồn lực để cạnh tranh trong trận chiến không được thua. Điều đó chỉ ra rằng ByteDance có tham vọng mạnh mẽ trong việc đối đầu với các mô hình AI trong nước và quốc tế./.
- Tập đoàn Huawei muốn tham gia phát triển mạng 5G, chuyển đổi số, trí tuệ nhân tạo tại Việt Nam
- Nhu cầu điện khổng lồ phục vụ trí tuệ nhân tạo tại Châu Á
- Trí tuệ nhân tạo, dữ liệu lớn: "Cánh tay đắc lực" quản lý tuân thủ pháp luật thuế tại Việt Nam