ISSN-2815-5823
Tâm Phạm
Chủ nhật, 16h00 19/05/2024

GPT-4o có gì mà khiến cả thế giới phải xôn xao?

(KDPT) - Ghi nhận, khả năng phản hồi của GPT-4o vừa được ra mắt nhanh đến mức đáng kinh ngạc và một lần nữa đặt ra câu hỏi liệu rằng ChatGPT có phải là vua của mô hình ngôn ngữ hay không?

Vào thời điểm ra mắt, Gemini của Google thường so kè với ChatGPT về tốc độ khi mà liên tục được nhấn mạnh rằng mạnh gấp 5 lần, nhanh gấp nhiều lần GPT-4 trong khi ngốn ít GPU hơn.

Có vẻ như OpenAI không hề thích về điều này, bởi vì chatbot GPT-4o vừa mới được ra mắt nhanh hơn nhiều so với GPT-4, đến mỗi biến GPT-4 trở nên lỗi thời khi đặt lên bàn cân. 

GPT-4o có tốc độ nhanh gấp 2 lần GPT-4 Turbo

Thực tế cho thấy, GPT-4 đã quá đủ tốt dành cho nhiều người dùng, tuy nhiên nhược điểm lớn nhất của nó chính là chậm hơn với các LLM khác. Gemini của Google hay là Claude 3 từ Anthropic cũng hoàn toàn vượt trội ChatGPT ở tốc độ phản hồi. Đương nhiên là GPT-4 vẫn có một lợi thế khác để có thể giữ chân người dùng, tuy nhiên tốc độ và chất lượng câu trả lời, ngôn ngữ được hỗ trợ là những gì đang kìm hãm đi mô hình này. 

Và GPT-4o ra mắt như một lời đáp trả. Ở trong bản demo, GPT-4o đã tạo ra câu trả lời 488 từ trong vòng chưa đầy 12 giây. Một câu lệnh tương tự cũng có thể sẽ mất gần một phút nếu như dùng GPT-4. Và đây cũng là với những cải tiến nhỏ mà GPT-4o mang đến. Nó nhanh đến mức đáng kinh ngạc, một lần nữa đã đặt ra câu hỏi liệu rằng ChatGPT có phải là vua của mô hình ngôn ngữ hay là không. 

GPT-4o có sự vượt trội so với bản cũ. (Nguồn ảnh: Znews)
GPT-4o có sự vượt trội so với bản cũ. (Nguồn ảnh: Znews)

Ở trong một video khác, việc tạo ra một tệp tin CSV chứa thông tin về 50 thành phố lớn nhất trên thế giới mất GPT-4o chưa đầy thời gian 1 phút, trong khi đó GPT-4 lại mất rất nhiều thời gian để có thể thực hiện được tác vụ tương tự. Giám đốc công nghệ OpenAI Mira Murati có nói với khán giả rằng nó nhanh hơn nhiều so với mô hình ChatGPT-4 trước đó, được cải tiến về văn bản, video, âm thanh. Bà Murati khẳng định rằng: “Nếu như xét về tính ứng dụng và độ tiện lợi, đây chính là một bước tiến lớn”. 

Và nếu như với bạn, nhược điểm lớn nhất của GPT-4 là tốc độ thì hãy yên tâm vấn đề đó đã biến mất hoàn toàn. GPT-4o nhanh hơn đáng kể so với GPT-4 thông thường và thậm chí là nhanh gấp đôi GPT-4 Turbo. Hơn thế, mô hình này rẻ hơn 50% cho các nhà phát triển nếu như muốn tự triển khai cũng như được nâng mức giới hạn tốc độ cao hơn nhiều để có thể sử dụng. Và nó được hưởng lợi từ khả năng suy luận đã qua cải thiện của GPT-4 Turbo.

ChatGPTT mới có thể dịch song ngữ nhanh chóng

GPT-4 Omni (hay viết tắt là GPT-4o) đã được OpenAI giới thiệu vào ngày 13/5 với tên gọi là “bản cập nhật mùa xuân”. Bên cạnh việc làm cho phiên bản ChatGPT này nhanh hơn, miễn phí cho nhiều người hơn thì GPT-4o mở rộng cách người dùng tương tác như là trò chuyện tự nhiên thông qua ứng dụng dành cho smartphone hay là PC.

Và ChatGPT mới được cập nhật cùng với trợ lý giọng nói có thể cạnh tranh với Alexa của Amazon. Chatbot nói chuyện một cách tự nhiên đến mức có thể bắt chước các đặc điểm của người thật như là ngắt lời, nghe hiểu tông giọng và thậm chí là cố tình mắc lỗi. 

Còn trong bản demo trực tiếp, MC đã yêu cầu GPT-4o phản hồi về kỹ thuật thở của mình. Theo đó, anh thở dốc và điện thoại, khiến cho GPT-4o trả lời bằng câu châm biếm dí dỏm: “Anh không phải là một chiếc máy hút bụi”. Và sau đó là đưa ra lời khuyên học cách thở chậm hơn. Điều này thể hiện được khả năng nghe - hiểu cũng như phản ứng với các sắc thái của con người”. 

Giao diện của ChatGPT mới. (Nguồn ảnh: Znews)
Giao diện của ChatGPT mới. (Nguồn ảnh: Znews)

Bên cạnh khiếu hài hước, chatbot cũng có khả năng thay đổi giọng điệu của câu trả lời và thêm nhiều cử chỉ trong lúc truyền tải suy nghĩ bằng lời nói. Cũng tương tự như các cuộc trò chuyện giữa người với người, bạn có thể cắt ngang giọng của trợ lý AI và sửa nó, để cho nó thay đổi nội dung hoặc ngừng nói. Và bạn thậm chí có thể yêu cầu nó nói bằng một giọng điệu khác hay nói theo giọng robot tùy thích cũng như cung cấp bản dịch đi kèm. 

Còn trong một bản demo khác, 2 người thuyết trình trên sân khấu - một người nói chuyện tiếng Anh và một người nói tiếng Italy đã có một cuộc nói chuyện với GPT-4o. Và nó cũng có thể nhanh chóng cung cấp bản dịch từ tiếng Italy sang tiếng Anh, sau đó là dịch liền mạch từ tiếng Anh sang tiếng Italy. 

AI có thể hiểu, biểu đạt cảm xúc như người thật

Ngoài ra, GPT-4o không chỉ hiểu được giọng nói con người mà còn có thể nhìn và hiểu hình ảnh. Điển hình như chatbot có thể nhìn vào một bức ảnh selfie sau đó viết phần mô tả liên quan đến trang phục mà bạn đang mặc hoặc cảm xúc của bạn lúc đó.

Phía OpenAI cho biết, GPT-4o không giống như những phiên bản trước, người dùng cũng có thể làm gián đoạn mô hình AI khi mà nó đang nói, yêu cầu nó trả lời trong thời gian thực cũng như giảm đi độ trễ thời gian 2-3 giây. 

Hiện nay, ChatGPT cũng có khả năng phát hiện cảm xúc bằng cách nhìn vào khuôn mặt qua camera. Và trong bản demo, AI nhận biết được khuôn mặt tươi cười của đại diện OpenAI và hỏi rằng: “Bạn có muốn chia sẻ điều gì đã khiến cho tâm trạng của bạn tốt thế không?”. Bên cạnh cảm nhận được cảm xúc, GPT-4o còn có thể tạo ra được cảm xúc. Khi mà trình diễn, nhân viên OpenAI đã yêu cầu trợ lý AI đọc một câu chuyện trước khi đi ngủ với biểu cảm đa dạng cũng như kịch tính hơn. Và kết quả là, GPT-4o đọc với giọng hùng hổ hơn nhiều, thậm chí là có thể chuyển sang giọng đọc nói robot theo lệnh. Và thậm chí, bạn có thể yêu cầu nó hát và ngay lập tức nhận ra được sự thay đổi. 

(Nguồn ảnh: Znews)
(Nguồn ảnh: Znews)

Và trong suốt thời gian dùng thử thì ChatGPT hoạt động một cách nhanh chóng, không gặp khó khăn trong tác vụ nghe, đọc hiểu vấn đề khi mà người dùng đặt câu hỏi cho. GPT-4o cũng tự nhiên hơn so với việc nhập truy vấn bởi người dùng có thể nói chuyện với điện thoại của mình, nhận được sự phản hồi như ý muốn mà không phải là câu trả lời kiểu mẫu./.

Kinhdoanhvaphattrien.vn | 05/11/2023

eMagazine
kinhdoanhvaphattrien.vn | 07/07/2024