ISSN-2815-5823
Tâm Phạm
Thứ năm, 11h24 04/04/2024

Ngôi vua của ChatGPT bị “lật đổ”, không còn là chatbot AI thông minh nhất hiện nay

(KDPT) - Từ lâu đến nay, ChatGPT vẫn được đánh giá là chatbot tích hợp AI thông minh nhất nhờ vào việc cơ sở dữ liệu lớn, tốc độ phản hồi người dùng nhanh. Tuy nhiên thì mới đây ngôi vị này của ChatGPT đã bị lật đổ.

Lộ diện bảng xếp hạng các chatbot AI thông minh nhất

Vào cuối tháng 1/2023, ChatGPT - chatbot (phần mềm tự động) tích hợp với trí tuệ nhân tạo (AI) đã bỗng nhiên vụt sáng trở thành một hiện tượng trên toàn cầu, khi mà chatbot này thể hiện được sự thông minh đáng kinh ngạc thông qua những nội dung hội thoại với những người dùng.

Theo đó, người dùng có thể đặt những câu hỏi và giao tiếp với ChatGPT bằng văn bản, công cụ này sẽ đưa ra câu trả lời cũng như thực hiện theo các yêu cầu của người dùng, như viết đoạn văn, viết mã lập trình, soạn email,... với ngôn ngữ hết sức tự nhiên và như một con người thực sự. Điều đặc biệt, ChatGPT hỗ trợ tốt nhiều ngôn ngữ khác nhau, trong đó bao gồm cả tiếng Việt. 

Và kể từ khi ChatGPT tạo nên một cơn sốt trên toàn cầu thì nhiều hãng công nghệ lớn cũng đã nhanh chóng bắt tay vào xây dựng những công cụ chatbot tích hợp AI để có thể cạnh tranh với ChatGPT từ đó mở ra một cuộc đua về phát triển AI, có thể kể đến như Gemini của Google, Qwen của Alibaba hay Copilot của Microsoft, Llama của Meta,...

Từ lâu đến nay, ChatGPT vẫn được đánh giá là chatbot tích hợp AI thông minh nhất nhờ vào việc cơ sở dữ liệu lớn, tốc độ phản hồi người dùng nhanh. Tuy nhiên thì mới đây ngôi vị này của ChatGPT đã bị lật đổ. (Nguồn ảnh: Kinh tế đô thị)
Từ lâu đến nay, ChatGPT vẫn được đánh giá là chatbot tích hợp AI thông minh nhất nhờ vào việc cơ sở dữ liệu lớn, tốc độ phản hồi người dùng nhanh. Tuy nhiên thì mới đây ngôi vị này của ChatGPT đã bị lật đổ. (Nguồn ảnh: Kinh tế đô thị)

Mặc dù vậy thì ChatGPT cũng vẫn vững vàng vị trí ngôi vương trong cuộc đua và vẫn được giới công nghệ cũng như người dùng đánh giá là chatbot AI thông minh nhất thời điểm hiện nay. 

Dù vậy thì thời gian mới đây, ChatGPT cũng đã không còn là chatbot AI thông minh nhất trên thế giới, theo như bảng xếp hạng vừa được công bố của LMSYS - đây là một tổ chức chuyên đánh giá cũng như xếp hạng khả năng của các mô hình ngôn ngữ lớn và là nền tảng để có thể phát triển nên những công cụ chatbot AI. 

Theo như bảng xếp hạng "Chatbot Arena" của LMSYS có thể thấy, mô hình ngôn ngữ lớn Claude 3 Opus được phát triển bởi Anthropic, công ty khởi nghiệp có trụ sở tại Francisco đã vượt qua GPT-4-1106-preview của OpenAI để có thể trở thành mô hình ngôn ngữ lớn thông minh nhất trên thế giới. 

Claude 3 Opus chính là mô hình ngôn ngữ được sử dụng để phát triển chatbot Claude AI trong khi dó GPT -4 đang được sử dụng để có thể làm nền tảng cho chatbot GPT phiên bản chuyên nghiệp của OpenAI. 

Đây chính là lần đầu tiên mô hình ngôn ngữ của OpenAi bị đánh bật khỏi vị trí dẫn đầu, tính từ khi LMSYS cho ra mắt bảng xếp hạng "Chatbot Arena" thời điểm cách đây một năm. Và bảng xếp hạng này cũng liên tục được cập nhật và thứ hạng các mô hình ngôn ngữ luôn có sự xáo trộn, tuy nhiên GPT của OpenAI chưa bao giờ rời khỏi vị trí đầu tiên cho đến thời điểm hiện nay. 

Cũng theo đó, mô hình ngôn ngữ GPT-4 với phiên bản thấp hơn  (GPT-4-0125-preview) xếp ở vị trí thứ 3 ở trong bảng xếp hạng của LMSYS, trong khi đó thì mô hình ngôn ngữ của Bard (sử dụng để có thể phát triển chatbot Gemini phiên bản chuyên nghiệp) của Google xếp ở vị trí thứ 4 về mức độ thông minh. 

Điều đặc biệt, điểm số đánh giá về 3 mô hình ngôn ngữ lớn dẫn đầu ở trong bảng xếp hạng chênh nhau rất nhiều, điều này cũng cho thấy được mức độ thông minh của các chatbot xây dựng trên 3 mô hình ngôn ngữ này là tương đương với nhau. 

Và trong số 10 mô hình ngôn ngữ lớn xếp đầu về trí thông minh thì Anthropic đã góp mặt với 3 cái tên, cụ thể là Claude 3 Opus, Claude 3 Sonnet (đứng ở vị trí thứ 4, sử dụng cho Claude AI với phiên bản miễn phí), cùng với Claude 3 Haiku (phiên bản Claude 3 đầu tiên được xếp ở vị trí thứ 7).

Người dùng có thể so sánh nội dung được cung cấp bởi 2 LLM khác nhau cho cùng một câu hỏi cũng như đánh giá để chấm điểm. LMSYS dựa vào các đánh giá của người dùng để xếp hạng các LLM. (Nguồn ảnh: Dân trí)
Người dùng có thể so sánh nội dung được cung cấp bởi 2 LLM khác nhau cho cùng một câu hỏi cũng như đánh giá để chấm điểm. LMSYS dựa vào các đánh giá của người dùng để xếp hạng các LLM. (Nguồn ảnh: Dân trí)

Đối với Claude 3, Anthropic cam kết sẽ cải thiện được khả năng trả lời các câu hỏi, hiểu biết được các chỉ dẫn phức tạp cũng như tăng cường hiểu biết ngữ cảnh, cho phép xử lý thông tin chính xác, linh hoạt hơn. Bản thân của Claude 3 cũng được chia làm 3 phiên bản đó là Haiku, Sonnet, và Opus, với Opus - đây là phiên bản cao cấp nhất, được mô tả đó là "mô hình AI lớn nhất và thông minh nhất". Đến thời điểm hiện tại thì Opus và Sonnet đã có mặt ở trên trang web claude.ai và qua API của hãng, trong khi đó Haiku sẽ sớm được ra mắt. Cả ba phiên bản đều được thiết kế để có thể hỗ trợ cho các ứng dụng như là chatbot, trích xuất dữ liệu.

Và sự cải tiến từ những phiên bản trước đây của Claude đã khá là rõ ràng, trong bối cảnh những mô hình trước đó của AI này từng gặp khó khăn trong việc trả lời một số câu lệnh mang tính mơ hồ bởi hạn chế về hiểu biết ngữ cảnh. Những mô hình mới giờ đây ít có khả năng từ chối trả lời các yêu cầu cũng như phản ánh được một sự tiến bộ đáng kể trong việc duy trì những tiêu chuẩn an toàn mà không làm giảm đi hiệu quả tương tác. 

Anthropic cũng tự tin khẳng định những mô hình Claude 3 cung cấp tốc độ phản hồi gần như là tức thì, ngay cả khi phải đối mặt với những tài liệu phức tạp. Trong đó, Claude 3 haiku cũng nổi bật như một giải pháp tiết kiệm chi phí, nhanh chóng và có khả năng xử lý những tài liệu nghiên cứu chứa đầy biểu đồ cũng như hình ảnh trong ít hơn ba giây. Đáng chú ý, phiên bản Opus cũng thể hiện được khả năng suy luận vượt trội so với những mô hình cạnh tranh, trong đó bao gồm cả GPT-4 của OpenAI, trong những bài kiểm tra đánh giá có độ phức tạp như là bài kiểm tra trình độ sau đại học. 

Bên cạnh đó, mô hình tương tự như là Google, Gemini Advanced cũng đang nhận được sự chú ý đang ngày càng tăng, cho thấy được sự cạnh tranh trong lĩnh vực này không chỉ dừng lại ở OpenAI, Anthropic. Tuy nhiên thì trong khi phải đối mặt với những thách thức ngắn hạn thì OpenAI cũng đang chủ động chuẩn bị cho tương lai bằng cách phát triển và sẵn sàng giới thiệu người kế nhiệm mạnh mẽ cho GPT-4 Turbo. Chính sự ra mắt kỳ vọng này không chỉ đánh dấu bước tiến mới trong công nghệ AI mà còn mở ra hứa hẹn về những biến chuyển sôi động, đáng chú ý trong bảng xếp hạng Chatbot Arena trong thời gian tới.

Theo như bảng xếp hạng vừa được công bố của LMSYS - đây là một tổ chức chuyên đánh giá cũng như xếp hạng khả năng của các mô hình ngôn ngữ lớn và là nền tảng để có thể phát triển nên những công cụ chatbot AI. (Ảnh minh họa)
Theo như bảng xếp hạng vừa được công bố của LMSYS - đây là một tổ chức chuyên đánh giá cũng như xếp hạng khả năng của các mô hình ngôn ngữ lớn và là nền tảng để có thể phát triển nên những công cụ chatbot AI. (Ảnh minh họa)

Trong khi đó thì OpenAI cũng góp mặt 4 sản phẩm trong TOP 10 mô hình ngôn ngữ thông minh nhất với 2 phiên bản thử nghiệm của GPT-4 (đây là phiên bản preview, xếp lần lượt ở vị trí thứ 2 và vị trí thứ 3), GPT-4-0314 (xếp ở vị trí thứ 6) cùng với GPT-4-0613 (xếp ở vị trí thứ 8).

Theo đó, 8 vị trí dẫn đầu trong TOP 10 mô hình ngôn ngữ lớn thông minh nhất đều thuộc về các công ty của Mỹ. Cụ thể, mô hình ngôn ngữ Mistral-Large-2402 của hãng công nghệ Pháp Mistral cùng với Qwen1.5-72B-Chat của hãng công nghệ Trung Quốc Alibaba xếp hạng lần lượt ở vị trí thứ 9 và 10. 

Các chuyên gia cũng dự đoán rằng, khi OpenAI ra mắt mô hình ngôn ngữ GPT-5 hoàn toàn mới và có nhiều cải tiến so với GPT-4 hiện nay, ChatGPT cũng sẽ sớm trở lại vị trí dẫn đầu ở trên cuộc đua chatbot tích hợp AI. 

Khái niệm mô hình ngôn ngữ lớn

Nói một cách dễ hiểu rằng, mô hình ngôn ngữ lớn (Large Language Model - LLM) chính là một loại trí tuệ nhân tạo (AI) được đào tạo dựa trên một lượng dữ liệu vô cùng lớn để có thể thực hiện được các tác vụ liên quan đến ngôn ngữ, trong đó bao gồm trả lời các câu hỏi, tạo nội dung văn bản và tóm tắt văn bản, dịch thuật, soạn email,... theo như yêu cầu của người dùng. Những mô hình ngôn ngữ lớn hiện nay còn có thể viết mã lập trình bằng nhiều ngôn ngữ khác nhau. 

Những mô hình ngôn ngữ lớn được đào tạo dựa trên một lượng dữ liệu lớn được tập hợp từ sách nghiên cứu, công trình khoa học cùng các trang web, từ điển bách khoa, mạng internet hoặc được những nhà phát triển xây dựng, tổng hợp riêng theo từng lĩnh vực, chuyên ngành,...

Những mô hình ngôn ngữ lớn có thể hiểu cũng như giao tiếp với con người bằng văn bản và giọng nói, nhận diện hình ảnh để có thể phản hồi các câu hỏi của người dùng. Cách thức diễn tả nội dung của các LLM cũng rất trau chuốt và tự nhiên, gần gũi với cách diễn đạt của con người. 

Và các mô hình ngôn ngữ lớn chính là nền tảng tạo nên những chatbot AI cũng như tiếp tục được phát triển để có thể thực hiện nhiều tác vụ phức tạp, phục vụ nhiều lĩnh vực ở trong cuộc sống. 

(Ảnh minh họa)
(Ảnh minh họa)

Bảng xếp hạng "Chatbot Arena" của LMSYS như thế nào?

LMSYS (Large Model Systems) Organization chính là một tổ chức nghiên cứu được thành lập bởi các chuyên gia về AI ở Đại học California Berkeley, Đại học California San Diego cùng với Đại học Carnegie Mellon nhằm mục đích nghiên cứu về những hệ thống AI và đánh giá về những mô hình ngôn ngữ lớn. 

"Chatbot Arena" cũng chính là một bảng xếp hạng do LMSYS tạo ra để có thể đánh giá và xếp hạng những mô hình ngôn ngữ lớn phổ biến, được sử dụng một cách rộng rãi nhất hiện nay. Ngoài đánh giá từ các chuyên gia, "Chatbot Arena" còn ghi nhận được đánh giá từ cộng đồng người dùng khi mà sử dụng các chatbot ở trong thực tế. 

"Chatbot Arena" cũng có đánh giá và xếp hạng các LLM bằng hình thức so sánh mù - tức là người dùng sẽ sử dụng một cách ngẫu nhiên các LLM khác nhau mà họ không biết rõ đó là loại hình chatbot nào, sau đó là người dùng cũng sẽ đưa ra những đánh giá về tốc độ phản hồi cũng như múc độ chính xác của các thông tin hoặc là mức độ hài lòng về tốc độ phản hồi, mức độ chính xác của thông tin hay là mức độ hài lòng về nội dung do chatbot cung cấp. 

Cũng dựa vào đánh giá này, LMSYS sẽ tiến hành tổng hợp, chấm điểm cũng như xếp hạng mức độ thông minh của các mô hình ngôn ngữ lớn cùng các chatbot được xây dựng dựa trên các LLM này./.

Kinhdoanhvaphattrien.vn | 05/11/2023

eMagazine
kinhdoanhvaphattrien.vn | 12/05/2024