Tâm Phạm

Thứ Năm, 11h24 04/04/2024

Khoa học & Công nghệ

Ngôi vua của ChatGPT bị “lật đổ”, không còn là chatbot AI thông minh nhất hiện nay

Đọc thêm

Startup Covariant phát triển công nghệ AI của ChatGPT “gia nhập” thế giới thực

ChatGPT mất 15 giây viết dự thảo luật và được thông qua ngay lập tức

ChatGPT: Một năm thay đổi thế giới

(KDPT) - Từ lâu đến nay, ChatGPT vẫn được đánh giá là chatbot tích hợp AI thông minh nhất nhờ vào việc cơ sở dữ liệu lớn, tốc độ phản hồi người dùng nhanh. Tuy nhiên thì mới đây ngôi vị này của ChatGPT đã bị lật đổ.

Lộ diện bảng xếp hạng các chatbot AI thông minh nhất

Vào cuối tháng 1/2023, ChatGPT - chatbot (phần mềm tự động) tích hợp với trí tuệ nhân tạo (AI) đã bỗng nhiên vụt sáng trở thành một hiện tượng trên toàn cầu, khi mà chatbot này thể hiện được sự thông minh đáng kinh ngạc thông qua những nội dung hội thoại với những người dùng.

Theo đó, người dùng có thể đặt những câu hỏi và giao tiếp với ChatGPT bằng văn bản, công cụ này sẽ đưa ra câu trả lời cũng như thực hiện theo các yêu cầu của người dùng, như viết đoạn văn, viết mã lập trình, soạn email,... với ngôn ngữ hết sức tự nhiên và như một con người thực sự. Điều đặc biệt, ChatGPT hỗ trợ tốt nhiều ngôn ngữ khác nhau, trong đó bao gồm cả tiếng Việt.

Và kể từ khi ChatGPT tạo nên một cơn sốt trên toàn cầu thì nhiều hãng công nghệ lớn cũng đã nhanh chóng bắt tay vào xây dựng những công cụ chatbot tích hợp AI để có thể cạnh tranh với ChatGPT từ đó mở ra một cuộc đua về phát triển AI, có thể kể đến như Gemini của Google, Qwen của Alibaba hay Copilot của Microsoft, Llama của Meta,...

Từ lâu đến nay, ChatGPT vẫn được đánh giá là chatbot tích hợp AI thông minh nhất nhờ vào việc cơ sở dữ liệu lớn, tốc độ phản hồi người dùng nhanh. Tuy nhiên thì mới đây ngôi vị này của ChatGPT đã bị lật đổ. (Nguồn ảnh: Kinh tế đô thị)

Mặc dù vậy thì ChatGPT cũng vẫn vững vàng vị trí ngôi vương trong cuộc đua và vẫn được giới công nghệ cũng như người dùng đánh giá là chatbot AI thông minh nhất thời điểm hiện nay.

Dù vậy thì thời gian mới đây, ChatGPT cũng đã không còn là chatbot AI thông minh nhất trên thế giới, theo như bảng xếp hạng vừa được công bố của LMSYS - đây là một tổ chức chuyên đánh giá cũng như xếp hạng khả năng của các mô hình ngôn ngữ lớn và là nền tảng để có thể phát triển nên những công cụ chatbot AI.

Theo như bảng xếp hạng "Chatbot Arena" của LMSYS có thể thấy, mô hình ngôn ngữ lớn Claude 3 Opus được phát triển bởi Anthropic, công ty khởi nghiệp có trụ sở tại Francisco đã vượt qua GPT-4-1106-preview của OpenAI để có thể trở thành mô hình ngôn ngữ lớn thông minh nhất trên thế giới.

Claude 3 Opus chính là mô hình ngôn ngữ được sử dụng để phát triển chatbot Claude AI trong khi dó GPT -4 đang được sử dụng để có thể làm nền tảng cho chatbot GPT phiên bản chuyên nghiệp của OpenAI.

Đây chính là lần đầu tiên mô hình ngôn ngữ của OpenAi bị đánh bật khỏi vị trí dẫn đầu, tính từ khi LMSYS cho ra mắt bảng xếp hạng "Chatbot Arena" thời điểm cách đây một năm. Và bảng xếp hạng này cũng liên tục được cập nhật và thứ hạng các mô hình ngôn ngữ luôn có sự xáo trộn, tuy nhiên GPT của OpenAI chưa bao giờ rời khỏi vị trí đầu tiên cho đến thời điểm hiện nay.

Cũng theo đó, mô hình ngôn ngữ GPT-4 với phiên bản thấp hơn (GPT-4-0125-preview) xếp ở vị trí thứ 3 ở trong bảng xếp hạng của LMSYS, trong khi đó thì mô hình ngôn ngữ của Bard (sử dụng để có thể phát triển chatbot Gemini phiên bản chuyên nghiệp) của Google xếp ở vị trí thứ 4 về mức độ thông minh.

Điều đặc biệt, điểm số đánh giá về 3 mô hình ngôn ngữ lớn dẫn đầu ở trong bảng xếp hạng chênh nhau rất nhiều, điều này cũng cho thấy được mức độ thông minh của các chatbot xây dựng trên 3 mô hình ngôn ngữ này là tương đương với nhau.

Và trong số 10 mô hình ngôn ngữ lớn xếp đầu về trí thông minh thì Anthropic đã góp mặt với 3 cái tên, cụ thể là Claude 3 Opus, Claude 3 Sonnet (đứng ở vị trí thứ 4, sử dụng cho Claude AI với phiên bản miễn phí), cùng với Claude 3 Haiku (phiên bản Claude 3 đầu tiên được xếp ở vị trí thứ 7).

Người dùng có thể so sánh nội dung được cung cấp bởi 2 LLM khác nhau cho cùng một câu hỏi cũng như đánh giá để chấm điểm. LMSYS dựa vào các đánh giá của người dùng để xếp hạng các LLM. (Nguồn ảnh: Dân trí)

Đối với Claude 3, Anthropic cam kết sẽ cải thiện được khả năng trả lời các câu hỏi, hiểu biết được các chỉ dẫn phức tạp cũng như tăng cường hiểu biết ngữ cảnh, cho phép xử lý thông tin chính xác, linh hoạt hơn. Bản thân của Claude 3 cũng được chia làm 3 phiên bản đó là Haiku, Sonnet, và Opus, với Opus - đây là phiên bản cao cấp nhất, được mô tả đó là "mô hình AI lớn nhất và thông minh nhất". Đến thời điểm hiện tại thì Opus và Sonnet đã có mặt ở trên trang web claude.ai và qua API của hãng, trong khi đó Haiku sẽ sớm được ra mắt. Cả ba phiên bản đều được thiết kế để có thể hỗ trợ cho các ứng dụng như là chatbot, trích xuất dữ liệu.

Và sự cải tiến từ những phiên bản trước đây của Claude đã khá là rõ ràng, trong bối cảnh những mô hình trước đó của AI này từng gặp khó khăn trong việc trả lời một số câu lệnh mang tính mơ hồ bởi hạn chế về hiểu biết ngữ cảnh. Những mô hình mới giờ đây ít có khả năng từ chối trả lời các yêu cầu cũng như phản ánh được một sự tiến bộ đáng kể trong việc duy trì những tiêu chuẩn an toàn mà không làm giảm đi hiệu quả tương tác.

Anthropic cũng tự tin khẳng định những mô hình Claude 3 cung cấp tốc độ phản hồi gần như là tức thì, ngay cả khi phải đối mặt với những tài liệu phức tạp. Trong đó, Claude 3 haiku cũng nổi bật như một giải pháp tiết kiệm chi phí, nhanh chóng và có khả năng xử lý những tài liệu nghiên cứu chứa đầy biểu đồ cũng như hình ảnh trong ít hơn ba giây. Đáng chú ý, phiên bản Opus cũng thể hiện được khả năng suy luận vượt trội so với những mô hình cạnh tranh, trong đó bao gồm cả GPT-4 của OpenAI, trong những bài kiểm tra đánh giá có độ phức tạp như là bài kiểm tra trình độ sau đại học.

Bên cạnh đó, mô hình tương tự như là Google, Gemini Advanced cũng đang nhận được sự chú ý đang ngày càng tăng, cho thấy được sự cạnh tranh trong lĩnh vực này không chỉ dừng lại ở OpenAI, Anthropic. Tuy nhiên thì trong khi phải đối mặt với những thách thức ngắn hạn thì OpenAI cũng đang chủ động chuẩn bị cho tương lai bằng cách phát triển và sẵn sàng giới thiệu người kế nhiệm mạnh mẽ cho GPT-4 Turbo. Chính sự ra mắt kỳ vọng này không chỉ đánh dấu bước tiến mới trong công nghệ AI mà còn mở ra hứa hẹn về những biến chuyển sôi động, đáng chú ý trong bảng xếp hạng Chatbot Arena trong thời gian tới.

Theo như bảng xếp hạng vừa được công bố của LMSYS - đây là một tổ chức chuyên đánh giá cũng như xếp hạng khả năng của các mô hình ngôn ngữ lớn và là nền tảng để có thể phát triển nên những công cụ chatbot AI. (Ảnh minh họa)

Trong khi đó thì OpenAI cũng góp mặt 4 sản phẩm trong TOP 10 mô hình ngôn ngữ thông minh nhất với 2 phiên bản thử nghiệm của GPT-4 (đây là phiên bản preview, xếp lần lượt ở vị trí thứ 2 và vị trí thứ 3), GPT-4-0314 (xếp ở vị trí thứ 6) cùng với GPT-4-0613 (xếp ở vị trí thứ 8).

Theo đó, 8 vị trí dẫn đầu trong TOP 10 mô hình ngôn ngữ lớn thông minh nhất đều thuộc về các công ty của Mỹ. Cụ thể, mô hình ngôn ngữ Mistral-Large-2402 của hãng công nghệ Pháp Mistral cùng với Qwen1.5-72B-Chat của hãng công nghệ Trung Quốc Alibaba xếp hạng lần lượt ở vị trí thứ 9 và 10.

Các chuyên gia cũng dự đoán rằng, khi OpenAI ra mắt mô hình ngôn ngữ GPT-5 hoàn toàn mới và có nhiều cải tiến so với GPT-4 hiện nay, ChatGPT cũng sẽ sớm trở lại vị trí dẫn đầu ở trên cuộc đua chatbot tích hợp AI.

Khái niệm mô hình ngôn ngữ lớn

Nói một cách dễ hiểu rằng, mô hình ngôn ngữ lớn (Large Language Model - LLM) chính là một loại trí tuệ nhân tạo (AI) được đào tạo dựa trên một lượng dữ liệu vô cùng lớn để có thể thực hiện được các tác vụ liên quan đến ngôn ngữ, trong đó bao gồm trả lời các câu hỏi, tạo nội dung văn bản và tóm tắt văn bản, dịch thuật, soạn email,... theo như yêu cầu của người dùng. Những mô hình ngôn ngữ lớn hiện nay còn có thể viết mã lập trình bằng nhiều ngôn ngữ khác nhau.

Những mô hình ngôn ngữ lớn được đào tạo dựa trên một lượng dữ liệu lớn được tập hợp từ sách nghiên cứu, công trình khoa học cùng các trang web, từ điển bách khoa, mạng internet hoặc được những nhà phát triển xây dựng, tổng hợp riêng theo từng lĩnh vực, chuyên ngành,...

Những mô hình ngôn ngữ lớn có thể hiểu cũng như giao tiếp với con người bằng văn bản và giọng nói, nhận diện hình ảnh để có thể phản hồi các câu hỏi của người dùng. Cách thức diễn tả nội dung của các LLM cũng rất trau chuốt và tự nhiên, gần gũi với cách diễn đạt của con người.

Và các mô hình ngôn ngữ lớn chính là nền tảng tạo nên những chatbot AI cũng như tiếp tục được phát triển để có thể thực hiện nhiều tác vụ phức tạp, phục vụ nhiều lĩnh vực ở trong cuộc sống.

Bảng xếp hạng "Chatbot Arena" của LMSYS như thế nào?

LMSYS (Large Model Systems) Organization chính là một tổ chức nghiên cứu được thành lập bởi các chuyên gia về AI ở Đại học California Berkeley, Đại học California San Diego cùng với Đại học Carnegie Mellon nhằm mục đích nghiên cứu về những hệ thống AI và đánh giá về những mô hình ngôn ngữ lớn.

"Chatbot Arena" cũng chính là một bảng xếp hạng do LMSYS tạo ra để có thể đánh giá và xếp hạng những mô hình ngôn ngữ lớn phổ biến, được sử dụng một cách rộng rãi nhất hiện nay. Ngoài đánh giá từ các chuyên gia, "Chatbot Arena" còn ghi nhận được đánh giá từ cộng đồng người dùng khi mà sử dụng các chatbot ở trong thực tế.

"Chatbot Arena" cũng có đánh giá và xếp hạng các LLM bằng hình thức so sánh mù - tức là người dùng sẽ sử dụng một cách ngẫu nhiên các LLM khác nhau mà họ không biết rõ đó là loại hình chatbot nào, sau đó là người dùng cũng sẽ đưa ra những đánh giá về tốc độ phản hồi cũng như múc độ chính xác của các thông tin hoặc là mức độ hài lòng về tốc độ phản hồi, mức độ chính xác của thông tin hay là mức độ hài lòng về nội dung do chatbot cung cấp.

Cũng dựa vào đánh giá này, LMSYS sẽ tiến hành tổng hợp, chấm điểm cũng như xếp hạng mức độ thông minh của các mô hình ngôn ngữ lớn cùng các chatbot được xây dựng dựa trên các LLM này./.

Tạp chí Điện tử Kinh doanh & Phát triển

Từ khoá:

Khoa học & Công nghệ

Kinh tế số 2 công cụ tạo sức bật trực tiếp cho doanh nghiệp nhỏ và vừa Hà Nội

(KDPT) - Với chủ đề "Doanh nghiệp nhỏ và vừa Hà Nội ứng dụng AI và thương mại điện tử bứt phá tăng trưởng hai con số", Diễn đàn Kinh...

18:07 31/07/2026

Chuyển đổi số Chuyển đổi số tiếp tục là điểm sáng với hơn 4,6 tỷ giao dịch qua Nền tảng tích hợp, chia sẻ dữ liệu quốc gia

(KDPT) - Trong tháng 7/2026, Bộ Khoa học và Công nghệ (KH&CN) tập trung hoàn thiện thể chế, tạo nền tảng thúc đẩy khoa học, công nghệ, đổi...

15:19 31/07/2026

Kinh tế số Việt Nam lần thứ hai đăng cai Hội nghị Kinh tế lượng châu Á AMES 2026

(KDPT) - Hội nghị Châu Á của Hiệp hội Kinh tế lượng khu vực Đông Á và Đông Nam Á năm 2026 (AMES 2026) chính thức diễn ra tại Hà Nội từ ngày...

12:21 31/07/2026

Khoa học & Công nghệ 35 dự án khởi nghiệp nông thôn trình làng nhiều ý tưởng ứng dụng công nghệ tại vòng bán kết miền Bắc

(KDPT) - Những dự án góp mặt tại vòng bán kết khu vực miền Bắc cuộc thi "Dự án khởi nghiệp thanh niên nông thôn" năm 2026 không chỉ khai thác...

20:12 30/07/2026

Chuyển đổi số Agribank tài trợ 10 trạm dịch vụ công số tại Lạng Sơn

(KDPT) - Tiếp nối lộ trình triển khai thành công tại các địa phương đi đầu về công nghệ như: Hà Nội, Thanh Hóa, Quảng Ninh, Ninh Bình, Đà...

21:12 27/07/2026

Chuyển đổi số KCD & OpenInfra Days Vietnam 2026: Cơ hội cập nhật xu hướng, học hỏi kinh nghiệm triển khai công nghệ cho cộng đồng Việt Nam

(KDPT) - Ngày 25/7, tại Hà Nội đã diễn ra sự kiện KCD & OpenInfra Days Vietnam 2026 do Kubernetes Community Days (KCD) thuộc Cloud Native Computing Foundation...

20:07 25/07/2026

Chuyển đổi số Hình thành đội ngũ doanh nhân Việt Nam có năng lực cạnh tranh quốc tế

(KDPT) - Kinh tế tư nhân là một trong những động lực quan trọng của nền kinh tế. Với định hướng "5 tiên phong", cộng đồng doanh nghiệp...

12:38 23/07/2026

Chuyển đổi số VietOffice 2026 thúc đẩy chuyển đổi số với loạt giải pháp văn phòng thông minh

(KDPT) - Không chỉ là triển lãm chuyên ngành, VietOffice 2026 còn là diễn đàn kết nối doanh nghiệp, cập nhật các giải pháp AI, số hóa tài liệu,...

17:12 21/07/2026

Khoa học & Công nghệ Phát triển công nghiệp công nghệ số: Động lực mới cho tăng trưởng quốc gia

(KDPT) - Thủ tướng Chính phủ ban hành Quyết định số 840/QĐ-TTg Chương trình phát triển công nghiệp công nghệ số giai đoạn 2026-2030, tầm...

17:12 21/07/2026

Khoa học & Công nghệ VAIC 2026: Vinh danh thế hệ “AI BUILDERS” đưa tri thức toàn cầu giải bài toán thực tế Việt Nam

(KDPT) - Lễ Bế mạc và công bố Giải pháp Đổi mới sáng tạo Việt Nam (Viet Nam AI Innovation Challenge – VAIC 2026) đã chính thức diễn ra thành công...

16:43 20/07/2026

Kinh tế số Tăng tốc với AI, OPES giữ top 7 thị phần bảo hiểm phi nhân thọ nửa đầu năm 2026

(KDPT) - Nửa đầu năm 2026, Bảo hiểm số OPES duy trì đà tăng trưởng doanh thu mạnh mẽ, cao hơn trung bình ngành, đồng thời củng cố lợi thế...

21:14 16/07/2026

Chuyển đổi số Lào Cai phát triển nguồn nhân lực, tạo nền tảng cho tăng trưởng nhanh và bền vững

(KDPT) - Trong bối cảnh chuyển đổi số, hội nhập quốc tế và yêu cầu phát triển các ngành kinh tế mới, Ban Chấp hành Đảng bộ tỉnh Lào Cai...

12:58 16/07/2026

Kinhdoanhvaphattrien.vn | 05/11/2023

eMagazine

Doanh nghiệp Việt và hành trình ESG - Phần VII: Cơ hội “tái sinh” của Hóa chất Đức Giang sau những sóng gió

(KDPT) - Với một doanh nghiệp lớn, tham gia sâu rộng nhiều lĩnh vực, đặc biệt là việc tạo dựng hình ảnh trên thị trường tài chính, thì câu chuyện niềm tin từ các hoạt động sản xuất cốt lõi sẽ quyết định đến tâm lý hành động của nhà đầu tư. Điều này, ở thời điểm này, có lẽ là tối quan trọng với Hóa chất Đức Giang, khi niềm tin đang là thứ “tài sản xa xỉ” nhất.

Xem thêm

10h45 31/07/2026

25 năm Shinec và Hành trình "thắp lửa nhân tâm" - Phần VIII: Tầm nhìn 200 năm

(KDPT) - Tuổi thọ của một khu công nghiệp không nằm ở thời hạn pháp lý mà còn ở khả năng thích nghi, đổi mới và tái sinh.

Xem thêm

11h14 30/07/2026

Nghị quyết 10 và cuộc tái định vị khu công nghiệp Việt Nam - Bài 3: Bảy định hướng lớn cần hoàn thiện trong chính sách và thể chế khu công nghiệp

(KDPT) - Nghị quyết 10 không chỉ thay đổi tư duy thu hút FDI, mà còn mở ra yêu cầu tái định vị vai trò của khu công nghiệp. Theo TS. Phạm Hồng Điệp, để hiện thực hóa mục tiêu đó, bên cạnh quyết tâm của doanh nghiệp và địa phương, cần tiếp tục hoàn thiện thể chế theo hướng khuyến khích đổi mới sáng tạo, phát triển doanh nghiệp và nâng cao chất lượng hệ sinh thái công nghiệp.

Xem thêm

11h25 29/07/2026

Xem nhiều nhất

Việt Nam lần thứ hai đăng cai Hội nghị Kinh tế lượng châu Á AMES 2026

2 công cụ tạo sức bật trực tiếp cho doanh nghiệp nhỏ và vừa Hà Nội

Hôm nay (31/7), dầu thô thế giới quay đầu giảm nhẹ

Chủ tịch HĐQT MB: Từ những bài toán thực tiễn đến những mô hình có thể vươn ra thế giới

Tân Hoàng Minh Group chính thức khởi động D’. Diamant Bleu, mở đầu chuỗi dự án chiến lược

Vietnam Airlines báo lỗ trở lại dù doanh thu lập đỉnh 4 quý liên tiếp, thị giá cổ phiếu mất hơn 19% trong 6 tháng

Hàng nghìn runner, fashionista cùng đổ bộ VPBank Ho Chi Minh City Music Half Marathon 2026

Nhận định chứng khoán (27-31/7): VN-Index chấm dứt chuỗi 4 tuần lao dốc nhưng áp lực chốt lời vẫn lớn

140 vận động viên tham dự Giải vô địch bóng bàn quốc gia Báo Nhân Dân lần thứ 44

Doanh nghiệp Việt và hành trình ESG - Phần VII: Cơ hội “tái sinh” của Hóa chất Đức Giang sau những sóng gió

Doanh nhân thời cuộc Phát triển doanh nghiệp, doanh nhân dân tộc Việt Nam: Từ một phạm trù chiến lược đến hệ cơ chế "khế ước xã hội có kỷ luật"

Góc nhìn Xu hướng chuyển dịch năng lượng toàn cầu và bài học kinh nghiệm chiến lược cho Việt Nam

Kinh tế số 2 công cụ tạo sức bật trực tiếp cho doanh nghiệp nhỏ và vừa Hà Nội

Chuyển đổi số Chuyển đổi số tiếp tục là điểm sáng với hơn 4,6 tỷ giao dịch qua Nền tảng tích hợp, chia sẻ dữ liệu quốc gia

Kinh tế số Việt Nam lần thứ hai đăng cai Hội nghị Kinh tế lượng châu Á AMES 2026

Khoa học & Công nghệ 35 dự án khởi nghiệp nông thôn trình làng nhiều ý tưởng ứng dụng công nghệ tại vòng bán kết miền Bắc

Chuyển đổi số Agribank tài trợ 10 trạm dịch vụ công số tại Lạng Sơn

Chuyển đổi số KCD & OpenInfra Days Vietnam 2026: Cơ hội cập nhật xu hướng, học hỏi kinh nghiệm triển khai công nghệ cho cộng đồng Việt Nam

Chuyển đổi số Hình thành đội ngũ doanh nhân Việt Nam có năng lực cạnh tranh quốc tế

Chuyển đổi số VietOffice 2026 thúc đẩy chuyển đổi số với loạt giải pháp văn phòng thông minh

Khoa học & Công nghệ Phát triển công nghiệp công nghệ số: Động lực mới cho tăng trưởng quốc gia

Khoa học & Công nghệ VAIC 2026: Vinh danh thế hệ “AI BUILDERS” đưa tri thức toàn cầu giải bài toán thực tế Việt Nam

Kinh tế số Tăng tốc với AI, OPES giữ top 7 thị phần bảo hiểm phi nhân thọ nửa đầu năm 2026

Chuyển đổi số Lào Cai phát triển nguồn nhân lực, tạo nền tảng cho tăng trưởng nhanh và bền vững

Ứng dụng Việt Nam dẫn đầu khu vực Đông Nam Á về ứng dụng Gemini trong hỗ trợ học thuật

Chuyển đổi số Vì sao 90% doanh nghiệp Việt mua ERP nhưng vẫn thất bại?

Kinh tế số InnoEx 2026 bàn lời giải tăng trưởng cho doanh nghiệp trong kỷ nguyên AI

kinhdoanhvaphattrien.vn | 01/08/2026