Động thái mới của các “gã khổng lồ” trong cuộc chiến AI
Nhằm cung cấp năng lượng cho các sản phẩm trí tuệ nhân tạo, các công ty AI đã chi hàng tỷ USD để xây dựng mô hình ngôn ngữ lớn. Hiện nay, họ đều đang chạy theo một hướng đi mới để cải thiện doanh thu trong cuộc đua về AI. Đó là tạo nên mô hình ngôn ngữ nhỏ (SLM).
Tăng doanh thu và giảm chi phí nhờ mô hình ngôn ngữ nhỏ
Thời gian gần đây, các gã khổng lồ Microsoft, Meta, Google hay Apple đều đã phát hành các mô hình trí tuệ nhân tạo mới với ít tham số hơn. Đó là số lượng biến được dùng để đào tạo hệ thống AI và định hình đầu ra của nó. Tuy nhiên vẫn có khả năng mạnh mẽ.
Bước đi này được xem là sự nỗ lực rất lớn của các công ty công nghệ để khuyến khích các doanh nghiệp áp dụng trí tuệ nhân tạo. Không ít doanh nghiệp vẫn còn đang lo lắng về nguồn lực và chi phí cần thiết để chạy các mô hình ngôn ngữ lớn. Đó là loại công nghệ làm nền tảng cho các chatbot phổ biến như ChatGPT của OpenAI.
Trên thực tế, hiệu suất của phần mềm AI sẽ càng tốt nếu số lượng tham số càng cao và các nhiệm vụ của nó càng trở nên phức tạp với nhiều sắc thái hơn.
Gần đây nhất, mẫu Gemini 1.5 Pro của Google và GPT-4o của OpenAI Điều đó được ra mắt trong thời gian qua, ước tính có hơn 1.000 tỷ tham số và hiện nay Meta đang đào tạo phiên bản 400 tỷ tham số của mô hình Llama mới ra mắt gần đây.
Thế nhưng, các công ty công nghệ đã phải nghiên cứu những ngôn ngữ nhỏ chỉ với vài tỷ tham số do phải đối mặt với những thách thức lớn về nguồn vốn và dữ liệu khổng lồ để vận hành các sản phẩm trí tuệ nhân tạo tổng hợp hay những vấn đề về pháp lý.
Với những mô hình này, các doanh nghiệp có thể giảm thiểu chi phí, hạn chế được nguồn tư liệu không tốt. Theo Eric Boyd, Phó giám đốc phụ trách nền tảng AI Azure của Microsoft, những mô hình này có thể đảm bảo chất lượng thông tin mà khách hàng muốn biết, vừa có thể giúp doanh nghiệp tiết kiệm được chi phí do tốn ít tài nguyên hơn khi chúng hoạt động với hiệu suất cao.
Bên cạnh việc đấu tranh để thuyết phục một số khách hàng trong việc trả số tiền lớn để chạy các sản phẩm trí tuệ nhân tạo tổng hợp, cũng xuất hiện những mối lo về dữ liệu vào bản quyền đang gây cản trở đối với việc áp dụng.
Kết quả là các nhóm công nghệ như Google và Meta đưa ra các mô hình ngôn ngữ nhỏ, chỉ với vài tỷ tham số nhưng có chi phí thấp hơn, tiết kiệm năng lượng và có thể tùy chỉnh. Chúng cần ít năng lượng hơn để đào tạo và chạy, cũng như có khả năng ngăn chặn dữ liệu nhạy cảm.
Cùng với Meta, Microsoft, Google, công ty khởi nghiệp Mistral của Pháp đã tung ra các mô hình nuôi nhỏ cho thấy khả năng tiến bộ và có thể tập trung vào các ứng dụng cụ thể tốt hơn.
Theo Nick Clegg, chủ tịch phụ trách các vấn đề toàn cầu của Meta, mô hình 8 tỷ tham số mới của Llama 3 có thể so sánh ngang hàng với GPT-4. Theo Microsoft, với 7 tỷ tham số, mô hình Phi-3 nhỏ đang hoạt động tốt hơn so với GPT-3.5, đây là phiên bản trước đó của mô hình OpenAI.
Tiềm năng với các gã khổng lồ
Thay vì gửi thông tin lên đám mây, các mô hình ngôn ngữ nhỏ có thể xử lý các tác vụ cục bộ trên thiết bị. Điều đó có thể thu hút những khách hàng chủ yếu quan tâm đến quyền riêng tư vốn đảm bảo thông tin được lưu giữ cho mạng nội bộ.
Theo Charlotte Marshall, quản lý tại Addleshaw Goddard - Công ty luật tư vấn cho các ngân hàng, khi áp dụng các sản phẩm trí tuệ nhân tạo sáng tạo, một trong những thách thức mà khách hàng của họ đã gặp phải là tuân thủ những yêu cầu liên quan đến pháp lý về xử lý và truyền dữ liệu. Theo bà, những mô hình giống như nhỏ hơn có thể mang lại cơ hội cho doanh nghiệp vượt qua được những khó khăn liên quan đến chi phí và pháp lý.
Bên cạnh đó, những mẫu mô hình ngôn ngữ nhỏ hơn cũng cho phép các tính năng trí tuệ nhân tạo chạy trên các thiết bị như điện thoại di động. Mẫu “Gemini Nano” của Google xuất hiện bên trong điện thoại Pixel mới nhất cũng như điện thoại thông minh S24 mới nhất của hãng smartphone Samsung.
Apple cũng đã có ám chỉ rằng họ cũng đang phát triển các mô hình AI để chạy trên chiếc iPhone đắt khách nhất của mình. Gã khổng lồ Thung lũng Silicon hồi tháng trước đã phát hành mô hình OpenELM. Đây là một mô hình nhỏ được thiết kế để triển khai các tác vụ dựa trên văn bản.
Theo Boyd của Microsoft, những mẫu máy nhỏ hơn sẽ đem đến các ứng dụng thú vị cho tới máy tính xách tay và điện thoại di động.
Theo Giám đốc OpenAI Sam Altman chia sẻ hồi tháng 11, công ty khởi nghiệp có trụ sở tại San Francisco này đã tung ra các mô hình trí tuệ nhân tạo có quy mô khác nhau cho khách hàng, đồng thời phục vụ cho các mục đích riêng biệt. Trong thời gian tới, họ sẽ tiếp tục xây dựng và bán các tùy chọn này.
Ông cho biết thêm rằng, các mô hình nhỏ hơn thực sự sẽ hoạt động tốt ở một số thứ và ông cảm thấy rất vui mừng vì điều đó.
Thế nhưng, theo Altman, OpenAI cũng sẽ chủ yếu tập trung vào việc tạo nên các mô hình trí tuệ nhân tạo lớn hơn với khả năng mở rộng quy mô, trong đó có khả năng lập kế hoạch suy luận và triển khai những nhiệm vụ, sau cùng là đạt được trí thông minh của con người./.
- Ứng dụng trí tuệ nhân tạo trong tạo cây trồng hấp thụ carbon chống biến đổi khí hậu
- Nhu cầu điện khổng lồ phục vụ trí tuệ nhân tạo tại Châu Á
- Trí tuệ nhân tạo, dữ liệu lớn: "Cánh tay đắc lực" quản lý tuân thủ pháp luật thuế tại Việt Nam