Trí tuệ nhân tạo (AI) đang dần trở thành xu hướng toàn cầuTập trung đào tạo nhân lực ngành trí tuệ nhân tạo, chíp bán dẫn, chuyển đổi năng lượngDấu ấn của trí tuệ nhân tạo (AI) trong đời sống xã hội

Ghi nhận, khi mà ChatGPT được ra mắt vào năm 2022 đã làm bùng nổ một nhu cầu công việc mới đó là các kỹ sư lời nhắc - hay được gọi các promts engineer. Họ có thể diễn đạt câu hỏi hay những yêu cầu một cách phù hợp để cho các mô hình ngôn ngữ hoặc là các công cụ tạo hình ảnh, nội dung đa phương tiện để có thể hiểu được và đưa ra kết quả tốt nhất - thậm chí là vượt qua những giới hạn của các công cụ AI này.

Với xu hướng người người, nhà nhà dùng AI, đặc biệt là những công ty, các tổ chức lớn và thậm chí là các công ty công nghệ cũng đang tìm đến AI tạo sinh và nhiều người cho rằng, trong tương lai các kỹ sư lời nhắc này chính là vua nghề mới ở trong tương lai và thay thế cho vị trí hiện tại của các lập trình viên. Điều này cũng càng được khẳng định hơn khi một số báo cáo cho thấy được mức lương cao ngất đến hàng trăm nghìn USD mỗi năm cũng đang được sử dụng để mời chào những kỹ sư lời nhắc.

Tụy nhiên, trong một nghiên cứu mới đây cho thấy hóa ra công việc này lại có thể phải đối diện với cảnh “sớm nở, chóng tàn” bởi vì chính loại công nghệ đã giúp cho họ trở nên nổi tiếng - những mô hình AI. 

Kỹ sư tạo lời nhắc cho chatbot AI đối diện với cảnh “sớm nở, chóng tàn”. (Ảnh minh họa)
Kỹ sư tạo lời nhắc cho chatbot AI đối diện với cảnh “sớm nở, chóng tàn”. (Ảnh minh họa)

Tăng cường hiệu suất cho những mô hình AI

Ở trong nghiên cứu của mình, Rick Battle và Teja Gollapudi - đây là 2 kỹ sư tại công ty phần mềm đám mây VMware nhận thấy được hiệu suất của các mô hình ngôn ngữ lớn biến động bất thường theo những lời nhắc kỳ quặc. Ví dụ như các mô hình được yêu cầu giải thích từng bước hành động của mình - đây là một kỹ thuật được gọi là chain-of-thought và nó sẽ cải thiện được hiệu suất đối với các câu hỏi toán và logic. Và thậm chí, một số lời nhắc tích cực như điều này thú vị đấy hoặc là bạn thông minh như ChatGPT đôi khi cũng sẽ cải thiện hiệu suất.

Cũng từ đó, 2 kỹ sư này đã quyết định thử nghiệm một cách hệ thống các kỹ thuật lời nhắc khác nhau để đánh giá những tác động của nó đến hiệu suất của những mô hình ngôn ngữ trong việc giải các câu hỏi toán học của cấp trung học. Và phép thử của họ được thực hiện với sự kết hợp 60 kiểu lời nhắc cho 3 mô hình AI mã nguồn mở khác nhau. Điều đáng kinh ngạc đó là kết quả lại không nhất quán. Các nhà nghiên cứu cho hay: “Chỉ có duy nhất một xu hướng thực sự là không có xu hướng nào”. 

(Ảnh minh họa)
(Ảnh minh họa)

Và một giải pháp thay thế cho phương pháp lời nhắc thử sai này chính là yêu cầu chính của các mô hình AI đưa ra lời nhắc được tối ưu dành cho riêng nó. Khi dùng thử những công cụ này thì Battle cùng các đồng nghiệp của mình đã nhận ra rằng, trong hầu hết các trường hợp, những lời nhắc được tạo ra mang đến hiệu suất tốt hơn hầu hết cách làm thường thấy của con người. Hơn thế thì cách làm này còn mang đến kết quả nhanh hơn, chỉ mất thời gian vài giờ thay vì vài ngày thử sai.

Battle cho biết: “Có nhiều người tìm cách nhân hóa những công cụ này bởi chúng nói tiếng Anh hoàn toàn không đúng. Chúng không nói tiếng Anh, chúng làm Toán”. Chính vì thế, việc tối ưu hóa các lời nhắc sẽ phải dựa trên bản chất thật sự của những mô hình AI - đây chính là các mô hình. 

Vậy nên, từ kết quả nghiên cứu của nhóm mình, Battle cho rằng, con người không nên tìm cách tối ưu hóa các lời nhắc mô hình AI thủ công nữa mà thay vào đó là chỉ cần phát triển một tiêu chí đánh giá để cho hệ thống tự xác định xem lời nhắc nào tốt hơn lời nhắc nào và cuối cùng để cho mô hình tự tối ưu hóa.

Sử dụng lời nhắc tự động giúp cho hình ảnh đẹp hơn

Không chỉ giải toán hay những bài logic, các lời nhắc tự động cũng giúp tạo sinh nên những hình ảnh đẹp hơn. Thời gian gần đây, một nhóm nghiên cứu khác phòng thí nghiệm của Intel, dưới sự lãnh đạo của Vasudev Lal cũng đã bắt đầu một nhiệm vụ tương tự để có thể tối ưu hóa lời nhắc cho Stable Diffusion - đây là một công cụ AI tạo hình ảnh nổi tiếng.

Và nhóm của Lal cũng đã tạo ra được một công cụ gọi đó là Neuro Prompts khi dùng một lời nhắc đầu vào đơn giản như cậu bé trên một con ngựa và đã tự động tăng cường nó để có thể tạo ra một bức ảnh đẹp hơn.

Để có thể làm điều này, họ cũng bắt đầu với một loạt lời nhắc bởi những chuyên gia lời nhắc con người tạo ra. Sau đó thì họ đã huấn luyện một mô hình ngôn ngữ để có thể biến đổi các lời nhắc đơn giản thành các chuyên gia lời nhắc. Cũng từ đó, họ đã sử dụng kỹ thuật học tăng cường để tối ưu hóa các lời nhắc này nhằm mục đích tạo ra được những hình ảnh đẹp mắt, khi được đánh giá bởi một mô hình học máy khác tại PickScore - đây chính là một công cụ đánh giá hình ảnh mới được phát triển thời gian gần đây.

Bên trái là hình ảnh ban đầu được Stable Diffusion tạo ra bằng lời nhắc thông thường còn bên phải là hình ảnh dược tạo ra bởi NeuroPrompts. (Nguồn ảnh: Nhịp sống thị trường)
Bên trái là hình ảnh ban đầu được Stable Diffusion tạo ra bằng lời nhắc thông thường còn bên phải là hình ảnh dược tạo ra bởi NeuroPrompts. (Nguồn ảnh: Nhịp sống thị trường)

Và lại một lần nữa, các lời nhắc tự động do mô hình AI tạo ra cũng thực hiện tốt hơn các chuyên gia lời nhắc được sử dụng làm điểm xuất phát ban đầu, ít nhất là theo điểm số của  PickScore. Lal cũng không tỏ ra bất ngờ về điều này. Ông nói rằng: “Con người chỉ làm điều đó bằng thử và sai. Tuy nhiên, giờ chúng tôi có một vòng lặp hoàn chỉnh và được tự động hóa hoàn toàn, được hoàn thành với học tăng cường. Đó chính là lý do vì sao chúng tôi có thể vượt trội hơn các kỹ sư lời nhắc con người”. 

Lal cũng tin rằng các mô hình AI tạo sinh phát triển, việc phụ thuộc vào những lời nhắc kỳ quặc sẽ biến mất. Ông nói: “Tôi nghĩ điều quan trọng đó chính là những loại tối ưu hóa này phải được nghiên cứu và cuối cùng, chúng thực sự được tích hợp vào chính mô hình cơ sở để cho bạn không thực sự cần một bước kỹ thuật nhắc nhở phức tạp”. 

Các kỹ sư lời nhắc vẫn “tồn tại” theo một cách nào đó

Dù vậy thì ngay cả khi các lời nhắc được tự động hóa, các kỹ sư lời nhắc vẫn sẽ tồn tại tuy nhiên có thể dưới một cái tên khác đó chính là nhận định của Tim Cramer - Phó chủ tịch kỹ thuật phần mềm của Red Hat. Việc điều chỉnh những mô hình AI chính là một nỗ lực phức tạp bao gồm nhiều giai đoạn và sẽ tiếp tục đòi hỏi con người tham gia trong tương lai gần.

Ông Cramer nói rằng: “Tôi nghĩ các kỹ sư lời nhắc vẫn sẽ cần đến trong thời gian sắp tới, tương tự như các nhà khoa học dữ liệu. Và nhiệm vụ của họ không chỉ là đặt ra câu hỏi cho các LLM (mô hình ngôn ngữ lớn) mà còn đảm bảo câu trả lời một cách hoàn chỉnh. Cũng có rất nhiều việc cần phải có các kỹ sư thực sự mới có thể làm được”. 

Ông Austin Henley - cựu kỹ sư Microsoft về dự án Copilot nói rằng: “Rất dễ để tạo ra một nguyên mẫu. Cái khó chính là sản xuất ra một nguyên mẫu mà các kỹ sư đang xây dựng nên. Tuy nhiên, nếu muốn tạo ra một sản phẩm thương mại từ nguyên mẫu đó thì các công ty cần đảm bảo được độ tin cậy, an toàn cũng như quyền riêng tư, khả năng tuân thủ - đây chính là các công việc mà máy móc hay phần mềm khó có thể thay thế được con người. 

Các kỹ sư lời nhắc vẫn “tồn tại” theo một cách nào đó. (Ảnh minh họa)
Các kỹ sư lời nhắc vẫn “tồn tại” theo một cách nào đó. (Ảnh minh họa)

Để có thể hoàn thành được các nhiệm vụ này, nhiều công ty lớn đang đặt ra chức danh mới cho công việc đó là Người Vận hành Mô hình Ngôn ngữ Lớn (Large Language Model Operations hay LLMOps). Lúc này, nhiệm vụ của họ không chỉ thành thạo những lời nhắc mà còn thực hiện các nhiệm vụ cần thiết để triển khai các sản phẩm. Hay thậm chí, với tốc độ biến đổi nhanh như hiện tại thì chức năng lẫn nhiệm vụ của họ sẽ tiếp tục biến đổi trong tương lai dù cho bản chất vẫn là người tương tác với mô hình AI đó.

Ông Cramer nói rằng, không biết dữ liệu chúng ta kết hợp nó với một loại công việc hoặc là vai trò công việc khác hay không, tuy nhiên ông không nghĩ rằng những công việc này sẽ sớm biến mất. Và hoàn cảnh hiện tại đang trong quá trình điên rồ. Mọi thứ thay đổi quá nhiều thì chúng ta không thể nào hình dung được mọi thứ trong vài tháng nữa./.