Ứng dụng công nghệ AI trong hoạt động sản xuất tin tức báo chí
Một số công nghệ sản xuất tin tức, ảnh và video tự động
Tại hội thảo "Ứng dụng Công nghệ trong quản trị tòa soạn số" vừa diễn ra, TS. Trần Tiến Công - Khoa Công nghệ Thông tin, Học viện Công nghệ Bưu chính Viễn thông chia sẻ: "Sử dụng công nghệ trí tuệ nhân tạo để tự động sản xuất nội dung với độ chính xác cao và đa dạng hóa các mẫu tin tức và video khác nhau, giúp tăng tính đa dạng và chất lượng của nội dung. Phần mềm có thể tự động sản xuất nội dung liên tục và nhanh chóng, đáp ứng nhu cầu người dùng và tối ưu hóa thời gian phát sóng tin tức và video. Với tính năng tự động sản xuất nội dung, hệ thống có thể tạo ra nội dung liên tục và đa dạng hơn, giúp tăng tính tương tác và tăng doanh số cho các doanh nghiệp, đặc biệt là trong lĩnh vực tiếp thị và quảng cáo".
Nghiên cứu về các công nghệ sinh tin tức là một lĩnh vực nổi bật trong lĩnh vực khoa học dữ liệu và trí tuệ nhân tạo. Các công nghệ này liên quan đến việc tự động tạo nội dung tin tức dựa trên các nguồn dữ liệu có sẵn. Một số công nghệ sinh tin tức phổ biến bao gồm: Học máy và AI: Đây là những công nghệ quan trọng trong việc sinh tin tức tự động. Các mô hình học máy và trí tuệ nhân tạo có thể học từ dữ liệu đã có để tạo ra các bài viết tự động với chất lượng khá tốt.
Tiếp theo là Xử lý ngôn ngữ tự nhiên (NLP): NLP là lĩnh vực nghiên cứu liên quan đến việc hiểu và tạo ra ngôn ngữ tự nhiên bởi máy tính. Công nghệ NLP đóng vai trò quan trọng trong việc hiểu cú pháp, ý nghĩa và cấu trúc ngôn ngữ để tạo ra các đoạn văn bản tự động.
Công nghệ Xử lý ngôn ngữ tự nhiên (NPL) tạo ra các đoạn văn bản tự động. |
Các công nghệ khai thác dữ liệu và web cho phép tự động thu thập thông tin từ nguồn dữ liệu trên Internet, bao gồm các trang tin tức, blog và diễn đàn. Điều này giúp cập nhật thông tin nhanh chóng và tự động hóa quá trình tạo tin tức.
Công nghệ tổng hợp tự động cho phép kết hợp thông tin từ nhiều nguồn khác nhau để tạo nội dung mới. Điều này giúp giảm thiểu sự trùng lặp thông tin và cung cấp góc nhìn đa dạng trong các bài viết tự động.
Trí tuệ nhân tạo đóng vai trò quan trọng trong việc xây dựng quy trình sinh tự động tin tức. Nghiên cứu giải pháp ứng dụng công nghệ trí tuệ nhân tạo tiên tiến trong lĩnh vực này đã đạt được nhiều thành tựu đáng kể. Sử dụng các mô hình học máy như mạng nơ-ron hồi quy (RNN), mạng nơ-ron hồi quy dài (LSTM), và mạng nơ-ron chuyển tiếp (Transformer) cho phép tạo ra văn bản tự động dựa trên dữ liệu huấn luyện có sẵn. Những mô hình này học từ dữ liệu tin tức hiện có và tự động tạo ra các bài viết mới với chất lượng tương đối cao.
Công nghệ sinh ảnh tự động là một lĩnh vực phát triển nổi bật trong ngành trí tuệ nhân tạo và xử lý ảnh. Nó cho phép máy tính tự động tạo ra ảnh hoặc chỉnh sửa ảnh một cách tự động dựa trên các thuật toán và mô hình học máy. Công nghệ này đã tiến bộ đáng kể nhờ vào sự phát triển mạnh mẽ của trí tuệ nhân tạo và các thuật toán học máy tiên tiến.
Công nghệ sinh video tự động là một lĩnh vực trong lĩnh vực trí tuệ nhân tạo và xử lý video, cho phép máy tính tự động tạo video hoặc chỉnh sửa video dựa trên các thuật toán và mô hình học máy. Quá trình này sử dụng các mô hình học máy để học từ dữ liệu video có sẵn và tạo ra video tự động dựa trên đó. DeepFake là một công nghệ trí tuệ nhân tạo tiên tiến cho phép tạo ra video giả mạo bằng cách ghép mặt của một người vào video khác. Công nghệ này sử dụng mạng nơ-ron học sâu để học cách tái tạo khuôn mặt và miêu tả giọng nói của người trong video nguồn vào video đích. DeepFake đã gây ra nhiều quan ngại về việc lạm dụng và lan truyền thông tin giả mạo.
Minh họa công nghệ DeepFake (Bên trái là ảnh thật) sinh video giả mạo diễn viên Tom Cruise. |
Giải pháp ứng dụng công nghệ trí tuệ nhân tạo tiên tiến để xây dựng quá trình sản xuất tự động tin tức
TS. Trần Tiến Công cũng đưa ra một số giải pháp ứng dụng công nghệ trí tuệ nhân tạo tiên tiến để xây dựng quá trình sinh tự động tin tức được xây dựng trên nền web. Phần mềm này nhận vào từ khóa và sinh ra một bài báo đầy đủ tiêu đề, nội dung, hình ảnh, chú thích của ảnh và video bản tin.
Phần mềm này bao gồm những mô-đun chính như sau:
Thứ nhất là mô đun tạo chữ từ keyword (từ khóa). Theo đó, sau khi nhập từ khóa, hệ thống gọi API sinh text để tạo bài báo và chú thích. Mô đun này còn bao gồm chức năng tạo chú thích ảnh từ từ khóa. Công nghệ sử dụng trong mô đun này là những mô hình ngôn ngữ lớn (LLM) như GPT của OpenAI.
Thứ hai là mô đun tạo ảnh từ từ khóa. Sau khi nhập từ khóa, hệ thống gọi API để tạo ảnh. Hệ thống cần sinh ra tối thiểu 3 ảnh với kích thước 256x256px với chủ đề được nhập ở đầu vào. Công nghệ được sử dụng trong mô đun này là công nghệ tạo sinh ảnh dựa vào từ khóa sử dụng mô hình khuếch tán.
Thứ ba là mô đun tạo video từ văn bản. Sau khi hoàn tất sinh ảnh và text thì hệ thống gọi API đưa nội dung bài báo vào video. Nội dung bài báo được tạo ở mô đun Tạo bài báo từ keyword. Video có avatar AI nói những gì có trong bài báo bằng tiếng Việt thành 1 bản tin sử dụng công nghệ lipsync. Ngoài ra, một mô đun chỉnh sửa khuôn mặt dựa vào công nghệ Deepfake cho phép thay avatar AI bởi bất cứ khuôn mặt nào chỉ bằng 01 ảnh chụp.