AI sẽ tạo một bản sao kỹ thuật số của YouTuber. Nhân vật thật sau đó chỉ cần nhập văn bản để AI nói, thay vì phải quay và dựng video.
Dự án đang được thử nghiệm bởi Hour One, một công ty chuyên về AI là Hour One, kết hợp cùng YouTuber có tên Taryn Southern. Southern nổi tiếng với các video ca nhạc, kể chuyện truyền cảm hứng. Công việc của cô sau này có thể sẽ được thay thế bằng “bản sao” trí tuệ nhân tạo của chính mình, với khả năng tạo video số lượng lớn một cách tự động.
Để tạo ra một bản sao kỹ thuật số của mình, Southern cần nạp dữ liệu để AI học. Cô được đưa đến trước một studio để ghi hình trên phông xanh,quay các góc độ của khuôn mặt, đồng thời được yêu cầu hát và nói một số câu.
Theo PetaPixel, toàn bộ quá trình này mất khoảng 7 phút. Sau đó, người dùng chỉ cần gửi các bài nói dưới dạng văn bản cho hệ thống. AI sẽ tự động tái hiện dưới dạng video với hình ảnh của Southern đang nói hoặc hát. YouTuber này sẽ không cần phải ghi hình hoặc ghi âm từng video, mà vẫn đảm bảo sản xuất hàng trăm video trong vài phút.
Theo Hour One, đây có thể là tương lai của lĩnh vực nội dung số. Dẫn lời dự đoán của chuyên gia, công ty này cho rằng trong khoảng 5 – 7 năm tới, 90% nội dung video sẽ được tạo ra bằng máy tính thay vì máy quay. Sau khi tạo ra một bản sao kỹ thuật số, người dùng sẽ có thể làm vlog mà không cần máy ảnh hay micro.
Với các YouTuber, Hour One cho rằng họ có thể giảm tối đa thời gian và chi phí cho các video, bởi sẽ không cần phải tốn thời gian cho việc làm đẹp trước ống kính, hoặc quay đi quay lại nhiều lần. Ngoài ra, AI có thể hỗ trợ chuyển đổi ra nhiều ngôn ngữ, giúp video phổ biến khắp thế giới.
Tuy nhiên, công ty này thừa nhận hướng phát triển trên chỉ đạt hiệu quả cao với một số dạng nội dung trên YouTube, chẳng hạn tin tức hoặc video kể chuyện, thuyết trình…, chưa thể ứng dụng trên các nội dung, như kịch, video hài… Biểu cảm khuôn mặt cũng chưa đa dạng nhưng sẽ được cải thiện trong thời gian tới.
Tuy nhiên, việc này làm dấy lên lo ngại về việc công nghệ có thể tạo ra các bản sao kỹ thuật số của con người và thực hiện hành vi mạo danh. Theo các chuyên gia, hệ thống vẫn cần dữ liệu chính xác từ con người. Các YouTuber như Taryn Southern cần phải cung cấp hình ảnh, giọng nói đúng yêu cầu, hệ thống mới có thể tạo ra các bản sao của họ. So sánh với “deepfake”, công nghệ của Hour One được khẳng định là tạo nội dung nguyên bản như đang được nói bởi người thật, thay vì lấy khuôn mặt của mục tiêu và “phủ” lên các cảnh quay có sẵn.
Hiện công cụ này vẫn đang trong giai đoạn phát triển, chưa được triển khai thương mại chính thức.
Lưu Quý