Thứ Sáu, ngày 22 tháng 11 năm 2024

Công cụ Sora - bước tiến lớn đi kèm lo ngại về nguy cơ của AI

Ngày phát hành: 19/02/2024 Lượt xem 528

Câu lệnh: Một người phụ nữ đi dạo trên đường phố Tokyo đầy ánh sáng neon ấm áp. Cô ấy mặc một chiếc áo khoác da màu đen, một chiếc váy dài màu đỏ, đi đôi bốt màu đen và cầm một chiếc túi xách màu đen. Cô gái đeo kính râm và dùng son môi màu đỏ. Dáng đi tự tin và thoải mái. Con phố ẩm ướt và phản chiếu, tạo ra hiệu ứng gương với ánh sáng đầy màu sắc. Nhiều người đi bộ xuất hiện trên đường. Video: OpenAI


OpenAI - công ty “cha đẻ” của chatbot ChatGPT, có trụ sở tại San Francisco (Mỹ) - ngày 15/2/2024 đã công bố thêm một bước tiến lớn trong lĩnh vực trí tuệ nhân tạo (AI) tổng quát với một công cụ tạo ra các video ngắn từ những chỉ dẫn bằng văn bản. Công cụ mới có tên gọi là Sora - đang được thử nghiệm, có khả năng tạo ra những cảnh quay thực tế và sáng tạo từ những chỉ dẫn bằng văn bản. Mô hình này cho phép người dùng sáng tạo những video sinh động lên đến 1 phút dựa trên những gợi ý mà họ viết ra.

Trên mạng xã hội X, Giám đốc điều hành OpenAI Sam Altman thông báo trong giai đoạn thử nghiệm, công ty chỉ cho phép một số nhà sáng tạo nội dung sử dụng Sora. OpenAI cảnh báo mô hình hiện tại còn nhiều thiếu sót như nhầm lẫn bên trái và bên phải hoặc không duy trì được ảnh liên tục trong suốt thời lượng của video. OpenAI nhấn mạnh tính an toàn của sản phẩm và Sora sẽ trải qua thử nghiệm của các chuyên gia.  

Sora trong tiếng Nhật có nghĩa là “bầu trời”. Nhóm phát triển công nghệ đã chọn cái tên này vì nó “gợi lên ý tưởng về tiềm năng sáng tạo vô hạn”. Theo nhận định của giới chuyên môn, sự ra mắt của Sora đã khiến giới công nghệ kinh ngạc. Sora hoạt động tương tự như công cụ AI tạo hình ảnh DALL-E của OpenAI. Người dùng nhập câu lệnh về hoạt cảnh mong muốn và Sora sẽ trả về một video clip có độ phân giải cao. Sora có khả năng sáng tạo hoạt cảnh gồm nhiều nhân vật, chuyển động với bối cảnh chi tiết. Sora cũng có thể tạo các video clip lấy cảm hứng từ hình ảnh tĩnh và mở rộng các video hiện có hoặc điền vào các khung hình còn thiếu.

Mặc dù Sora chưa được phát hành rộng rãi mà mới chỉ được lưu hành trong một nhóm những người thử nghiệm an toàn nhưng những video mà OpenAI đưa ra khiến người xem phải kinh ngạc về mức độ chân thực cũng như sức mạnh của phần mềm tạo video. Với Sora, OpenAI đang tìm cách cạnh tranh với các công cụ AI tạo video từ các công ty như Meta và Google. Hiện các công ty Meta, Google và Runway AI cũng đang nghiên cứu và phát triển công nghệ AI tạo video từ văn bản và đã công bố một số mô hình tương tự.

Tuy nhiên, sự ra đời của Sora cũng làm dấy lên những lo lắng về nội dung ảo và thông tin giả mạo. Không thể phủ nhận rằng công nghệ này có thể đóng vai trò trợ thủ đắc lực cho công việc của các nhà làm phim dày dạn kinh nghiệm, đồng thời thay thế hoàn toàn các công nghệ kỹ thuật số ít ưu việt hơn. Thế nhưng bên cạnh đó, Sora cũng có thể trở thành một công cụ nhanh chóng và ít tốn kém để tạo ra thông tin sai lệch trực tuyến, khiến việc xác định đâu là sự thật trên Internet càng trở nên khó khăn hơn.

Rõ ràng là với Sora, OpenAI không chỉ thúc đẩy cuộc đua sáng tạo nội dung dựa trên trí tuệ nhân tạo mà còn đặt ra nhiều thách thức mới đối với quản trị xã hội. Các nhà phân tích cho rằng, Sora có thể khiến những định chế như ngân hàng sẽ phải phát triển công cụ AI để phòng vệ. Trong lĩnh vực như sản xuất phim và truyền thông, Sora có thể “thay đổi cuộc chơi” khi cắt giảm đáng kể chi phí sản xuất và nhân công, khiến nhiều lao động bị mất việc làm. Về những về tác động xã hội, nhiều ý kiến quan ngại rằng công cụ này có thể ảnh hưởng đến các cuộc bầu cử trên thế giới trong năm 2024 khi tạo ra các nội dung giả, quảng bá hoặc tuyên truyền sai sự thật.

Vấn đề sử dụng AI can thiệp vào các cuộc bầu cử đã trở thành mối lo ngại kể từ khi OpenAI phát hành hai sản phẩm bao gồm ChatGPT có thể tạo văn bản giống như con người và công nghệ DALL-E tạo ra “deepfake” (kỹ thuật sử dụng AI để tạo ra âm thanh, hình ảnh và video giả mạo). OpenAI hôm 15/1/2024 cho biết sẽ giải quyết những lo ngại rằng công nghệ của công ty sẽ bị lạm dụng để can thiệp vào các cuộc bầu cử.

Tại Hội nghị An ninh Munich (diễn ra từ ngày 16-18/2/2024 tại thành phố Munich, miền nam nước Đức; có sự tham gia của nhiều tên tuổi lớn như Meta, X, Google, OpenAI, Microsoft, TikTok, Snap, Adobe, LinkedIn, Amazon và IBM...), một nhóm gồm 20 công ty công nghệ hàng đầu thế giới đã ký kết một hiệp định nhằm ngăn chặn các nội dung giả mạo về chính trị do AI tạo ra. Theo hiệp định, các bên liên quan thỏa thuận sẽ đưa ra giải pháp để phát hiện, gắn nhãn, kiểm soát hình ảnh, video và âm thanh do AI tạo ra nhằm đánh lừa cử tri. Nội dung do AI tạo ra có thể được chèn watermark (hình mờ - là một ký hiệu, đoạn text, logo hay số điện thoại được làm mờ đi và chèn vào các hình ảnh hay video nhằm đánh dấu chủ quyền đây là sản phẩm của người tạo, tránh việc ăn cắp hoặc sao chép) hoặc gắn thẻ ngay từ dữ liệu nguồn, mặc dù các công ty công nghệ thừa nhận rằng “tất cả các giải pháp như vậy đều có những hạn chế”. Hiện Meta, Google và OpenAI đã nhất trí sử dụng một tiêu chuẩn watermark chung cho những hình ảnh do các ứng dụng AI tạo ra, chẳng hạn như ChatGPT của OpenAI, Copilot của Microsoft hoặc Gemini của Google (trước đây là Bard).

Hiệp định trên được công bố trong bối cảnh quan ngại về nguy cơ AI can thiệp các cuộc bầu cử đang ngày càng gia tăng, khi hơn 30% dân số thế giới sẽ đi bỏ phiếu trong năm 2024. Các công ty công nghệ đang cùng nhau đối mặt thách thức, với hy vọng rằng sự hợp tác này sẽ đóng góp vào việc giữ gìn tính minh bạch và công bằng trong quá trình bầu cử toàn cầu. Ông Nick Clegg - Chủ tịch phụ trách các vấn đề toàn cầu của Meta - cho rằng nỗ lực chống tin giả liên quan bầu cử cần có sự đồng lòng chung tay của tất cả các bên, bao gồm cả các nhà phát triển AI cũng như những người dùng thông thường./.

Minh Trà (tổng hợp)

Tin Liên quan

Góp ý về nội dung bài viết