DragGAN – công cụ chỉnh ảnh mới bằng AI cho phép người dùng thao tác như 3D trên ảnh gốc 2D

Một nhóm các nhà khoa học máy tính từ Viện Tin học Max Planck, MIT, Google và Đại học Pennsylvania vừa phát triển một công cụ hình ảnh được hỗ trợ bởi AI mới cho phép người dùng thao tác theo kiểu 3D trên ảnh gốc bằng 2D vô cùng nhanh chóng và dễ dàng. Được đặt tên là DragGAN, công cụ này hứa hẹn sẽ đưa việc chỉnh sửa hình ảnh lên một tầm cao mới với sự giúp sức của trí tuệ nhân tạo. 

Thoạt nhìn, DragGAN trông cũng giống như các công cụ xử lý hình ảnh khác. Tuy nhiên, qua các video do nhóm sáng tạo đăng tải, ta có thể thấy những khả năng ấn tượng mà chưa ứng dụng nào trước đó đạt được. Cụ thể, nó cho phép người dùng thay đổi và chỉnh sửa chi tiết của hình ảnh gốc (vốn là bức ảnh tĩnh ở dạng 2D) vô cùng nhanh chóng bằng phương pháp kéo thả, và quá trình thao tác để thực hiện điều này được diễn ra như thể bức ảnh gốc ở dạng 3D. Các nhà nghiên cứu gọi đây là “hallucinated occluded content” (tạm dịch: ảo giác nội dung bị che khuất).

Các bức ảnh, về bản chất, là hai chiều (2D). Các công cụ chỉnh sửa ảnh trước đây cho phép làm mờ, tô màu hoặc vá các hình ảnh vào với nhau. Nhưng các chỉnh sửa kiểu này đều dựa trên nỗ lực của người dùng. Chính họ phải chỉ đạo việc chỉnh sửa màu sắc hoặc làm mờ các nếp nhăn. Một công cụ chỉnh sửa ảnh dựa trên AI như DragGAN được dạy để nhận dạng các tính năng thông qua việc phân tích hàng nghìn hoặc cả hàng triệu hình ảnh khác, vì vậy nó có thể suy ra những phần bị thiếu của ảnh trông như thế nào và thực hiện các thay đổi dựa trên điều đó, thông qua lời nhắc (prompt) của người dùng.

Ví dụ: trong video này, bạn có thể thay đổi cảm xúc trên gương mặt chủ thể cực kỳ dễ dàng, tất cả chỉ với một lần bấm và kéo chuột. Khuôn mặt của chủ thể cũng có thể được xoay qua hướng khác, để lộ phần đầu vốn không hề có trong bức ảnh gốc. Tương tự như vậy, ô tô, động vật hoặc phong cảnh cũng có thể được thay đổi đáng kể chỉ bằng một vài cú nhấp. 

Trí tuệ nhân tạo đang ngày càng chứng tỏ sức mạnh và sự hữu dụng của nó, đặc biệt là trong ngành sáng tạo. Với DragGAN, một lần nữa ta chứng kiến bước tiến vượt bậc của AI khi được áp dụng vào lĩnh vực chỉnh sửa hình ảnh. 

Theo: Tech Xplore
Ảnh: arXiv