OpenAI vừa chính thức nâng cấp công cụ tạo ảnh với phiên bản GPT Image 1.5 — một bản cập nhật mang tính “lột xác” về độ chính xác, tốc độ và khả năng làm việc theo hướng dẫn. So với thế hệ trước, mô hình mới này tạo ảnh nhanh gấp bốn lần, bám sát yêu cầu hơn và đặc biệt mạnh trong việc chỉnh sửa chi tiết.

Điểm đáng giá nhất của GPT Image 1.5 nằm ở khả năng duy trì tính nhất quán khi chỉnh sửa — điều mà hầu hết AI tạo ảnh hiện nay còn làm rất kém. Người dùng giờ đây có thể tinh chỉnh biểu cảm khuôn mặt, ánh sáng, bố cục hay tông màu mà không khiến toàn bộ hình ảnh bị “vẽ lại” từ đầu. Khuôn mặt nhân vật vẫn giữ được độ giống, ánh sáng và phong cách hình ảnh không bị lệch giữa các lần chỉnh sửa. Đây là tính năng mà trước đó chỉ một vài công cụ cao cấp như Nano Banana Pro của Google mới làm được tương đối ổn.
Với những ai làm thiết kế, marketing hay sáng tạo nội dung, đây là một thay đổi cực kỳ quan trọng. Trước đây, mỗi lần yêu cầu AI chỉnh một chi tiết nhỏ, bạn có thể nhận về một bức ảnh hoàn toàn khác. Còn bây giờ, GPT Image 1.5 cho phép bạn “chạm” vào từng yếu tố một cách có kiểm soát — giống như đang dùng Photoshop, nhưng bằng câu lệnh.
OpenAI cũng đã tích hợp tính năng tạo ảnh này trực tiếp vào ChatGPT, thông qua một khu vực riêng trên thanh công cụ. Điều này biến ChatGPT thành một studio sáng tạo thu nhỏ — nơi người dùng có thể xem, chỉnh sửa, thử prompt mới và áp dụng các bộ lọc dựng sẵn một cách trực quan. Theo Fidji Simo, Giám đốc mảng ứng dụng của OpenAI, giao diện mới giúp người dùng biến ý tưởng trong đầu thành hình ảnh thực tế nhanh hơn và chính xác hơn bao giờ hết.
Không dừng lại ở hình ảnh, OpenAI còn đang mở rộng trải nghiệm ChatGPT theo hướng trực quan hóa mạnh mẽ hơn. Trong tương lai gần, các truy vấn tìm kiếm sẽ đi kèm nhiều hình ảnh có nguồn rõ ràng — đặc biệt hữu ích cho các tác vụ như đổi đơn vị đo, xem tỷ số thể thao hoặc tra cứu thông tin. Khi hình ảnh truyền tải tốt hơn văn bản, ChatGPT sẽ ưu tiên hiển thị chúng để giúp người dùng hiểu và ra quyết định nhanh hơn.
Tóm lại, GPT Image 1.5 không chỉ là một bản nâng cấp kỹ thuật, mà là một bước tiến đưa ChatGPT trở thành nền tảng sáng tạo đa phương tiện thực thụ, nơi người dùng vừa có thể suy nghĩ, vừa có thể nhìn thấy và định hình ý tưởng của mình theo cách trực quan nhất.