ChatGPT thêm khả năng tạo ảnh 'như thật'

ChatGPT thêm khả năng tạo ảnh 'như thật'

27-03-2025, 2:37 pm
30

Tạo ảnh ngay trong ChatGPT – đơn giản và mạnh mẽ hơn bao giờ hết

Ngày 26/3, OpenAI chính thức công bố tính năng Images in ChatGPT, cho phép người dùng tạo ảnh trực tiếp trong chatbot mà không cần qua bước trung gian như trước. Công cụ này được xây dựng dựa trên mô hình GPT-4o – nền tảng đa phương thức mạnh mẽ nhất của OpenAI hiện tại.

Tính năng mới sẽ được triển khai cho cả người dùng gói miễn phí lẫn các gói Plus, Pro và Team. Trước đây, người dùng phải sử dụng mô hình DALL·E và bị giới hạn ba ảnh mỗi ngày, thì giờ đây họ có thể tạo ảnh ngay trong khung chat một cách tiện lợi và tự nhiên hơn.

Người dùng ấn tượng với chất lượng ảnh "như thật"

Ngay sau khi ra mắt, tính năng này đã gây ấn tượng mạnh trong cộng đồng. Nhiều người dùng mạng xã hội bất ngờ trước độ chân thực của hình ảnh:

  • “Hình ảnh như thật khiến tôi bất ngờ. Nếu không có ghi chú là ảnh AI, tôi sẽ không nhận ra.” – tài khoản Facebook Hoàng Vy
  • “Sắp tới, hình ảnh trên mạng chưa chắc đã là thật nữa.” – tài khoản Công Tâm
  • “Nhà thiết kế và chỉnh sửa ảnh nên nhanh chóng học dùng AI, nếu không muốn bị thay thế.” – tài khoản Thế Hà

Ảnh

Ảnh "Nhà khoa học Isaac Newton cầm lăng kính ở Công viên Quảng trường Washington" do ChatGPT tạo.

Tạo ảnh chính xác hơn nhờ công nghệ “Binding”

Theo ông Gabriel Goh – trưởng nhóm nghiên cứu tại OpenAI, tính năng mới sử dụng mô hình GPT-4o với cải tiến đáng kể về khả năng liên kết giữa các thuộc tính và đối tượng, gọi là Binding.

Ví dụ, nếu bạn yêu cầu tạo “ngôi sao màu xanh cạnh hình tam giác đỏ”, mô hình mới có thể hiểu và thể hiện chính xác cả hai yếu tố, thay vì nhầm lẫn như các mô hình cũ. GPT-4o có thể xử lý chính xác 15-20 đối tượng trong một hình mà không bị lẫn lộn.

Vượt trội trong hiển thị văn bản trong ảnh

Một điểm nổi bật khác là khả năng hiển thị văn bản trong hình ảnh – vốn là điểm yếu của nhiều công cụ tạo ảnh trước đây. Với phương pháp hồi quy tự động (autoregressive rendering), hình ảnh được xây dựng tuần tự từ trái qua phải, từ trên xuống dưới, giống như cách viết văn bản. Điều này giúp tạo văn bản mạch lạc, rõ ràng, không bị méo hay lỗi font như trước.

Ứng dụng phong phú và chất lượng ổn định

OpenAI đã trình diễn một loạt ứng dụng từ công cụ mới, bao gồm:

  • Sơ đồ khoa học thí nghiệm của Newton với màu sắc và nhãn chính xác
  • Truyện tranh nhiều khung với lời thoại nhất quán
  • Logo, nhãn dán và thực đơn nhà hàng với nền trong suốt

Theo OpenAI, dù mất nhiều thời gian hơn để kết xuất ảnh, nhưng chất lượng vượt trội là một "sự đánh đổi xứng đáng".

Ảnh sơ đồ thí nghiệm lăng kính Newton do ChatGPT tạo.

Ảnh sơ đồ thí nghiệm lăng kính Newton do ChatGPT tạo.

Tăng cường bảo vệ nội dung, chống lạm dụng AI

OpenAI khẳng định công cụ được trang bị các biện pháp bảo vệ mạnh, bao gồm:

  • Ngăn chặn hình ảnh giả mạo, khiêu dâm hoặc nội dung lừa đảo
  • Tích hợp siêu dữ liệu C2PA để xác định ảnh do AI tạo ra
  • Liên tục cập nhật cơ chế bảo vệ để đảm bảo an toàn và minh bạch

“Không có hệ thống nào hoàn hảo, nhưng chúng tôi đang làm hết sức để cải thiện.” – Jackie Shannon, phụ trách sản phẩm đa phương thức của ChatGPT chia sẻ.

Thẻ:
avatar
Nguyễn Hà My
Author
Tại
Maytinhcdc
Là một nhân viên của maytinhcdc.vn, đồng thời cũng là một người yêu thích công nghệ, mình mong muốn có thể cung cấp tới mọi người những thông tin hữu ích nhất
Bài viết liên quan