
Giờ đây ChatGPT đã có thể tạo chữ trong ảnh chính xác hơn - Ảnh: REUTERS
Trước đây, các công cụ AI tạo ảnh dù rất mạnh về hình ảnh nhưng lại gặp khó khăn khi xử lý chữ. Những lỗi như sai chính tả, biến dạng hoặc khó đọc vẫn xuất hiện khá phổ biến. Tuy nhiên với các cải tiến gần đây của ChatGPT, đặc biệt là khả năng hiểu yêu cầu tốt hơn và kiểm soát chi tiết khi tạo ảnh, vấn đề này đang dần được giải quyết.
Vì sao AI tạo ảnh vẫn gặp hạn chế với chữ?
Một trong những lý do cốt lõi khiến AI tạo ảnh gặp khó với chữ nằm ở cách các mô hình này hoạt động. Thay vì “đọc” và hiểu chữ như con người, chúng xử lý chữ như một phần của hình ảnh, tương tự màu sắc hay đường nét. Điều này khiến các ký tự dễ bị biến dạng, sai chính tả hoặc thậm chí trở thành những chuỗi vô nghĩa.
Trong lĩnh vực thị giác máy tính, các mô hình tạo ảnh được huấn luyện để tái tạo hình ảnh dựa trên xác suất và các mẫu dữ liệu, chứ không nhằm đảm bảo độ chính xác tuyệt đối của từng ký tự. Trong khi đó chữ lại là yếu tố đòi hỏi độ chính xác gần như tuyệt đối, chỉ cần sai một ký tự cũng có thể làm thay đổi hoàn toàn ý nghĩa.
Ngoài ra dữ liệu huấn luyện cũng là một rào cản. Phần lớn hình ảnh trong các bộ dữ liệu phổ biến không tập trung vào chữ, hoặc chữ xuất hiện với kích thước nhỏ, mờ và không rõ ràng. Điều này khiến AI không “học” đủ tốt cách hiển thị văn bản trong ảnh.
Chính những yếu tố này đã khiến việc tạo chữ trở thành điểm yếu kéo dài của AI tạo ảnh, bất chấp khả năng tái hiện hình ảnh ngày càng chân thực.
ChatGPT cải thiện khả năng tạo chữ trong ảnh
Việc OpenAI công bố các cải tiến mới trên ChatGPT cho thấy hãng đang tập trung khắc phục hạn chế về chữ trong ảnh, một trong những điểm yếu tồn tại lâu nay của AI tạo ảnh. Nếu trước đây các ký tự thường bị méo, sai hoặc khó đọc, thì nay kết quả đầu ra đã trở nên rõ ràng và dễ nhận diện hơn, đặc biệt trong các nội dung như poster, banner hay hình minh họa có chứa chữ.
Mô hình mới có khả năng bám sát yêu cầu của người dùng tốt hơn, qua đó cải thiện độ chính xác của nội dung trong ảnh. Việc kiểm soát chi tiết được tăng cường giúp hạn chế lỗi sai và đảm bảo các yếu tố trong ảnh được thể hiện đúng theo mô tả.
Những thay đổi này đặc biệt hữu ích trong các tình huống sử dụng thực tế. Khi người dùng cần tạo hình ảnh có nội dung cụ thể như tiêu đề, khẩu hiệu hoặc thông tin minh họa, kết quả đầu ra có thể đáp ứng yêu cầu rõ ràng hơn, thay vì chỉ mang tính minh họa như trước.
Những cải thiện này không chỉ mang ý nghĩa kỹ thuật, mà còn mở rộng đáng kể phạm vi ứng dụng thực tế. Từ việc tạo nội dung mạng xã hội, thiết kế hình ảnh đơn giản đến minh họa thông tin, người dùng giờ đây có thể kỳ vọng vào các sản phẩm do AI tạo ra không chỉ đẹp về hình mà còn rõ ràng về nội dung chữ.

ChatGPT cải tiến khả năng tạo ảnh, giúp chữ hiển thị rõ hơn, giảm lỗi méo và sai chính tả trong poster, banner và hình minh họa.



