أطلقت شركة OpenAI، تحديثا جديدا لمنصة صور ChatGPT، يهدف إلى تحسين دقة وموثوقية توليد الصور، وذلك في إطار مساعيها لتلبية احتياجات الشركات والعلامات التجارية التي تستخدم الذكاء الاصطناعي في تصميم التصورات البصرية.
ووفقا لـ OpenAI، سيتاح التحديث الجديد لجميع مستخدمي ChatGPT بالإضافة إلى واجهة البرمجة التطبيقية API تحت مسمى “GPT Image 1.5”، وأوضحت الشركة أن هذا التحديث مدعوم بنموذج GPT 5.2، الذي وجد العديد من المستخدمين الأوائل أنه يعد تحديثا قويا للاستخدامات التجارية.
وقالت فيدجي سيمو، الرئيس التنفيذي للتطبيقات في OpenAI، في منشور لها على Substack: “تجربة العديد من الناس الأولى مع ChatGPT تتضمن تحويل النصوص إلى صور، إنها طريقة سحرية لرؤية ما يمكن أن تفعله هذه التكنولوجيا، لكن واجهة الدردشة لم تكن مصممة لهذا الغرض أصلا، إنشاء وتحرير الصور هو نوع مختلف من المهام ويستحق مساحة مخصصة للرؤية البصرية”.
تحديثات موجهة للشركات مع تحسينات في التحرير الدقيق واتباع التعليمات
أحد أبرز التحديثات في ChatGPT Images هو تعزيز القدرة على تحرير الصور بشكل أكثر دقة، حتى عندما يتم توليد الصورة عبر منصة الدردشة وليس من خلال واجهة البرمجة، حيث تقدم نماذج توليد الصور مثل ChatGPT Images وجوجل Nano Banana وStable Diffusion ميزات تعديل الصور بناء على النصوص التي يكتبها المستخدم، بحيث يمكنه تحديد أجزاء معينة من الصورة لتغييرها، لكن هذه الميزات كانت أحيانا غير دقيقة في بعض الأحيان.
مع التحديث الجديد، قالت OpenAI إن النموذج أصبح يلتزم بشكل أفضل بما يريده المستخدم، “مع الحفاظ على عناصر مثل الإضاءة، التكوين، والمظاهر الشخصية للأشخاص ثابتة عبر المدخلات والمخرجات والتعديلات اللاحقة”.
كما يمكن للمستخدمين الآن إرشاد النموذج للقيام بمعظم أنواع تحرير الصور، مثل إضافة أو إزالة عناصر، الدمج، التبديل، وغيرها من التعديلات.
وأكدت OpenAI أن هذا النموذج “يتبع التعليمات بشكل أكثر موثوقية” مقارنة بالإصدارات السابقة، كما أصبح قادرا على تمثيل النصوص بشكل أفضل وتوليد حروف قابلة للقراءة، حتى عندما تكون النصوص أصغر أو أكثر كثافة.
كما تم تحسين النموذج لإنشاء وجوه أصغر وأكثر دقة في الصور التي تحتوي على مجموعات كبيرة من الأشخاص.
وأضافت OpenAI أن “هذه التحولات تعمل من أجل كل من المفاهيم البسيطة والمعقدة، وسهلة التجربة باستخدام الأنماط والأفكار المعدة مسبقا في ميزة ChatGPT Images الجديدة — دون الحاجة إلى كتابة النصوص”.
معركة مولدات الصور
يأتي تحديث OpenAI بعد إطلاق نموذج الصور المتميز من جوجل Nano Banana Pro، الذي لاقى إشادة واسعة من مجتمع المطورين.
تسعى OpenAI للمنافسة مع نماذج توليد الصور الأخرى التي تزداد تطورا بشكل مستمر، والتي تستهدف جذب المزيد من المستخدمين من الشركات.
ولا يقتصر الأمر على جوجل فقط، إذ أعلنت علي بابا في أغسطس عن نموذج Qwen-Image الذي يمكنه توليد نصوص قابلة للقراءة باللغتين الصينية والإنجليزية، كما أصدرت Black Forest Labs نموذج Flux.2 مفتوح المصدر والذي يقدم أيضا نموذج صور قوي.










