أطلقت شركة أوبن إيه آي نموذج ChatGPT Images 2.0 الجديد، وهو تحديث ثوري يضيف قدرات "التفكير" لتوليد صور أكثر دقة وواقعية من أي وقت مضى.
يمثل هذا الإطلاق حقبة جديدة في عالم الذكاء الاصطناعي التوليدي، حيث لم يعد الأمر يقتصر على مجرد تحويل النص إلى صورة، بل أصبح النموذج قادراً على فهم السياقات المعقدة والتفاصيل الدقيقة التي كان يصعب على النماذج السابقة استيعابها. ووفقاً لما تابعه فريق تيكبامين، فإن الإصدار الجديد يركز بشكل أساسي على جودة التكوين البصري والقدرة على تنفيذ التعليمات المطولة بدقة متناهية.
ما هي ميزات نموذج ChatGPT Images 2.0 الجديد؟
يأتي ChatGPT Images 2.0 بمجموعة واسعة من التحسينات التقنية التي تجعله يتفوق على منافسيه في سوق توليد الصور. إليك أبرز ما يميز هذا الإصدار:
- قدرات التفكير المنطقي: هو أول نموذج صور من أوبن إيه آي يمتلك قدرات "تفكير"، مما يسمح له بتحليل الطلبات المعقدة قبل البدء في الرسم.
- دقة التفاصيل: تحسين مذهل في الحفاظ على التفاصيل الدقيقة وتوزيع العناصر داخل الصورة بشكل متوازن.
- تخطيطات كثيفة: القدرة على معالجة المشاهد التي تحتوي على الكثير من الأشياء المرتبطة ببعضها البعض دون تداخل أو أخطاء منطقية.
- تحسين الذوق البصري: الصور الناتجة تبدو أقل "آلية" وأكثر قرباً لللمسات البشرية بفضل تحسين فهم التكوين الفني.
كيف يغير "التفكير" طريقة إنشاء الصور بالذكاء الاصطناعي؟
تعتبر ميزة التفكير (Thinking Capabilities) هي القفزة الأهم في ChatGPT Images 2.0. بدلاً من الاستجابة المباشرة للمطالبة النصية، يقوم النموذج بسلسلة من العمليات الذهنية الداخلية لفهم العلاقات المكانية بين الأشياء. هذا يعني أنه إذا طلبت صورة لشخص يمسك غرضاً معيناً في بيئة مزدحمة، سيفهم النموذج كيفية تفاعل الضوء والظلال والنسب بشكل أفضل.
كما أشار تقرير تيكبامين، فإن هذه القدرة تجعل النموذج يتفادى الأخطاء الشائعة مثل تشوه الأطراف أو عدم اتساق الخلفية مع الموضوع الأساسي. النتائج أصبحت الآن أكثر احترافية، مما يفتح آفاقاً جديدة للمصممين والمبدعين الذين يحتاجون إلى صور جاهزة للاستخدام التجاري بدقة عالية.
دعم اللغات غير اللاتينية وتحسين معالجة النصوص
لطالما واجهت نماذج الذكاء الاصطناعي صعوبة في كتابة النصوص داخل الصور، خاصة اللغات التي لا تعتمد على الأحرف اللاتينية. في إصدار ChatGPT Images 2.0، تم حل هذه المشكلة بشكل كبير عبر:
- تحسين مذهل في كتابة النصوص داخل الصور بدقة ووضوح.
- دعم فائق للغات مثل اليابانية، الكورية، والصينية.
- قدرة محسنة على رندرة اللغات الهندية والبنغالية وغيرها من النصوص المعقدة.
- تقليل الأخطاء الإملائية في الكلمات المدمجة داخل التصاميم الجرافيكية.
المواصفات التقنية وجودة المخرجات
لا تتوقف التحسينات عند الذكاء فقط، بل تمتد لتشمل القوة التقنية وجودة الملفات الناتجة، حيث يوفر النموذج الإمكانيات التالية:
- دقة تصل إلى 2K: إمكانية توليد صور عالية الوضوح مناسبة للشاشات الكبيرة والمطبوعات.
- تعدد نسب العرض: دعم مختلف أبعاد الصور (مربعة، طولية، عرضية) لتناسب منصات التواصل الاجتماعي المختلفة.
- توليد مكثف: القدرة على إنشاء ما يصل إلى 8 صور مختلفة من أمر نصي واحد للمقارنة بينها.
- البحث المباشر: النموذج قادر على البحث في الويب للحصول على معلومات حقيقية وتطبيقها في تصميم الصورة (مثل شكل منتج حديث أو حدث جاري).
كيفية الوصول إلى ChatGPT Images 2.0 واستخدامه
أعلنت أوبن إيه آي أن النموذج الجديد متاح حالياً لشرائح واسعة من المستخدمين، مما يتيح للجميع تجربة هذه الثورة البصرية. يمكن الوصول إليه عبر القنوات التالية:
- جميع مشتركي ChatGPT (بمختلف الفئات المدفوعة).
- مستخدمو منصة Codex للمطورين.
- عبر واجهة برمجة التطبيقات (API) للشركات التي ترغب في دمج التقنية في تطبيقاتها الخاصة.
في الختام، يضع ChatGPT Images 2.0 معياراً جديداً لما يمكن أن يحققه الذكاء الاصطناعي في الفنون البصرية. مع القدرة على "التفكير" قبل الرسم، نحن أمام أداة لن تكتفي بتنفيذ الأوامر، بل ستساهم في تجويد العملية الإبداعية بشكل كامل، وهو ما يجعلنا نترقب كيف سيغير هذا النموذج شكل المحتوى الرقمي في الأشهر القادمة.