شرکت علی‌بابا نسخه به‌روزرسانی‌شده‌ای از مدل هوش مصنوعی تبدیل متن به تصویر خود با نام Qwen-Image-2512 را منتشر کرده است. این نسخه جدید با هدف رفع یکی از بزرگ‌ترین چالش‌های مدل‌های قبلی، یعنی ظاهر مصنوعی و پلاستیکی تصاویر، توسعه یافته و اکنون قادر است تصاویری بسیار واقعی‌تر از انسان‌ها با جزئیات دقیق چهره خلق کند که تشخیص آن‌ها از واقعیت دشوارتر شده است.

خلاصه در یک نگاه

🔹معرفی مدل جدید هوش مصنوعی Qwen-Image-2512 با تمرکز بر تولید تصاویر واقع‌گرایانه

🔹رفع مشکل ظاهر پلاستیکی و مصنوعی پوست در تولید تصاویر انسان

🔹بهبود چشمگیر در نمایش متن داخل تصاویر برای ساخت اینفوگرافیک و ارائه

🔹کسب رتبه نخست در میان مدل‌های متن‌باز و رتبه چهارم کلی در تست‌های کور

🔹دسترسی رایگان از طریق پلتفرم‌های Hugging Face و ModelScope

چه تغییراتی در کیفیت تصاویر و نمایش متن ایجاد شده است؟

تمرکز اصلی مدل Qwen-Image-2512 بر حذف آن ظاهر «پلاستیکی» و صیقلی غیرطبیعی است که گریبان‌گیر نسخه‌های پیشین بود. اکنون بافت پوست، مو و جزئیات صورت در تصاویر تولیدشده از انسان، بسیار زنده‌تر و طبیعی‌تر به‌نظر می‌رسند. علاوه‌بر بهبود چهره‌ها، هوش مصنوعی جدید علی‌بابا در رندر کردن عناصر طبیعی دیگر مانند مناظر و خز حیوانات نیز عملکرد دقیق‌تری از خود نشان می‌دهد.

یکی دیگر از پیشرفت‌های قابل‌توجه در این نسخه، نحوه مدیریت متون داخل تصویر است. این مدل اکنون می‌تواند متن‌ها را در مواردی مانند اینفوگرافیک‌ها یا فایل‌های ارائه (Presentation) با دقت و خوانایی بسیار بهتری نسبت‌به گذشته نمایش دهد؛ مشکلی که بسیاری از مدل‌های رقیب هنوز با آن دست‌وپنج نرم می‌کنند.

عملکرد Qwen-Image-2512 دربرابر رقبا چگونه است؟

طبق اعلام علی‌بابا، در بیش از ۱۰,۰۰۰ تست کور (Blind Test) که در پلتفرم AI Arena انجام شده، این مدل توانسته رتبه چهارم کلی را در میان تمامی مدل‌ها کسب کند. این جایگاه، Qwen-Image-2512 را به برترین مدل متن‌باز (Open-source) جهان تبدیل کرده است. در این رقابت، مدل جدید علی‌بابا دربرابر رقبای متن‌باز قدرتمندی قرار گرفته و آن‌ها را شکست داده است. برخی از این رقبا عبارت‌اند از:

مدل HunyuanImage-3.0
مدل Z-image
مدل Flux.2

هوش مصنوعی Qwen-Image-2512

هوش مصنوعی Qwen-Image-2512

نحوه دسترسی و مشخصات کلی

کاربران و توسعه‌دهندگان می‌توانند هم‌اکنون به این مدل دسترسی داشته باشند. جزئیات دسترسی و ویژگی‌های کلیدی در جدول زیر خلاصه شده است:

ویژگی
توضیحات

نام مدل
Qwen-Image-2512

توسعه‌دهنده
گروه علی‌بابا (Alibaba)

نوع مدل
متن‌باز (Open-source)

پلتفرم‌های دسترسی
Hugging Face ,ModelScope ,Qwen Chat

نقاط قوت اصلی
واقع‌گرایی چهره، نمایش صحیح متن، جزئیات دقیق بافت‌ها

برای دریافت جزئیات فنی بیشتر، علاقه‌مندان می‌توانند به گزارش فنی و وبلاگ رسمی این شرکت مراجعه کنند.

به‌نظر شما آیا مدل‌های متن‌باز مانند Qwen می‌توانند به‌زودی جایگزین سرویس‌های پولی و بسته مانند میدجورنی شوند؟

بفرست برای دوستات

برچسب ها :

این مطلب بدون برچسب می باشد.

چه امتیازی می دهید؟
5 / 0
[ 0 رای ]
دیدگاه کاربران 0
  • نظرات شما پس از بررسی و تایید نمایش داده می شود.
  • لطفا نظرات خود را فقط در مورد مطلب بالا ارسال کنید.