- دسته بندی : هوش مصنوعی
- بازدید : 5 بار
- 0 دیدگاه
شرکت علیبابا نسخه بهروزرسانیشدهای از مدل هوش مصنوعی تبدیل متن به تصویر خود با نام Qwen-Image-2512 را منتشر کرده است. این نسخه جدید با هدف رفع یکی از بزرگترین چالشهای مدلهای قبلی، یعنی ظاهر مصنوعی و پلاستیکی تصاویر، توسعه یافته و اکنون قادر است تصاویری بسیار واقعیتر از انسانها با جزئیات دقیق چهره خلق کند که تشخیص آنها از واقعیت دشوارتر شده است.
خلاصه در یک نگاه
🔹معرفی مدل جدید هوش مصنوعی Qwen-Image-2512 با تمرکز بر تولید تصاویر واقعگرایانه
🔹رفع مشکل ظاهر پلاستیکی و مصنوعی پوست در تولید تصاویر انسان
🔹بهبود چشمگیر در نمایش متن داخل تصاویر برای ساخت اینفوگرافیک و ارائه
🔹کسب رتبه نخست در میان مدلهای متنباز و رتبه چهارم کلی در تستهای کور
🔹دسترسی رایگان از طریق پلتفرمهای Hugging Face و ModelScope
چه تغییراتی در کیفیت تصاویر و نمایش متن ایجاد شده است؟
تمرکز اصلی مدل Qwen-Image-2512 بر حذف آن ظاهر «پلاستیکی» و صیقلی غیرطبیعی است که گریبانگیر نسخههای پیشین بود. اکنون بافت پوست، مو و جزئیات صورت در تصاویر تولیدشده از انسان، بسیار زندهتر و طبیعیتر بهنظر میرسند. علاوهبر بهبود چهرهها، هوش مصنوعی جدید علیبابا در رندر کردن عناصر طبیعی دیگر مانند مناظر و خز حیوانات نیز عملکرد دقیقتری از خود نشان میدهد.
یکی دیگر از پیشرفتهای قابلتوجه در این نسخه، نحوه مدیریت متون داخل تصویر است. این مدل اکنون میتواند متنها را در مواردی مانند اینفوگرافیکها یا فایلهای ارائه (Presentation) با دقت و خوانایی بسیار بهتری نسبتبه گذشته نمایش دهد؛ مشکلی که بسیاری از مدلهای رقیب هنوز با آن دستوپنج نرم میکنند.
عملکرد Qwen-Image-2512 دربرابر رقبا چگونه است؟
طبق اعلام علیبابا، در بیش از ۱۰,۰۰۰ تست کور (Blind Test) که در پلتفرم AI Arena انجام شده، این مدل توانسته رتبه چهارم کلی را در میان تمامی مدلها کسب کند. این جایگاه، Qwen-Image-2512 را به برترین مدل متنباز (Open-source) جهان تبدیل کرده است. در این رقابت، مدل جدید علیبابا دربرابر رقبای متنباز قدرتمندی قرار گرفته و آنها را شکست داده است. برخی از این رقبا عبارتاند از:
مدل HunyuanImage-3.0
مدل Z-image
مدل Flux.2

هوش مصنوعی Qwen-Image-2512
نحوه دسترسی و مشخصات کلی
کاربران و توسعهدهندگان میتوانند هماکنون به این مدل دسترسی داشته باشند. جزئیات دسترسی و ویژگیهای کلیدی در جدول زیر خلاصه شده است:
ویژگی
توضیحات
نام مدل
Qwen-Image-2512
توسعهدهنده
گروه علیبابا (Alibaba)
نوع مدل
متنباز (Open-source)
پلتفرمهای دسترسی
Hugging Face ,ModelScope ,Qwen Chat
نقاط قوت اصلی
واقعگرایی چهره، نمایش صحیح متن، جزئیات دقیق بافتها
برای دریافت جزئیات فنی بیشتر، علاقهمندان میتوانند به گزارش فنی و وبلاگ رسمی این شرکت مراجعه کنند.
بهنظر شما آیا مدلهای متنباز مانند Qwen میتوانند بهزودی جایگزین سرویسهای پولی و بسته مانند میدجورنی شوند؟
بفرست برای دوستات
