بیایید روراست باشیم: نوشتن "پرامپت" سخت است. اینکه سعی کنید تصویری که در ذهنتان میبینید را با کلمات محدود انسانی به یک ماشین بفهمانید، همیشه با مقداری "اتلاف دیتا" همراه است. شما یک اژدهای بنفش با فلسهای کریستالی در غروب مریخ را تصور میکنید، اما چیزی که هوش مصنوعی تحویل میدهد، "شبیه" آن است، نه دقیقاً "خود" آن. دیوید هولز (David Holz)، خالق میدجرنی، همیشه گفته است که هدف نهایی، حذف مانع زبان است. اما شایعاتی که اخیراً پیرامون **Midjourney v7** و پروژههای مخفی آزمایشگاههای هوش مصنوعی میچرخد، فراتر از یک آپدیت ساده گرافیکی است. صحبت از تکنولوژی **Mind-to-Image (ذهنبهتصویر)** است. ادغام هوش مصنوعی مولد با رابطهای مغز و رایانه (BCI). جایی که شما فقط "فکر" میکنید و پیکسلها روی صفحه ظاهر میشوند. در این مقاله تحلیلی تکینگیم (که با سختی فراوان از سد محدودیتهای اینترنت عبور کرده تا به دست شما برسد)، میخواهیم بررسی کنیم که آیا این تکنولوژی علمی-تخیلی واقعاً در v7 پیادهسازی میشود یا با یک دروغ بزرگ طرف هستیم؟
1. چرا زبان برای هنر کافی نیست؟ (مشکل پرامپتها) زبان انسان، ابزاری خطی و محدود است. یک تصویر هزار کلمه است، اما ما مجبوریم آن را در ۵۰ کلمه پرامپت خلاصه کنیم. در نسخههای فعلی (v6)، ما یاد گرفتهایم با
"زبان ماشین" صحبت کنیم: --ar 16:9 --stylize 500 . این مهندسی است، نه هنر خالص. فلسفه پشت Midjourney v7 این است که "واسطه" را حذف کند. اگر هوش مصنوعی بتواند مستقیماً به مرکز بینایی مغز (Visual Cortex) وصل
شود، دیگر نیازی نیست بگویید "یک غروب غمگین". هوش مصنوعی دقیقاً همان طیف رنگی و همان حس غمگینی که در نورونهای شما جریان دارد را بازسازی میکند. 2. پروژه "تلهپاتی": تکنولوژی Mind-to-Image چگونه کار میکند؟
شاید فکر کنید این جادوگری است، اما این علم محض است. مغز انسان هنگام تصور کردن یک سیب، الگوی الکتریکی خاصی تولید میکند. این الگو برای یک ماشین، فقط یک "دیتای رمزگذاری شده" است. مراحل تبدیل فکر به پیکسل:
دریافت سیگنال (EEG/fMRI): امواج مغزی توسط سنسورها خوانده میشود. دیکد کردن (Decoding): یک مدل هوش مصنوعی (مثل Stable Diffusion) یاد میگیرد که کدام الگوی مغزی مربوط به کدام تصویر است. بازسازی (Reconstruction):
هوش مصنوعی نویزهای مغزی را به تصویر واضح تبدیل میکند. شایعات میگویند میدجرنی در حال همکاری با استارتاپهای نوروتک (Neurotech) است تا مدلی بسازد که بتواند این سیگنالها را به عنوان "پرامپت ورودی" بپذیرد.
3. شواهد علمی: وقتی هوش مصنوعی ذهن را خواند این ایده فقط تئوری نیست. در سال ۲۰۲۳، محققان دانشگاه ملی سنگاپور و دانشگاه هنگکنگ با استفاده از دستگاه fMRI و مدل هوش مصنوعی MinD-Vis توانستند تصاویری که افراد
به آنها نگاه میکردند را با دقت ۸۵٪ بازسازی کنند. وقتی سوژه به عکس یک گربه نگاه میکرد، هوش مصنوعی بدون دیدن عکس، یک گربه ترسیم کرد. میدجرنی v7 احتمالاً اولین محصول تجاری خواهد بود که سعی میکند نسخهای
ادامه مطلب در سایت