مجید قربانی‌نژاد

🚀 انقلاب Edge AI: کالبدشکافی مدل ۲۳۰ مگابایتی Liquid AI

مسابقه برای ساخت مدل‌های زبانی عظیم با تریلیون‌ها پارامتر متوقف شده است، زیرا آینده هوش مصنوعی در جیب شماست. در تاریخ ۲۵ ژوئن ۲۰۲۶، استارتاپ Liquid AI که از دل MIT متولد شده، با معرفی مدلی کوچک اما وحشتناک قدرتمند نشان داد که طراحی معماری هوشمندانه می‌تواند بر مقیاس‌پذیری بی‌رحمانه و پرمصرف غول‌های ابری غلبه کند. در این گزارش جامع و تخصصی از تکین‌گیم، به کالبدشکافی عملکرد خیره‌کننده این مدل روی دستگاه‌های Edge (از جمله گوشی‌های هوشمند و رسپبری‌پای)، بررسی بنچمارک‌های استخراج داده، و پیامدهای اقتصادی آن برای دموکراتیزه کردن واقعی هوش مصنوعی می‌پردازیم.

خط قرمز شکست: روزی که صنعت AI دوباره تعریف شد ۲۵ ژوئن ۲۰۲۶. Liquid AI - یک استارتاپ MIT با ارزش تقریبی ۲ میلیارد دلار - مدلی منتشر کرد که قرار بود "کوچک" باشد. تنها ۲۳۰ میلیون پارامتر. در دنیایی که GPT-5.6

با تریلیون‌ها پارامتر حکمرانی می‌کند، این عدد مسخره به نظر می‌رسید. اما بنچمارک‌ها داستان دیگری تعریف کردند. LFM2.5-230M نه تنها با مدل‌های هم‌اندازه رقابت کرد - بلکه مدل‌هایی با ۴ برابر پارامتر بیشتر

را در وظایف استخراج داده شکست داد. Qwen3.5-0.8B با ۸۰۰ میلیون پارامتر؟ نابود شد. Google Gemma 3 1B؟ کاملاً از دور خارج. این لحظه‌ای بود که صنعت فهمید: مسابقه پارامترها تمام شده. مسابقه معماری شروع شده

است. [IMAGE_PLACEHOLDER_1] علم پشت معجزه: چرا LFM2 architecture مهم است؟ بذارید صادق باشیم. تا ۲۰۲۶، بیشتر مدل‌های زبانی بزرگ (LLM) مثل غول‌های گرسنه‌ای بودند که RAM می‌بلعیدند. Transformer architecture

- استاندارد صنعت از ۲۰۱۷ - یک مشکل اساسی داشت: memory consumption به صورت quadratic با طول context رشد می‌کرد. یعنی چی؟ یعنی اگه می‌خواستید context window رو ۲ برابر کنید، memory مصرفی ۴ برابر می‌شد. برای

data center که پول داشت مشکلی نبود. اما برای یک گوشی؟ یک Raspberry Pi؟ یک دستگاه IoT؟ غیرممکن بود. معماری LFM2: بهترین هر دو دنیا Liquid AI با رویکرد hybrid وارد میدان شد. LFM2 ترکیبی است از: Short-range

convolutions with gating: برای پردازش سریع pattern های محلی Grouped-query attention: برای درک روابط بلندمدت بدون memory overhead سنگین Dynamic modulation: gate های وابسته به input که مانند سیستم‌های دینامیکی

عمل می‌کنند نتیجه؟ یک مدل که context window ۳۲K دارد اما memory footprint زیر ۴۰۰MB. برای مقایسه، یک مدل transformer معمولی با همین context window حداقل ۱-۲GB RAM نیاز داشت. Transformer Architecture: معماری

ادامه مطلب در سایت