مسابقه برای ساخت مدلهای زبانی عظیم با تریلیونها پارامتر متوقف شده است، زیرا آینده هوش مصنوعی در جیب شماست. در تاریخ ۲۵ ژوئن ۲۰۲۶، استارتاپ Liquid AI که از دل MIT متولد شده، با معرفی مدلی کوچک اما وحشتناک قدرتمند نشان داد که طراحی معماری هوشمندانه میتواند بر مقیاسپذیری بیرحمانه و پرمصرف غولهای ابری غلبه کند. در این گزارش جامع و تخصصی از تکینگیم، به کالبدشکافی عملکرد خیرهکننده این مدل روی دستگاههای Edge (از جمله گوشیهای هوشمند و رسپبریپای)، بررسی بنچمارکهای استخراج داده، و پیامدهای اقتصادی آن برای دموکراتیزه کردن واقعی هوش مصنوعی میپردازیم.
خط قرمز شکست: روزی که صنعت AI دوباره تعریف شد ۲۵ ژوئن ۲۰۲۶. Liquid AI - یک استارتاپ MIT با ارزش تقریبی ۲ میلیارد دلار - مدلی منتشر کرد که قرار بود "کوچک" باشد. تنها ۲۳۰ میلیون پارامتر. در دنیایی که GPT-5.6
با تریلیونها پارامتر حکمرانی میکند، این عدد مسخره به نظر میرسید. اما بنچمارکها داستان دیگری تعریف کردند. LFM2.5-230M نه تنها با مدلهای هماندازه رقابت کرد - بلکه مدلهایی با ۴ برابر پارامتر بیشتر
را در وظایف استخراج داده شکست داد. Qwen3.5-0.8B با ۸۰۰ میلیون پارامتر؟ نابود شد. Google Gemma 3 1B؟ کاملاً از دور خارج. این لحظهای بود که صنعت فهمید: مسابقه پارامترها تمام شده. مسابقه معماری شروع شده
است. [IMAGE_PLACEHOLDER_1] علم پشت معجزه: چرا LFM2 architecture مهم است؟ بذارید صادق باشیم. تا ۲۰۲۶، بیشتر مدلهای زبانی بزرگ (LLM) مثل غولهای گرسنهای بودند که RAM میبلعیدند. Transformer architecture
- استاندارد صنعت از ۲۰۱۷ - یک مشکل اساسی داشت: memory consumption به صورت quadratic با طول context رشد میکرد. یعنی چی؟ یعنی اگه میخواستید context window رو ۲ برابر کنید، memory مصرفی ۴ برابر میشد. برای
data center که پول داشت مشکلی نبود. اما برای یک گوشی؟ یک Raspberry Pi؟ یک دستگاه IoT؟ غیرممکن بود. معماری LFM2: بهترین هر دو دنیا Liquid AI با رویکرد hybrid وارد میدان شد. LFM2 ترکیبی است از: Short-range
convolutions with gating: برای پردازش سریع pattern های محلی Grouped-query attention: برای درک روابط بلندمدت بدون memory overhead سنگین Dynamic modulation: gate های وابسته به input که مانند سیستمهای دینامیکی
عمل میکنند نتیجه؟ یک مدل که context window ۳۲K دارد اما memory footprint زیر ۴۰۰MB. برای مقایسه، یک مدل transformer معمولی با همین context window حداقل ۱-۲GB RAM نیاز داشت. Transformer Architecture: معماری
ادامه مطلب در سایت