يشهد عالم الذكاء الاصطناعي تحولاً جذرياً نحو الحوسبة المحلية عالية الكفاءة بعيداً عن الاعتماد الحصري على النماذج السحابية الضخمة. أثبتت شركة Liquid AI، وهي شركة منبثقة من معهد ماساتشوستس للتكنولوجيا بقيمة ملياري دولار، أن المعمارية الذكية تتفوق على زيادة المعاملات بالقوة الغاشمة. يغوص هذا التقرير التقني الحصري من تيكن جيم في تفاصيل نموذج LFM2.5-230M، ويحلل معاييره القياسية غير المسبوقة في استدعاء الأدوات واستخراج البيانات الطبية، وقدرته على العمل بسلاسة على الأجهزة المحدودة الموارد بدون اتصال بالإنترنت، ونموذج الترخيص الذي يغير قواعد اللعبة.
اليوم الذي انكسر فيه القطاع: عندما أصبح الذكاء الاصطناعي حقيقياً 25 يونيو 2026. أصدرت Liquid AI - شركة ناشئة من MIT بقيمة ملياري دولار - نموذجاً كان من المفترض أن يكون "صغيراً". فقط 230 مليون معامل. في
عالم حيث يحكم GPT-5.6 بتريليونات المعاملات، بدا هذا الرقم مضحكاً. لكن المعايير القياسية حكت قصة مختلفة. لم ينافس LFM2.5-230M النماذج بنفس الحجم فقط - بل دمر نماذج بمعاملات أكثر 4 أضعاف في استخراج البيانات.
Qwen3.5-0.8B بـ 800 مليون معامل؟ تم إبادته. Google Gemma 3 1B؟ خارج المنافسة تماماً. كانت هذه اللحظة التي أدرك فيها القطاع: سباق المعاملات انتهى. سباق المعمارية بدأ. [IMAGE_PLACEHOLDER_1] العلم وراء المعجزة:
لماذا معمارية LFM2 مهمة؟ دعونا نكون صادقين. حتى 2026، كانت معظم نماذج اللغة الكبيرة (LLM) مثل عمالقة جائعة تلتهم RAM. معمارية Transformer - المعيار الصناعي منذ 2017 - كان لديها مشكلة أساسية: استهلاك الذاكرة
ينمو بشكل تربيعي مع طول السياق. ماذا يعني ذلك؟ إذا أردت مضاعفة نافذة السياق، يتضاعف استهلاك الذاكرة 4 مرات. بالنسبة لمراكز البيانات ذات الجيوب العميقة، لا مشكلة. لكن بالنسبة لهاتف؟ Raspberry Pi؟ جهاز IoT؟
مستحيل. معمارية LFM2: أفضل ما في العالمين دخلت Liquid AI بنهج هجين. LFM2 هو مزيج من: Convolutions قصيرة المدى مع gating: لمعالجة سريعة للأنماط المحلية Grouped-query attention: لفهم العلاقات طويلة المدى
بدون overhead ثقيل للذاكرة Dynamic modulation: بوابات معتمدة على المدخلات تعمل مثل الأنظمة الديناميكية النتيجة؟ نموذج بنافذة سياق 32K لكن بصمة ذاكرة تحت 400MB. للمقارنة، نموذج transformer نموذجي بنفس نافذة
السياق يحتاج على الأقل 1-2GB RAM. Transformer Architecture: المعمارية الأساسية لـ LLM منذ 2017، تعتمد على آلية attention. قوية لكن جائعة للذاكرة - استهلاك الذاكرة ينمو مع مربع طول السياق. Convolution:
اقرأ المزيد على الموقع