سلام به ارتش تکین! 🤖📱 بیایید به سال ۲۰۲۳ برگردیم؛ زمانی که ChatGPT دنیا را منفجر کرد. در آن دوران، تفکر غالب در سیلیکونولی یک قانون نانوشته بود: «بزرگتر، بهتر است». شرکتها با افتخار اعلام میکردند که مدلهایشان ۱۰۰ میلیارد، ۵۰۰ میلیارد یا حتی یک تریلیون پارامتر دارد. دیتاسنترهای غولپیکر با هزاران پردازنده گرافیکی H100 شبانهروز کار میکردند تا به یک سوال ساده شما درباره "دستور پخت قرمهسبزی" پاسخ دهند. اما امروز، در سال ۲۰۲۶، آن دوران به پایان رسیده است. دایناسورهای دیجیتال (LLMهای عظیم) هنوز هستند، اما دیگر فرمانروای مطلق نیستند. ما وارد عصر پستانداران چابک شدهایم: عصر **SLM (Small Language Models)**. چرا این تغییر رخ داد؟ چون کاربران فهمیدند که برای نوشتن یک ایمیل یا ادیت یک عکس، نیازی نیست درخواستشان هزاران کیلومتر سفر کند، در سروری در کالیفرنیا پردازش شود و برگردد. آنها سرعت میخواهند، حریم خصوصی میخواهند و مهمتر از همه، هوشمندی "آفلاین" میخواهند. امسال، شرکتهایی مثل اپل، گوگل و کوالکام جنگ را از "سرورها" به "گوشیها" کشاندهاند. هوش مصنوعی حالا روی چیپست موبایل شما زندگی میکند، نه در ابری دوردست. در این مقاله تحلیلی، میخواهیم کالبدشکافی کنیم که چرا آینده AI کوچک، سریع و شخصی است و این موضوع چه تاثیری بر زندگی دیجیتال شما دارد.
۱. تعریف جدید هوشمندی: تفاوت LLM و SLM به زبان ساده برای سالها، ما فکر میکردیم که هوش مصنوعی یعنی "دانستن همه چیز". مدلهای زبانی بزرگ (LLM) مثل GPT-4 یا Claude 3 Opus مانند کتابخانههای ملی بودند که
همه کتابهای جهان را در خود داشتند. اما مشکل کتابخانه ملی چیست؟ بزرگ است، کند است و دسترسی به آن سخت است. در سال ۲۰۲۶، تعریف ما تغییر کرده است. مدلهای زبانی کوچک (SLM) مانند کتابچههای راهنمای تخصصی هستند.
یک SLM شاید نتواند شعر قرن هفدهم فرانسه را تحلیل کند، اما میتواند ایمیلهای شما را عالی خلاصه کند و تقویمتان را تنظیم کند. تفاوت اصلی در "کیفیت داده" است. به جای خوراندن کل اینترنت به مدل، مهندسان حالا
مدلهای کوچک (مثلاً ۳ تا ۷ میلیارد پارامتر) را با دادههای "دستچین شده" و بسیار باکیفیت آموزش میدهند. نتیجه؟ مدلی که ۱۰ برابر کوچکتر است، اما در کارهای روزمره به همان اندازه باهوش است. ۲. بحران انرژی
و تأخیر: چرا مدلهای ابری به بنبست رسیدند؟ دو عامل اصلی باعث شد غولهای تکنولوژی ترمز قطار LLMها را بکشند: تأخیر (Latency): در دنیای پرسرعت ۲۰۲۶، هیچکس دوست ندارد بعد از پرسیدن سوال از دستیار صوتی، ۳
ثانیه صبر کند تا دایره لودینگ بچرخد. مدلهای ابری وابسته به سرعت اینترنت هستند. اگر اینترنت قطع شود، هوش مصنوعی شما میمیرد. هزینه و انرژی: هر جستجوی هوش مصنوعی ۱۰ برابر بیشتر از یک سرچ گوگل برق مصرف میکند.
دیتاسنترها داشتند شبکه برق کشورها را میبلعیدند. انتقال پردازش به "لبه" (Edge) یعنی دستگاه کاربر، این بار سنگین را از دوش سرورها برداشت. حالا باتری گوشی شما هزینه پردازش را میدهد، نه نیروگاه برق شرکت
گوگل. ۳. سختافزار ۲۰۲۶: ظهور NPU و کامپیوترهای AI PC نرمافزار بدون سختافزار هیچ است. انقلاب SLM مدیون یک قطعه سیلیکونی کوچک است: NPU (واحد پردازش عصبی) . تا پیش از این، CPU و GPU کارهای سنگین را انجام
ادامه مطلب در سایت