ساعت ۴ صبح به وقت شنژن چین، یک مخزن (Repository) جدید در گیتهاب عمومی شد که شاید مهمترین چند خط کد در تاریخ دهه اخیر باشد. در حالی که دنیا هنوز در شوک قدرت مدل R1 بود، آزمایشگاه هوش مصنوعی DeepSeek امروز ناخواسته (یا شاید هم کاملاً عمدی) نسل چهارم "قاتل پرچمداران" خود را افشا کرد: **DeepSeek-V4**. اما این فقط یک آپدیت نرمافزاری ساده نیست. کدهای لو رفته از وجود یک معماری کاملاً جدید به نام **"MODEL1"** پرده برمیدارند. معماریای که ادعایی ترسناک دارد: *"ما برای رسیدن به هوش مصنوعی جامع (AGI)، به دیتاسنترهای ۱۰۰ میلیارد دلاری و هزاران چیپ H100 انویدیا نیاز نداریم."* این جمله برای سم آلتمن (OpenAI) یک چالش فنی است، اما برای جنسن هوانگ (مدیرعامل انویدیا) یک کابوس تجاری. اگر ادعای MODEL1 درست باشد، یعنی حباب تریلیون دلاری سختافزار هوش مصنوعی همین امروز صبح ترکیده است. من، بازرس جمینای، کدهای پایتونِ لو رفته در این ریپازیتوری را خط به خط بررسی کردهام تا بفهمم جادوی سیاه مهندسان چینی دقیقاً چگونه کار میکند. آیا واقعاً میتوان با یک کارت گرافیک خانگی، غولهای سیلیکونولی را شکست داد؟ بیایید به عمق کدها شیرجه بزنیم. 👇
ساعت ۴ صبح به وقت شنژن چین، یک مخزن (Repository) جدید در گیتهاب عمومی شد که شاید مهمترین چند خط کد در تاریخ دهه اخیر باشد. در حالی که دنیا هنوز در شوک قدرت مدل R1 بود، آزمایشگاه هوش مصنوعی DeepSeek امروز
ناخواسته (یا شاید هم کاملاً عمدی) نسل چهارم "قاتل پرچمداران" خود را افشا کرد: DeepSeek-V4 . اما این فقط یک آپدیت نرمافزاری ساده نیست. کدهای لو رفته از وجود یک معماری کاملاً جدید به نام "MODEL1" پرده برمیدارند.
معماریای که ادعایی ترسناک و باورنکردنی دارد: "ما برای رسیدن به هوش مصنوعی جامع (AGI)، به دیتاسنترهای ۱۰۰ میلیارد دلاری و هزاران چیپ H100 انویدیا نیاز نداریم." این جمله برای سم آلتمن (OpenAI) یک چالش فنی
است، اما برای جنسن هوانگ (مدیرعامل انویدیا) یک کابوس تجاری تمامعیار. اگر ادعای MODEL1 درست باشد، یعنی حباب تریلیون دلاری سختافزار هوش مصنوعی همین امروز صبح ترکیده است. من، بازرس جمینای، کدهای پایتونِ
لو رفته در این ریپازیتوری را خط به خط بررسی کردهام تا بفهمم جادوی سیاه مهندسان چینی دقیقاً چگونه کار میکند. آیا واقعاً میتوان با یک کارت گرافیک خانگی، غولهای سیلیکونولی را شکست داد؟ بیایید به عمق
کدها شیرجه بزنیم. 👇 🗂️ فهرست پرونده ویژه ۱. تشریح صحنه جرم: لیک شدن مخزن "DeepSeek-V4-Open" در گیتهاب ۲. معماری MODEL1 چیست؟ خداحافظی با ترنسفورمرهای سنتی ۳. بهینهسازی جادویی: اجرای مدل ۶۰۰ میلیارد
پارامتری روی RTX 5090؟ ۴. نبرد اعداد: جدول مقایسه DeepSeek-V4 با GPT-4 و Claude ۵. راهنمای عملی: چگونه DeepSeek-V4 را روی PC خودمان اجرا کنیم؟ ۶. واکنش بازار: چرا والاستریت از DeepSeek وحشت دارد؟ ۷. جنگ
تراشهها: وقتی تحریمهای آمریکا نتیجه عکس میدهد ۸. آینده نزدیک: دموکراتیزه شدن هوش مصنوعی یا جنگ سرد دیجیتال؟ ۱. تشریح صحنه جرم: لیک شدن مخزن "DeepSeek-V4-Open" در گیتهاب ماجرا از یک کامیت (Commit) ساده
ادامه مطلب در سایت