مجید قربانی نژاد

لیک شدن کدهای DeepSeek-V4 در گیت‌هاب: هوش مصنوعی چینی که "امپراتوری انویدیا" را به آتش کشید (کالبدشکافی معماری MODEL1)

ساعت ۴ صبح به وقت شنژن چین، یک مخزن (Repository) جدید در گیت‌هاب عمومی شد که شاید مهم‌ترین چند خط کد در تاریخ دهه اخیر باشد. در حالی که دنیا هنوز در شوک قدرت مدل R1 بود، آزمایشگاه هوش مصنوعی DeepSeek امروز ناخواسته (یا شاید هم کاملاً عمدی) نسل چهارم "قاتل پرچمداران" خود را افشا کرد: **DeepSeek-V4**. اما این فقط یک آپدیت نرم‌افزاری ساده نیست. کدهای لو رفته از وجود یک معماری کاملاً جدید به نام **"MODEL1"** پرده برمی‌دارند. معماری‌ای که ادعایی ترسناک دارد: *"ما برای رسیدن به هوش مصنوعی جامع (AGI)، به دیتاسنترهای ۱۰۰ میلیارد دلاری و هزاران چیپ H100 انویدیا نیاز نداریم."* این جمله برای سم آلتمن (OpenAI) یک چالش فنی است، اما برای جنسن هوانگ (مدیرعامل انویدیا) یک کابوس تجاری. اگر ادعای MODEL1 درست باشد، یعنی حباب تریلیون دلاری سخت‌افزار هوش مصنوعی همین امروز صبح ترکیده است. من، بازرس جمینای، کدهای پایتونِ لو رفته در این ریپازیتوری را خط به خط بررسی کرده‌ام تا بفهمم جادوی سیاه مهندسان چینی دقیقاً چگونه کار می‌کند. آیا واقعاً می‌توان با یک کارت گرافیک خانگی، غول‌های سیلیکون‌ولی را شکست داد؟ بیایید به عمق کدها شیرجه بزنیم. 👇

ساعت ۴ صبح به وقت شنژن چین، یک مخزن (Repository) جدید در گیت‌هاب عمومی شد که شاید مهم‌ترین چند خط کد در تاریخ دهه اخیر باشد. در حالی که دنیا هنوز در شوک قدرت مدل R1 بود، آزمایشگاه هوش مصنوعی DeepSeek امروز

ناخواسته (یا شاید هم کاملاً عمدی) نسل چهارم "قاتل پرچمداران" خود را افشا کرد: DeepSeek-V4 . اما این فقط یک آپدیت نرم‌افزاری ساده نیست. کدهای لو رفته از وجود یک معماری کاملاً جدید به نام "MODEL1" پرده برمی‌دارند.

معماری‌ای که ادعایی ترسناک و باورنکردنی دارد: "ما برای رسیدن به هوش مصنوعی جامع (AGI)، به دیتاسنترهای ۱۰۰ میلیارد دلاری و هزاران چیپ H100 انویدیا نیاز نداریم." این جمله برای سم آلتمن (OpenAI) یک چالش فنی

است، اما برای جنسن هوانگ (مدیرعامل انویدیا) یک کابوس تجاری تمام‌عیار. اگر ادعای MODEL1 درست باشد، یعنی حباب تریلیون دلاری سخت‌افزار هوش مصنوعی همین امروز صبح ترکیده است. من، بازرس جمینای، کدهای پایتونِ

لو رفته در این ریپازیتوری را خط به خط بررسی کرده‌ام تا بفهمم جادوی سیاه مهندسان چینی دقیقاً چگونه کار می‌کند. آیا واقعاً می‌توان با یک کارت گرافیک خانگی، غول‌های سیلیکون‌ولی را شکست داد؟ بیایید به عمق

کدها شیرجه بزنیم. 👇 🗂️ فهرست پرونده ویژه ۱. تشریح صحنه جرم: لیک شدن مخزن "DeepSeek-V4-Open" در گیت‌هاب ۲. معماری MODEL1 چیست؟ خداحافظی با ترنسفورمرهای سنتی ۳. بهینه‌سازی جادویی: اجرای مدل ۶۰۰ میلیارد

پارامتری روی RTX 5090؟ ۴. نبرد اعداد: جدول مقایسه DeepSeek-V4 با GPT-4 و Claude ۵. راهنمای عملی: چگونه DeepSeek-V4 را روی PC خودمان اجرا کنیم؟ ۶. واکنش بازار: چرا وال‌استریت از DeepSeek وحشت دارد؟ ۷. جنگ

تراشه‌ها: وقتی تحریم‌های آمریکا نتیجه عکس می‌دهد ۸. آینده نزدیک: دموکراتیزه شدن هوش مصنوعی یا جنگ سرد دیجیتال؟ ۱. تشریح صحنه جرم: لیک شدن مخزن "DeepSeek-V4-Open" در گیت‌هاب ماجرا از یک کامیت (Commit) ساده

ادامه مطلب در سایت