• :607
  • :11,744,460
ادعای ۲۹۴ هزار دلاری دیپ‌سیک برای آموزش مدل R1؛ شفافیت یا ابهام تازه؟

ادعای ۲۹۴ هزار دلاری دیپ‌سیک برای آموزش مدل R1؛ شفافیت یا ابهام تازه؟

از زمان ظهور غافلگیرکننده دیپ‌سیک در ژانویه و عرضه مدل‌های ارزان‌تر، بازار جهانی هوش مصنوعی با نگرانی نسبت به تغییر موازنه رقابتی واکنش نشان داد. هرچند هنوز تأیید هزینه‌های واقعی دشوار است، اما ترکیب ادعای کارآمدی مالی و روش‌های متفاوت توسعه می‌تواند فشار بیشتری بر شرکت‌های آمریکایی وارد کند که با هزینه‌های فزاینده آموزش مدل‌ها دست‌وپنجه نرم می‌کنند.
دیپ‌سیک مستقر در هانگژو اعلام کرده مدل R1 را طی ۸۰ ساعت با استفاده از ۵۱۲ تراشه H800 انویدیا آموزش داده است؛ رقمی بسیار پایین‌تر از برآوردهای شرکت‌های آمریکایی. برای مقایسه، سم آلتمن مدیرعامل اوپن‌اِی‌آی سال ۲۰۲۳ گفته بود هزینه آموزش مدل‌های پایه این شرکت «بسیار بیش از» ۱۰۰ میلیون دلار بوده است.

به گزارش ایتنا و به تک‌اسپات، با این حال، گزارش شرکت تحقیقاتی SemiAnalysis تصویر متفاوتی ارائه می‌دهد. طبق این گزارش، دیپ‌سیک در مقیاسی بسیار بزرگ‌تر فعالیت کرده و به حدود ۵۰ هزار پردازنده گرافیکی هوپر انویدیا، از جمله ۱۰ هزار H800 و ۱۰ هزار H100، دسترسی داشته است.

این نهاد برآورد می‌کند سرمایه‌گذاری واقعی دیپ‌سیک شامل ۱/۶ میلیارد دلار هزینه سرورها، حدود ۹۴۴ میلیون دلار هزینه عملیاتی و بیش از ۵۰۰ میلیون دلار صرف خرید GPU بوده است.

 

روش‌های توسعه و استفاده از داده‌های خارجی
دیپ‌سیک در مقاله نیچر ضمن تأیید استفاده اولیه از واحدهای A100 اذعان کرده است که در مدل V3 بخشی از داده‌های آموزشی شامل پاسخ‌های تولیدشده توسط سیستم‌های اوپن‌اِی‌آی بوده است. این شرکت مدعی است این داده‌ها به‌طور غیرمستقیم از طریق خزیدن وب وارد مجموعه شده‌اند و نه با هدف کپی‌برداری عمدی.
 
منتقدان، از جمله مقام‌های آمریکایی، بارها به نقش پررنگ روش «دیستیلیشن» در پیشرفت دیپ‌سیک اشاره کرده‌اند؛ روشی که طی آن مدل جدید از خروجی‌های یک مدل دیگر آموزش می‌بیند. دیپ‌سیک اما این روش را ابزاری برای ساخت سیستم‌های کارآمدتر و مقرون‌به‌صرفه‌تر می‌داند.

    *

    • وقتی روی لینک مخرب کلیک کردید، این ۵ کار را فوراً انجام دهید

      آیا می‌دانستید یک کلیک روی لینک‌ مخرب می‌تواند دستگاه شما را در کمتر از ۳۰ ثانیه آلوده کند؟ این راهنمای فوری، ۵ اقدام حیاتی را برای نجات از بحران حملات فیشینگ آموزش می‌دهد. از قطع اتصال این...

    • پهپادهای هوش مصنوعی؛ نسل جدید پلیس در راه است

      تقریباً هر منطقه شهری بزرگ در ایالات متحده دارای یک آژانس اجرای قانون با سیستم پهپاد است.ادارات پلیس در سراسر آمریکا به‌سرعت در حال استفاده از پهپادهای مجهز به هوش مصنوعی برای عملیات تع...

    • راز ضعف آنتن آیفون ۴ پس از پانزده سال فاش شد؛ چند خط کد پشت رسوایی بزرگ اپل

      پانزده سال پس از یکی از جنجالی‌ترین رسوایی‌های تاریخ اپل، راز ضعف آنتن آیفون ۴ بالاخره فاش شد. گزارشی تازه نشان می‌دهد که تنها چند خط کد نرم‌افزاری پشت بحرانی قرار داشت که میلیون‌ها کاربر را...

    • امواج رادیویی زیر پوست شهر

      آگاهی از شدت میدان الکترومغناطیس و میزان تشعشعات امواج رادیویی در محیط کار و زندگی، یکی از مبانی مهم و آغازین در بهداشت الکترومغناطیس است؛ به عبارت دیگر اولین گام برای اجرای بهداشت الکترومغن...

    با وجود سالها تجربه بر آن شدیم تا محصولی برای جمع آوری اخبار مهم از موضوع های مهم و مورد دغدغه بازدید کنندگان عزیز مهیا سازیم و همچنین ابزاری جهت اطلاع از آخرین قیمت بازارهای مالی نیز فراهم کرده ایم