• :1,973
  • :11,338,441
ادعای ۲۹۴ هزار دلاری دیپ‌سیک برای آموزش مدل R1؛ شفافیت یا ابهام تازه؟

ادعای ۲۹۴ هزار دلاری دیپ‌سیک برای آموزش مدل R1؛ شفافیت یا ابهام تازه؟

از زمان ظهور غافلگیرکننده دیپ‌سیک در ژانویه و عرضه مدل‌های ارزان‌تر، بازار جهانی هوش مصنوعی با نگرانی نسبت به تغییر موازنه رقابتی واکنش نشان داد. هرچند هنوز تأیید هزینه‌های واقعی دشوار است، اما ترکیب ادعای کارآمدی مالی و روش‌های متفاوت توسعه می‌تواند فشار بیشتری بر شرکت‌های آمریکایی وارد کند که با هزینه‌های فزاینده آموزش مدل‌ها دست‌وپنجه نرم می‌کنند.
دیپ‌سیک مستقر در هانگژو اعلام کرده مدل R1 را طی ۸۰ ساعت با استفاده از ۵۱۲ تراشه H800 انویدیا آموزش داده است؛ رقمی بسیار پایین‌تر از برآوردهای شرکت‌های آمریکایی. برای مقایسه، سم آلتمن مدیرعامل اوپن‌اِی‌آی سال ۲۰۲۳ گفته بود هزینه آموزش مدل‌های پایه این شرکت «بسیار بیش از» ۱۰۰ میلیون دلار بوده است.

به گزارش ایتنا و به تک‌اسپات، با این حال، گزارش شرکت تحقیقاتی SemiAnalysis تصویر متفاوتی ارائه می‌دهد. طبق این گزارش، دیپ‌سیک در مقیاسی بسیار بزرگ‌تر فعالیت کرده و به حدود ۵۰ هزار پردازنده گرافیکی هوپر انویدیا، از جمله ۱۰ هزار H800 و ۱۰ هزار H100، دسترسی داشته است.

این نهاد برآورد می‌کند سرمایه‌گذاری واقعی دیپ‌سیک شامل ۱/۶ میلیارد دلار هزینه سرورها، حدود ۹۴۴ میلیون دلار هزینه عملیاتی و بیش از ۵۰۰ میلیون دلار صرف خرید GPU بوده است.

 

روش‌های توسعه و استفاده از داده‌های خارجی
دیپ‌سیک در مقاله نیچر ضمن تأیید استفاده اولیه از واحدهای A100 اذعان کرده است که در مدل V3 بخشی از داده‌های آموزشی شامل پاسخ‌های تولیدشده توسط سیستم‌های اوپن‌اِی‌آی بوده است. این شرکت مدعی است این داده‌ها به‌طور غیرمستقیم از طریق خزیدن وب وارد مجموعه شده‌اند و نه با هدف کپی‌برداری عمدی.
 
منتقدان، از جمله مقام‌های آمریکایی، بارها به نقش پررنگ روش «دیستیلیشن» در پیشرفت دیپ‌سیک اشاره کرده‌اند؛ روشی که طی آن مدل جدید از خروجی‌های یک مدل دیگر آموزش می‌بیند. دیپ‌سیک اما این روش را ابزاری برای ساخت سیستم‌های کارآمدتر و مقرون‌به‌صرفه‌تر می‌داند.

    *

    • تاریخچه مختصر ChatGPT

      تاریخچه مختصر ChatGPT...

      این گاه‌شمار نشان می‌دهد چگونه ChatGPT در کمتر از سه سال، از یک پروژهٔ تحقیقاتی به یک پلتفرم هوش مصنوعی جهانی تبدیل شد که هر ماه با نوآوری‌ها و بهبودهای جدید در حال پیشرفت است.مقدمه ChatGPT...

    • آموزش: چطور تماس تلفنی با آیفون را ضبط و به متن تبدیل کنیم؟

      آی‌او‌اس جدید اپل در مقایسه با گذشته، بسیار کامل‌تر و کاربردی‌تر شده است، به‌ویژه برای کسانی که از آیفون برای مصاحبه‌ها، جلسات یا مکالمات مهم کاری استفاده می‌کنند. اپل با عرضه‌ آی&zwnj...

    • ایستادن طولانی پشت میزهای ایستاده برای سلامتی مضر است

      نشستن مداوم با افزایش خطر بیماری‌های قلبی و سکته مرتبط است. ایستادن طولانی هم نه تنها این خطر را کاهش نمی‌دهد، بلکه با افزایش خطر مشکلات در گردش خون، تجمع خون در پاها و واریس همراه است. یک ...

    • منظم‌ و مرتب‌ها بیشتر عمر می‌کنند

      پارک اوسولیوبین، از نویسندگان مقاله، می‌گوید پژوهش آنان نشان می‌دهد شخصیت فقط یک تاثیر کلی نیست، بلکه مجموعه‌ای از رفتارها و نگرش‌های مشخص است که بر طول عمر اثر قابل اندازه‌گیری دارد. یک مط...

    با وجود سالها تجربه بر آن شدیم تا محصولی برای جمع آوری اخبار مهم از موضوع های مهم و مورد دغدغه بازدید کنندگان عزیز مهیا سازیم و همچنین ابزاری جهت اطلاع از آخرین قیمت بازارهای مالی نیز فراهم کرده ایم