بررسی جدیدی نشان میدهد که شرکت چینی دیپسیک، که مدل استدلال محور R1 را ارائه کرده و اخیراً توانسته رقبای آمریکایی خود را به چالش بکشد، احتمالاً بیشتر از آنچه که پیشتر گزارش شده بود برای توسعه فناوری خود هزینه کرده است. به گزارش واشنگتن پست و بر اساس اطلاعات شرکت تحقیقاتی SemiAnalysis، دیپسیک از زمان آغاز فعالیت خود بیش از یک میلیارد دلار برای خرید پردازندههای پیشرفته و سایر نیازهای توسعهای هزینه کرده است. هزینه خرید پردازندهها به تنهایی بالغ بر نیم میلیارد دلار میشود.
دیپسیک ادعا کرده که یکی از مدلهای پیشرفته خود را با هزینهای کمتر از ۶ میلیون دلار توسعه داده است، رقمی که به مراتب پایینتر از هزینههای مشابه شرکتهای آمریکایی است. برای نمونه، اوپنایآی برای آموزش مدل GPT-4 حدود ۱۰۰ میلیون دلار هزینه کرده است، و مدلهای استدلال محور o1 و o3 نیز هزینههایی بسیار بالاتر را دربر داشتهاند.
اما این ادعاها از سوی فعالان فناوری مورد نقد قرار گرفته است. به علاوه، دولت آمریکا در حال بررسی احتمال دسترسی دیپسیک به پردازندههای پیشرفته انویدیا از طریق بازار سیاه است که به گفتهها ممکن است ریشه در سنگاپور داشته باشد.
با این حال، حتی با استناد به دادههای پیشین دیپسیک، میتوان میزان واقعی هزینههای این شرکت را مشخص کرد. بر اساس گفتههای دیپسیک، این مدل با استفاده از سوپرکامپیوتر متعلق به صندوق پوشش خطر High-Flyer آموزش داده شده است، که بر اساس گزارشهای پیشین هزینهای معادل ۱۳۹ میلیون دلار یا یک میلیارد یوان دربر داشته است. این شرکت پیش از تحریمها، حدود ۱۰ هزار پردازنده A100 انویدیا را برای این سوپرکامپیوتر خریداری کرده بود.
سم آلتمن، مدیرعامل اوپنایآی، که با وجود تحسین عملکرد مدلهای چینی، برآورد شرکت از بازدهی انرژی مدل دیپسیک را “بسیار بزرگنمایی شده” دانسته است.
تحقیقات جدید شرکت SemiAnalysis به مخارج بیش از یک میلیارد دلار دیپسیک برای توسعه زیرساختهای مورد نیاز هوش مصنوعی اشاره کرده است. این شرکت برآورد کرده که دیپسیک حدود نیم میلیارد دلار برای خرید پردازندههای گرافیکی هزینه کرده و مجموع مخارج سرمایهای آن به حدود ۱.۳ میلیارد دلار میرسد.
شرکت SemiAnalysis در وبسایت خود اعلام کرده است: “ما مطمئن هستیم که هزینههای سختافزاری دیپسیک در تاریخ این شرکت بیشتر از ۵۰۰ میلیون دلار است.”
دیپسیک به عنوان یکی از بازیگران نوپای صنعت فناوری و هوش مصنوعی در سال ۲۰۲۳ در هانگژو چین توسط High-Flyer تأسیس شد. پیش از تأسیس این شرکت، High-Flyer از الگوریتمهای هوش مصنوعی برای توسعه استراتژیهای پیچیده معاملاتی استفاده میکرد، اما به تدریج منابع و سرمایه خود را به تحقیقات بنیادی هوش مصنوعی اختصاص داد.
پانپان وانگ، مدیرعامل High-Flyer، در مارس ۲۰۲۲ اعلام کرده بود که حدود ۱۰ هزار پردازنده گرافیکی انویدیا در سوپرکامپیوتر این شرکت استفاده شده است، که به گفته وی توان پردازشی آن را در مدت دو سال به میزان ۱۰۰ برابر افزایش داده است.
لیانگ ونگفنگ، بنیانگذار High-Flyer و رهبر دیپسیک، در سال ۲۰۲۳ در مصاحبهای با رسانه 36Kr چین گفت: “برخی تصور میکنند که منطق تجاری پشت این کار ناشناخته است، اما در واقع، دلیل اصلی آن کنجکاوی است. عطش محققان برای توان پردازشی بیپایان است.”