آمازون ممکن است به تراشه‌های ۷۶۸ گیگابایتی AI200 کوالکام روی آورد.

آمازون ممکن است به تراشه‌های ۷۶۸ گیگابایتی AI200 کوالکام روی آورد.

آمازون ممکن است به تراشه‌های ۷۶۸ گیگابایتی AI200 کوالکام روی آورد، زیرا بخش خدمات وب آمازون (AWS) برای کاهش هزینه‌های استنتاج با حاشیه سود پایین رقابت می‌کند.بر اساس گزارشی از بانک ولز فارگو، این همکاری می‌تواند به بهبود حاشیه‌های عملیاتی آمازون و کاهش هزینه‌های استنتاجی که تحت تأثیر هزینه‌های شتاب‌دهنده‌های هوش مصنوعی قرار دارد، کمک کند.

طبق گزارشی از بانک ولز فارگو، کوالکام، غول طراحی نیمه‌هادی، قرار است همکاری خود را با بخش خدمات وب آمازون (AWS) برای تراشه‌های هوش مصنوعی خود عمیق‌تر کند. این بانک می‌گوید این همکاری در راستای استراتژی AWS برای بهبود حاشیه سود عملیاتی با تراشه‌های هوش مصنوعی مورد استفاده و کاهش هزینه‌های کلی استنتاج ناشی از هزینه‌های شتاب‌دهنده هوش مصنوعی خواهد بود. گزارش ولز فارگو در حالی منتشر می‌شود که برخی شایعات حاکی از آن است که کوالکام ممکن است پردازنده‌های هوش مصنوعی خود را برای هدف قرار دادن تقاضای رو به رشد محاسبات عاملی عرضه کند، که تمرکز را در ساخت زیرساخت هوش مصنوعی به پردازنده‌ها معطوف کرده است.

کوالکام سال گذشته تراشه‌های هوش مصنوعی AI200 خود را که برای کاربردهای استنتاج هوش مصنوعی طراحی شده بودند، عرضه کرد. این تراشه‌ها به دلیل توانایی پشتیبانی از حداکثر ۷۶۸ گیگابایت حافظه در هر تراشه، از نظر ظرفیت پشتیبانی از مدل‌های زبانی بزرگ متمایز هستند. با توجه به اینکه عرضه AI200 برای سال ۲۰۲۶ برنامه‌ریزی شده است، ولز فارگو معتقد است که آمازون ممکن است به شریک اصلی کوالکام برای تراشه‌های جدید تبدیل شود.

در یادداشتی جدید، این بانک سرمایه‌گذاری، اقتصاد تراشه‌های AI200 را تشریح می‌کند. این بانک ادعا می‌کند که می‌توان آنها را با هزینه ۳.۵ میلیارد دلار به ازای هر گیگاوات مستقر کرد و سود هر سهم شرکت را تا ۲.۵۰ دلار افزایش داد. ولز فارگو می‌گوید این امر منوط به این است که کوالکام بتواند تعداد شتاب‌دهنده‌ها را در هر رک افزایش دهد.

این بانک اضافه می‌کند که بخش خدمات ابری آمازون (AWS) می‌تواند مشتری اصلی کوالکام باشد. در این گزارش آمده است که «بر اساس نظرات شرکت / تحلیل AWS را به عنوان شریک اصلی بالقوه ASIC هایپراسکیل می‌بینیم.» در این گزارش به اظهارات کریستین آمون، مدیرعامل کوالکام، مبنی بر اشاره به یک شرکت بزرگ ابری و این واقعیت که AWS در حال حاضر تراشه‌های AI100 Ultra را ارائه می‌دهد، اشاره شده است. ولز فارگو می‌گوید عملکرد قوی AI100 Ultra بر اساس دلار به ازای هر پردازنده گرافیکی در ساعت به ازای هر فلاپس در مقایسه با رقبایش «نسبتاً قوی» است.

طبق گفته این بانک، آمازون به تراشه‌های کارآمد علاقه‌مند است، زیرا «کاهش طیف قیمت‌گذاری توکن‌ها را به عنوان یک استراتژی همسو با فلسفه خود مبنی بر استفاده از سیلیکون داخلی برای افزایش درصد بازده عملیاتی و صرفه‌جویی در هزینه‌های سرمایه‌ای می‌بیند.» علاوه بر این، هزینه‌های بالای استنتاج مانع از رسیدن درآمد استنتاج هوش مصنوعی به همه اقشار مشتریان می‌شود.

با تغییر صنعت هوش مصنوعی به سمت استنتاج، قیمت‌گذاری مبتنی بر توکن به طور فزاینده‌ای اهمیت پیدا کرده است. اوایل امسال، در مصاحبه‌ای، یکی از افراد داخلی Nebius، ارائه‌دهنده زیرساخت‌های محاسباتی، اظهار داشت که شرکت‌ها از مشتریان خود بر اساس میلیون‌ها توکن هزینه دریافت می‌کنند . این امر منجر به محبوبیت گزینه‌های دیگری مانند تراشه‌های هوش مصنوعی Groq با پشتیبانی NVIDIA شده است.

 

فروشگاه BAPC
ارسال دیدگاه