آمازون ممکن است به تراشههای ۷۶۸ گیگابایتی AI200 کوالکام روی آورد، زیرا بخش خدمات وب آمازون (AWS) برای کاهش هزینههای استنتاج با حاشیه سود پایین رقابت میکند.بر اساس گزارشی از بانک ولز فارگو، این همکاری میتواند به بهبود حاشیههای عملیاتی آمازون و کاهش هزینههای استنتاجی که تحت تأثیر هزینههای شتابدهندههای هوش مصنوعی قرار دارد، کمک کند.
طبق گزارشی از بانک ولز فارگو، کوالکام، غول طراحی نیمههادی، قرار است همکاری خود را با بخش خدمات وب آمازون (AWS) برای تراشههای هوش مصنوعی خود عمیقتر کند. این بانک میگوید این همکاری در راستای استراتژی AWS برای بهبود حاشیه سود عملیاتی با تراشههای هوش مصنوعی مورد استفاده و کاهش هزینههای کلی استنتاج ناشی از هزینههای شتابدهنده هوش مصنوعی خواهد بود. گزارش ولز فارگو در حالی منتشر میشود که برخی شایعات حاکی از آن است که کوالکام ممکن است پردازندههای هوش مصنوعی خود را برای هدف قرار دادن تقاضای رو به رشد محاسبات عاملی عرضه کند، که تمرکز را در ساخت زیرساخت هوش مصنوعی به پردازندهها معطوف کرده است.
کوالکام سال گذشته تراشههای هوش مصنوعی AI200 خود را که برای کاربردهای استنتاج هوش مصنوعی طراحی شده بودند، عرضه کرد. این تراشهها به دلیل توانایی پشتیبانی از حداکثر ۷۶۸ گیگابایت حافظه در هر تراشه، از نظر ظرفیت پشتیبانی از مدلهای زبانی بزرگ متمایز هستند. با توجه به اینکه عرضه AI200 برای سال ۲۰۲۶ برنامهریزی شده است، ولز فارگو معتقد است که آمازون ممکن است به شریک اصلی کوالکام برای تراشههای جدید تبدیل شود.

در یادداشتی جدید، این بانک سرمایهگذاری، اقتصاد تراشههای AI200 را تشریح میکند. این بانک ادعا میکند که میتوان آنها را با هزینه ۳.۵ میلیارد دلار به ازای هر گیگاوات مستقر کرد و سود هر سهم شرکت را تا ۲.۵۰ دلار افزایش داد. ولز فارگو میگوید این امر منوط به این است که کوالکام بتواند تعداد شتابدهندهها را در هر رک افزایش دهد.
این بانک اضافه میکند که بخش خدمات ابری آمازون (AWS) میتواند مشتری اصلی کوالکام باشد. در این گزارش آمده است که «بر اساس نظرات شرکت / تحلیل AWS را به عنوان شریک اصلی بالقوه ASIC هایپراسکیل میبینیم.» در این گزارش به اظهارات کریستین آمون، مدیرعامل کوالکام، مبنی بر اشاره به یک شرکت بزرگ ابری و این واقعیت که AWS در حال حاضر تراشههای AI100 Ultra را ارائه میدهد، اشاره شده است. ولز فارگو میگوید عملکرد قوی AI100 Ultra بر اساس دلار به ازای هر پردازنده گرافیکی در ساعت به ازای هر فلاپس در مقایسه با رقبایش «نسبتاً قوی» است.
طبق گفته این بانک، آمازون به تراشههای کارآمد علاقهمند است، زیرا «کاهش طیف قیمتگذاری توکنها را به عنوان یک استراتژی همسو با فلسفه خود مبنی بر استفاده از سیلیکون داخلی برای افزایش درصد بازده عملیاتی و صرفهجویی در هزینههای سرمایهای میبیند.» علاوه بر این، هزینههای بالای استنتاج مانع از رسیدن درآمد استنتاج هوش مصنوعی به همه اقشار مشتریان میشود.
با تغییر صنعت هوش مصنوعی به سمت استنتاج، قیمتگذاری مبتنی بر توکن به طور فزایندهای اهمیت پیدا کرده است. اوایل امسال، در مصاحبهای، یکی از افراد داخلی Nebius، ارائهدهنده زیرساختهای محاسباتی، اظهار داشت که شرکتها از مشتریان خود بر اساس میلیونها توکن هزینه دریافت میکنند . این امر منجر به محبوبیت گزینههای دیگری مانند تراشههای هوش مصنوعی Groq با پشتیبانی NVIDIA شده است.









برای نوشتن دیدگاه باید وارد بشوید.