میانگین امتیاز ۱ نفر به این نوشته ۵ از ۵ است.

در دنیای فناوری اطلاعات، پردازنده ها یکی از مهم ترین و بنیادی ترین قطعات سخت افزاری هستند که برای سرورها، کامپیوترها و دیگر دستگاه های الکترونیکی مورد استفاده قرار می‌گیرند. AMD و Intel دو شرکت بزرگ تولیدکننده پردازنده در جهان، از دهه ها است که با تسلط بر فناوری های نوآورانه و رقابت بی وقفه، تلاش می کنند تا پردازنده های پیشرفته تر و با عملکرد بهتری را برای بازار عرضه کنند. در جدیدترین عرضه محصولات دو کمپانی بزرگ AMD و Intel شاهد تغییرات بزرگی هستیم که تکنولوژی های بسیار قدرتمندی را به کارگرفته اند.

در این مقاله، قصد داریم تا به معرفی و بررسی سریع ترین پردازنده های تاریخ  دو شرکت AMD و Intel بپردازیم. این دو شرکت با ارائه محصولات متنوع و قدرتمند، همواره در حال ارتقا  عملکرد پردازنده های خود هستند.

پردازنده‌های AMD EPYC Genoa-X با ۱.۱ گیگابایت حافظه کش L3

همراه با معرفی پردازنده های Bergamo، یکی از مهمترین اخبار از سوی AMD این بود که پردازنده‌های EPYC Genoa-X با ظرفیت کش بزرگ به نام V-cache معرفی شده اند. Genoa-X که توسط AMD در ژوئن سال گذشته معرفی شد، مجهز به تکنولوژی V-cache است که ظرفیت حافظه کش L3 را روی هر CCD افزایش می‌دهد. با این حافظه اضافی، یک پردازنده Genoa-X می‌تواند حداکثر ۱۱۵۲MB کش L3 داشته باشد.

همانند پیش بینی، AMD از تراکم بیشتر V-cache برای افزودن کش L3 بیشتر به CCD های پردازنده های Genoa استفاده می‌کند. این کار به AMD این امکان را می‌دهد یک معماری با حافظه کش بالاتری بدون نیاز به طراحی و ساخت کامل یک شی جداگانه داشته باشد. در این حالت، با ۱۲ عدد CCD در یک تراشه Genoa/Genoa-X، مقدار ۷۶۸MB کش L3 بیشتر به تراشه اضافه کند.

این سری خاص از پردازنده ها با کش بسیار بالا برای یک بخش خاص از بازار طراحی شده‌اند که AMD این بازار را “technical computing” معرفی می‌کند. برای استفاده کامل از حافظه کش اضافی، یک بار کاری باید دارای محدودیت ظرفیت حافظه کش باشد که این مورد معمولا یک زیرمجموعه از بارهای کاری سرور و ورک استیشن ها مانند دینامیک سیالات، پایگاه های داده و طراحی الکترونیک است. به همین دلیل این تراشه‌های با حافظه کش بسیار زیاد بخشی محدودتر از بازار را در بر می‌گیرند. اما در شرایط مناسب، میزان عملکرد می‌تواند قابل توجه باشد.

جدول پردازنده های AMD EPYC Genoa-X

به دلیل اینکه تراشه‌ Genoa-X در اصل تراشه‌های معمولی Genoa هستند،  از همان سوکت SP5 که Genoa و Bergamo از آن استفاده می‌کنند، بهره می‌برند. AMD بیان نکرده است که این سی پی یو ها چه مقدار توان حرارتی (TDPs) دارند، اما انتظار داریم محدوده مشابهی از TDPs را با سری معمولی داشته باشند. حافظه کش اضافی و قرارگیری آن روی CCD به این معناست که CCD های مجهز به V-cache نسبت به حالت عادی، مصرف انرژی بیشتری دارند. همچنین این مقدار کش زیاد برخی چالش‌های اضافی در خصوص خنک سازی را نیز ایجاد می‌کند.

بنابراین، در بهره‌مندی از کش اضافی، تضاداتی بین افزایش عملکرد ناشی از کش حجیم و کاهش عملکرد ناشی از محدودیت‌ های TDP در پلتفرم SP5 وجود دارد.

بیشتر بخوانید: ASML، شرکتی که دنیای تراشه به آن وابسته است!

نگاهی جدید روی محاسبات ابری با پردازنده AMD EPYC Bergamo

پردازنده های مدرن دارای یک مشکل چشمگیر هستند و AMD در اقدامات اولیه خود در حال رفع این مشکل است. پردازنده AMD EPYC Bergamo جدیدترین تراشه این شرکت است که تا ۱۲۸ هسته را در یک تراشه ارائه می‌دهد. بر خلاف روند مدرن ساخت هسته های بزرگ تر و سریع تر، AMD چیزی را ایجاد می کند که عمدتا کمترین سرعت (بر اساس هر هسته) را دارد، اما ویژگی های جدیدی دارد که قبلا در پردازنده ای مشاهده نشده است.

پردازنده AMD EPYC Bergamo

کدام پردازنده سرور سریع ترین است؟

این پرسش پاسخ پیچیده ای دارد. پنج سال پیش، پاسخ به این سوال گران ترین تراشه‌ی Intel بود. اما اکنون با گذشت زمان برای پاسخ به این سوال باید به هر بار کاری خاص نگاه کرد و پاسخ را مرتبط با آن یافت. از طرفی شرکت AMD در حال حاضر سه پردازنده EPYC معرفی کرده است که هر کدام مختص به بارکاری متفاوتی هستند. Bergamo یک نسخه با تعداد هسته های بالا، اما سرعت کلاک و حافظه کش کمتر است. AMD EPYC Genoa نسبت به CPU سرور Intel Xeon به شکل خیره کننده‌ای پیشرفت کرده است. البته به طور جداگانه به تحلیل دقیق سری Intel Xeon Max که دارای ۶۴ گیگابایت HBM2e درون تراشه‌ای است، خواهیم پرداخت.

Genoa-X از V-Cache سه بعدی (۳D) مشابه Milan-X و تراشه‌های دسکتاپ استفاده می‌کند تا به حداکثر ۱.۱ گیگابایت کش L3 برای هر پردازنده برسد. برای قابل فهم شدن این مقدار باید بدانید که ۱.۱ گیگابایت کش L3 کافی است تا به حداقل نیازمندی های سیستم ویندوز ۷ نسخه ۳۲ بیتی برسیم.

مرور پردازنده AMD EPYC Bergamo و یک مورد جدید

AMD توانسته است با استفاده از هسته جدید Zen 4c، هر CCD را کوچک تر کند و این امکان را فراهم کرده است تا به سادگی مساحت را کوچک تر کند. همچنین، AMD توانسته است اموری مانند فاصله ها و موارد مشابه را در اطراف تراشه کوچک تر و بهینه سازی کند. به عبارت دیگر، مساحت تراشه در Zen 4c به مراتب کمتر از Zen 4 است. در نوع مشابه اینتل نیز قصد دارد در Intel Sierra Forest از E-cores به جای P-cores استفاده ببرد.

در این استراتژی AMD ما همان تکنولوژی های PCIe Gen5 و DDR5 را که در Genoa و Genoa-X بود را داریم و این کنترلر ها تغییری نمی کنند. با این حال تغییر اساسی این است که از ۱۲ تراشه ۸ هسته‌ای CCD در Genoa به ۸ تراشه ۱۶ هسته‌ای CCD در Bergamo منتقل شده ایم. این مورد به این معناست که هنوز همان پردازنده AMD Socket SP5 را داریم که می‌توانیم در تعدادی از سرورها و مادربردها استفاده کنیم.

در آزمایش های عملی و ایجاد بار ۱۰۰٪ روی همه‌ی رشته های پردازنده با استفاده از ابزار stress-ng نتایج شگفت آوری بدست آمده است.

عملکرد AMD Bergamo

در مشخصات فنی این پردازنده سرعت کلاک با عدد ۳.۱ گیگاهرتز اعلام شده است. برخلاف بسیاری از پردازنده‌های سرور دیگر، تمامی ۱۲۸ هسته به مدت ساعت ها با سرعت ۳.۱ گیگاهرتز کار کرده اند. حتی در یک سرور با خنک کننده ضعیف تر که دما در محدوده ۷۵ درجه سانتی گراد بود، همه ۲۵۶ رشته بارگذاری شده اند و تمامی ۱۲۸ هسته در سرعت ۳.۱ گیگاهرتز قرار داشته اند. این تعهد به فرکانس حداکثر کمک می کند که هیچ هسته‌ای از دیگران پیشی نگیرد که ویژگی مهمی برای پردازنده محاسبات ابری است. علاوه بر این، این پردازنده محاسبات ابری دارای ISA از AMD با پشتیبانی از AVX-512 و ویژگی‌هایی مانند bfloat16 و VNNI برای هوش مصنوعی (AI inference) است.

بیشتر بخوانید: Samsung PIM انقلابی در سرعت حافظه‌های مموری

تجزیه و تحلیل Intel Xeon MAX با ۶۴ گیگابایت حافظه HBM2e درون تراشه

در این بخش ما پردازنده ای را معرفی می‌کنیم که شاید نوشتن راجع به آن ماه ها طول بکشد. پردازنده Intel Xeon MAX 9480 با ۵۶ هسته و حافظه درون تراشه ای، قوی ترین پردازنده معرفی شده اینتل تا به امروز است. حافظه به کار رفته در داخل این پردازنده از نوع DDR5 معمولی نیست. بلکه به جای آن از ۶۴ گیگابایت حافظه HBM2e استفاده شده است، همان نوع حافظه‌ای که در اکثر GPU‌ ها و شتاب‌ دهنده‌ های هوش مصنوعی (AI) موجود است.

سری پردازنده اینتل Xeon Max دارای حافظه با پهنای باند بالا است و برای این نسل، تمامی پردازنده ها دارای ۶۴ گیگابایت حافظه HBM2e هستند و تعداد هسته‌ها از ۳۲ تا ۵۶ هسته بر اساس مدل متغیر است. مانند سری معمولی پردازنده‌های Xeon Scalable نسل چهارم اینتل، سری پردازنده‌های Xeon Max از Advanced Matrix Extensions (AMX)، AVX-512، DDR5، CXL 1.1 و سایر ویژگی های مشترک پشتیبانی می‌کند. در Xeon Max، تمرکز بر روی افزایش سرعت پردازش نیست، بلکه استفاده از حافظه با پهنای باند بالا برای پاسخ گویی مناسب به بارهای کاری مختلف است.

پردازنده سرور Intel Xeon MAX

سری پردازنده های Xeon Max از سه حالت عملیاتی مختلف پشتیبانی می‌کند:

  • حالت HBM-Only: در حالت HBM-Only سرور فقط با ۶۴ گیگابایت حافظه HBM2e (یا ۱۲۸ گیگابایت برای دو سوکت) کار می‌کند. این حالت به سادگی با پر نکردن هیچ یک از اسلات‌های حافظه DDR5 کار می‌کند.
  • حالت حافظه کش HBM (HBM Cache): حالت HBM Cache، حالت پیش‌فرض است که باید برای اجرای CPU های Xeon Max حافظه DDR5 نصب شده باشد. در این حالت، HBM2e به طور عادی به عنوان یک حافظه کش عمل می‌کند و نیازی به تغییرات نرم‌افزاری ندارد.
  • حالت HBM Flat: در آخر، حالت HBM Flat وجود دارد که می‌توان آن را از طریق BIOS فعال کرد و زمانی که سرور با پردازنده Xeon Max و رم DDR5 پر شود، فعال می‌شود. در حالت HBM flat، یک حافظه Flat با HBM و DRAM می‌تواند برای افزایش انعطاف پذیری در نرم‌افزار که از HBM2E استفاده می‌کند، ایجاد شود. برای این مورد ممکن است نیاز به تغییرات نرم افزاری باشد.

بررسی کلی Intel 9480، پرچم دار خانواده Xeon MAX

پردازنده Intel Xeon MAX 9480

Intel Xeon MAX 9480 در بسیاری از موارد ممکن است ما را به یاد Intel Xeon Platinum 8480+ (Plus) بیاندازد. این پردازنده دارای ۵۶ هسته است، اما یک تفاوت بزرگ در حافظه کش وجود دارد. پردازنده MAX 9480 دارای ۱۱۲.۵ مگابایت کش L3 است در حالی که Platinum 8480+ دارای ۱۰۵ مگابایت است.

هر دو پردازنده با توان مصرفی ۳۵۰ وات دارای سرعت های مشابهی هستند. پردازنده Xeon Max 9480 با سرعت پایه ۱.۹ گیگاهرتز، ۱۰۰ مگاهرتز کمتر از Xeon Platinum 8480 پلاس است. سرعت های توربو نیز کمی کمتر هستند، به ترتیب ۳.۵ گیگاهرتز در مقابل ۳.۸ گیگاهرتز. با این حال، این سرعت ها فاکتور تمایز مهمی نیستند. به جای آن، تفاوت اصلی در چهار بسته ۱۶ گیگابایتی HBM2e است که به Intel Xeon Max اضافه شده اند.

بیشتر بخوانید: پردازنده اینتل Xeon Y با قابلیت تنظیم فرکانس برای شخصی سازی سرور