در دنیای فناوری اطلاعات، پردازنده ها یکی از مهم ترین و بنیادی ترین قطعات سخت افزاری هستند که برای سرورها، کامپیوترها و دیگر دستگاه های الکترونیکی مورد استفاده قرار میگیرند. AMD و Intel دو شرکت بزرگ تولیدکننده پردازنده در جهان، از دهه ها است که با تسلط بر فناوری های نوآورانه و رقابت بی وقفه، تلاش می کنند تا پردازنده های پیشرفته تر و با عملکرد بهتری را برای بازار عرضه کنند. در جدیدترین عرضه محصولات دو کمپانی بزرگ AMD و Intel شاهد تغییرات بزرگی هستیم که تکنولوژی های بسیار قدرتمندی را به کارگرفته اند.
در این مقاله، قصد داریم تا به معرفی و بررسی سریع ترین پردازنده های تاریخ دو شرکت AMD و Intel بپردازیم. این دو شرکت با ارائه محصولات متنوع و قدرتمند، همواره در حال ارتقا عملکرد پردازنده های خود هستند.
پردازندههای AMD EPYC Genoa-X با 1.1 گیگابایت حافظه کش L3
همراه با معرفی پردازنده های Bergamo، یکی از مهمترین اخبار از سوی AMD این بود که پردازندههای EPYC Genoa-X با ظرفیت کش بزرگ به نام V-cache معرفی شده اند. Genoa-X که توسط AMD در ژوئن سال گذشته معرفی شد، مجهز به تکنولوژی V-cache است که ظرفیت حافظه کش L3 را روی هر CCD افزایش میدهد. با این حافظه اضافی، یک پردازنده Genoa-X میتواند حداکثر 1152MB کش L3 داشته باشد.
همانند پیش بینی، AMD از تراکم بیشتر V-cache برای افزودن کش L3 بیشتر به CCD های پردازنده های Genoa استفاده میکند. این کار به AMD این امکان را میدهد یک معماری با حافظه کش بالاتری بدون نیاز به طراحی و ساخت کامل یک شی جداگانه داشته باشد. در این حالت، با 12 عدد CCD در یک تراشه Genoa/Genoa-X، مقدار 768MB کش L3 بیشتر به تراشه اضافه کند.
این سری خاص از پردازنده ها با کش بسیار بالا برای یک بخش خاص از بازار طراحی شدهاند که AMD این بازار را “technical computing” معرفی میکند. برای استفاده کامل از حافظه کش اضافی، یک بار کاری باید دارای محدودیت ظرفیت حافظه کش باشد که این مورد معمولا یک زیرمجموعه از بارهای کاری سرور و ورک استیشن ها مانند دینامیک سیالات، پایگاه های داده و طراحی الکترونیک است. به همین دلیل این تراشههای با حافظه کش بسیار زیاد بخشی محدودتر از بازار را در بر میگیرند. اما در شرایط مناسب، میزان عملکرد میتواند قابل توجه باشد.
به دلیل اینکه تراشه Genoa-X در اصل تراشههای معمولی Genoa هستند، از همان سوکت SP5 که Genoa و Bergamo از آن استفاده میکنند، بهره میبرند. AMD بیان نکرده است که این سی پی یو ها چه مقدار توان حرارتی (TDPs) دارند، اما انتظار داریم محدوده مشابهی از TDPs را با سری معمولی داشته باشند. حافظه کش اضافی و قرارگیری آن روی CCD به این معناست که CCD های مجهز به V-cache نسبت به حالت عادی، مصرف انرژی بیشتری دارند. همچنین این مقدار کش زیاد برخی چالشهای اضافی در خصوص خنک سازی را نیز ایجاد میکند.
بنابراین، در بهرهمندی از کش اضافی، تضاداتی بین افزایش عملکرد ناشی از کش حجیم و کاهش عملکرد ناشی از محدودیت های TDP در پلتفرم SP5 وجود دارد.
بیشتر بخوانید: ASML، شرکتی که دنیای تراشه به آن وابسته است!
نگاهی جدید روی محاسبات ابری با پردازنده AMD EPYC Bergamo
پردازنده های مدرن دارای یک مشکل چشمگیر هستند و AMD در اقدامات اولیه خود در حال رفع این مشکل است. پردازنده AMD EPYC Bergamo جدیدترین تراشه این شرکت است که تا 128 هسته را در یک تراشه ارائه میدهد. بر خلاف روند مدرن ساخت هسته های بزرگ تر و سریع تر، AMD چیزی را ایجاد می کند که عمدتا کمترین سرعت (بر اساس هر هسته) را دارد، اما ویژگی های جدیدی دارد که قبلا در پردازنده ای مشاهده نشده است.
کدام پردازنده سرور سریع ترین است؟
این پرسش پاسخ پیچیده ای دارد. پنج سال پیش، پاسخ به این سوال گران ترین تراشهی Intel بود. اما اکنون با گذشت زمان برای پاسخ به این سوال باید به هر بار کاری خاص نگاه کرد و پاسخ را مرتبط با آن یافت. از طرفی شرکت AMD در حال حاضر سه پردازنده EPYC معرفی کرده است که هر کدام مختص به بارکاری متفاوتی هستند. Bergamo یک نسخه با تعداد هسته های بالا، اما سرعت کلاک و حافظه کش کمتر است. AMD EPYC Genoa نسبت به CPU سرور Intel Xeon به شکل خیره کنندهای پیشرفت کرده است. البته به طور جداگانه به تحلیل دقیق سری Intel Xeon Max که دارای 64 گیگابایت HBM2e درون تراشهای است، خواهیم پرداخت.
Genoa-X از V-Cache سه بعدی (3D) مشابه Milan-X و تراشههای دسکتاپ استفاده میکند تا به حداکثر 1.1 گیگابایت کش L3 برای هر پردازنده برسد. برای قابل فهم شدن این مقدار باید بدانید که 1.1 گیگابایت کش L3 کافی است تا به حداقل نیازمندی های سیستم ویندوز 7 نسخه 32 بیتی برسیم.
مرور پردازنده AMD EPYC Bergamo و یک مورد جدید
AMD توانسته است با استفاده از هسته جدید Zen 4c، هر CCD را کوچک تر کند و این امکان را فراهم کرده است تا به سادگی مساحت را کوچک تر کند. همچنین، AMD توانسته است اموری مانند فاصله ها و موارد مشابه را در اطراف تراشه کوچک تر و بهینه سازی کند. به عبارت دیگر، مساحت تراشه در Zen 4c به مراتب کمتر از Zen 4 است. در نوع مشابه اینتل نیز قصد دارد در Intel Sierra Forest از E-cores به جای P-cores استفاده ببرد.
در این استراتژی AMD ما همان تکنولوژی های PCIe Gen5 و DDR5 را که در Genoa و Genoa-X بود را داریم و این کنترلر ها تغییری نمی کنند. با این حال تغییر اساسی این است که از 12 تراشه 8 هستهای CCD در Genoa به 8 تراشه 16 هستهای CCD در Bergamo منتقل شده ایم. این مورد به این معناست که هنوز همان پردازنده AMD Socket SP5 را داریم که میتوانیم در تعدادی از سرورها و مادربردها استفاده کنیم.
در آزمایش های عملی و ایجاد بار 100٪ روی همهی رشته های پردازنده با استفاده از ابزار stress-ng نتایج شگفت آوری بدست آمده است.
در مشخصات فنی این پردازنده سرعت کلاک با عدد 3.1 گیگاهرتز اعلام شده است. برخلاف بسیاری از پردازندههای سرور دیگر، تمامی 128 هسته به مدت ساعت ها با سرعت 3.1 گیگاهرتز کار کرده اند. حتی در یک سرور با خنک کننده ضعیف تر که دما در محدوده 75 درجه سانتی گراد بود، همه 256 رشته بارگذاری شده اند و تمامی 128 هسته در سرعت 3.1 گیگاهرتز قرار داشته اند. این تعهد به فرکانس حداکثر کمک می کند که هیچ هستهای از دیگران پیشی نگیرد که ویژگی مهمی برای پردازنده محاسبات ابری است. علاوه بر این، این پردازنده محاسبات ابری دارای ISA از AMD با پشتیبانی از AVX-512 و ویژگیهایی مانند bfloat16 و VNNI برای هوش مصنوعی (AI inference) است.
بیشتر بخوانید: Samsung PIM انقلابی در سرعت حافظههای مموری
تجزیه و تحلیل Intel Xeon MAX با 64 گیگابایت حافظه HBM2e درون تراشه
در این بخش ما پردازنده ای را معرفی میکنیم که شاید نوشتن راجع به آن ماه ها طول بکشد. پردازنده Intel Xeon MAX 9480 با 56 هسته و حافظه درون تراشه ای، قوی ترین پردازنده معرفی شده اینتل تا به امروز است. حافظه به کار رفته در داخل این پردازنده از نوع DDR5 معمولی نیست. بلکه به جای آن از 64 گیگابایت حافظه HBM2e استفاده شده است، همان نوع حافظهای که در اکثر GPU ها و شتاب دهنده های هوش مصنوعی (AI) موجود است.
سری پردازنده اینتل Xeon Max دارای حافظه با پهنای باند بالا است و برای این نسل، تمامی پردازنده ها دارای 64 گیگابایت حافظه HBM2e هستند و تعداد هستهها از 32 تا 56 هسته بر اساس مدل متغیر است. مانند سری معمولی پردازندههای Xeon Scalable نسل چهارم اینتل، سری پردازندههای Xeon Max از Advanced Matrix Extensions (AMX)، AVX-512، DDR5، CXL 1.1 و سایر ویژگی های مشترک پشتیبانی میکند. در Xeon Max، تمرکز بر روی افزایش سرعت پردازش نیست، بلکه استفاده از حافظه با پهنای باند بالا برای پاسخ گویی مناسب به بارهای کاری مختلف است.
سری پردازنده های Xeon Max از سه حالت عملیاتی مختلف پشتیبانی میکند:
- حالت HBM-Only: در حالت HBM-Only سرور فقط با 64 گیگابایت حافظه HBM2e (یا 128 گیگابایت برای دو سوکت) کار میکند. این حالت به سادگی با پر نکردن هیچ یک از اسلاتهای حافظه DDR5 کار میکند.
- حالت حافظه کش HBM (HBM Cache): حالت HBM Cache، حالت پیشفرض است که باید برای اجرای CPU های Xeon Max حافظه DDR5 نصب شده باشد. در این حالت، HBM2e به طور عادی به عنوان یک حافظه کش عمل میکند و نیازی به تغییرات نرمافزاری ندارد.
- حالت HBM Flat: در آخر، حالت HBM Flat وجود دارد که میتوان آن را از طریق BIOS فعال کرد و زمانی که سرور با پردازنده Xeon Max و رم DDR5 پر شود، فعال میشود. در حالت HBM flat، یک حافظه Flat با HBM و DRAM میتواند برای افزایش انعطاف پذیری در نرمافزار که از HBM2E استفاده میکند، ایجاد شود. برای این مورد ممکن است نیاز به تغییرات نرم افزاری باشد.
بررسی کلی Intel 9480، پرچم دار خانواده Xeon MAX
Intel Xeon MAX 9480 در بسیاری از موارد ممکن است ما را به یاد Intel Xeon Platinum 8480+ (Plus) بیاندازد. این پردازنده دارای 56 هسته است، اما یک تفاوت بزرگ در حافظه کش وجود دارد. پردازنده MAX 9480 دارای 112.5 مگابایت کش L3 است در حالی که Platinum 8480+ دارای 105 مگابایت است.
هر دو پردازنده با توان مصرفی 350 وات دارای سرعت های مشابهی هستند. پردازنده Xeon Max 9480 با سرعت پایه 1.9 گیگاهرتز، 100 مگاهرتز کمتر از Xeon Platinum 8480 پلاس است. سرعت های توربو نیز کمی کمتر هستند، به ترتیب 3.5 گیگاهرتز در مقابل 3.8 گیگاهرتز. با این حال، این سرعت ها فاکتور تمایز مهمی نیستند. به جای آن، تفاوت اصلی در چهار بسته 16 گیگابایتی HBM2e است که به Intel Xeon Max اضافه شده اند.
بیشتر بخوانید: پردازنده اینتل Xeon Y با قابلیت تنظیم فرکانس برای شخصی سازی سرور