PDA

توجه ! این یک نسخه آرشیو شده میباشد و در این حالت شما عکسی را مشاهده نمیکنید برای مشاهده کامل متن و عکسها بر روی لینک مقابل کلیک کنید : مقاله جزئیات بیشتری از 6 هسته ای های اینتل



MAHDIAR
30th May 2010, 02:52 PM
در بخش سیستم هایی با چهار یا شمار بیشتری از پردازنده های x86 ، شرکت ای ام دی با عرضه پردازنده های خانواده Opteron رقابت سختی را با شرکت اینتل آغاز کرد. ایده استفاده از رابط HyperTransport و همچنين گنجاندن کنترل کننده حافظه درون پردازنده ، در سیستم های چند پردازنده ای و بویژه سیستم هایی که عملیات حافظه ای سنگینی دارند، برتری های قابل توجهی از خود نشان می دهند. از همین روی بوده که اینتل هم در معماری Nehalem همین راه ها را رفته . در Xeon های ویژه سیستم های چند پردازنده ای با چهار یا هشت پردازنده ، از معماری Nehalem EX استفاده می شود. در سپتامبر 2007 ، اینتل توانست با بستر Caneland و Xeonهای 7300 با Opteronهای ای ام دی برابری کند. Xeonهای چهار هسته ای بر پایه فناوری 65 نانومتری باید بتوانند با FSB های 1066 مگاهرتزی کار کنند. ارتباط میان پردازنده ها و حافظه هم از راه سری تراشه برقرار می شود. برای جلوگیری از ترافیک غیر ضروری روی گذرگاه ، بالاترین مدل های Xeonهای 7300 ، هشت مگابایت Cache سطح دوم دارند. این بافر ، ترافیک روی FSB را فیلتر کرده و از فشار کاری آن می کاهد. اینتل تلاش زیادی می کند تا از شمار دسترسی های کند به حافظه اصلی کم کند. این تلاش همچنان ادامه دارد و نتیجه اینکه در بستر کنونی Caneland پردازنده های Xeon 7400 ظاهر شده اند. این پردازنده ها 6 هسته ، 9 مگابایت Cache سطح دوم و 16 مگابایت Cache سطح سوم دارند. اینتل همه این ها را روی یک صفحه سیلیسیومی نسبتاً بزرگ جای داده. در این مقاله نتايج مقایسه Xeonهای X7460 با سرعت 66/2 گیگاهرتز را با Xeonهای 93/2 گیگاهرتزی X7350 و Opteron های 3/2 گیگاهرتزی 8356 می بینید. این مقایسه ها در پردازش های عدد صحیح ، ممیز شناور و کار سنگین با حافظه با حجم 48 گیگابایت انجام گرفته. همچنین سرعت اجرای برنامه های Java نیز مورد بررسی قرار گرفته.



جزئیات Xeon های شش هسته ای Dunnington

سازگاری پردازنده های XeonMP با نام Dunnington در خانواده 7400 با سوکت بستر Caneland حفظ شده. سرعت FSB هم در مقایسه با خانواده 7300 که 1066 مگاهرتز بود، بدون تغییر مانده است.

اینتل Xeonهای 7400 را با فناوری 45 نانومتری می سازد و هر شش هسته را روی یک صفحه سیلیسیومی کنار هم می گذارد. در مجموع در پردازنده Dunnington ، 9/1 میلیارد ترانزیستور روی یک صفحه 503 میلی متر مربعی کنار هم قرار گرفته اند. شش هسته به سه بخش دو هسته ای تقسیم شده اند و هر بخش یک Cache سطح دوم مشترک به گنجایش 3 مگابایت دارد. بنابراین ، این پردازنده در مجموع 9 مگابایت Cache سطح دوم دارد. همچنین هر شش هسته به یک Cache سطح سوم 16 گیگابایتی دسترسی دارند.

اینتل ، Dunnington را در آغاز با نام Xeon X7460 و با بسامد 66/2 گیگاهرتز عرضه کرد. سرعت بالاترین گونه های Xeonهای چهار هسته ای 7300 یعنی X7350 ، 93/2 گیگاهرتز است. اینتل عدد TDP را برای Xeonهای X7350 با سرعت 66/2 گیگاهرتز، 130 وات اعلام نموده است. گذشته از پردازنده X7460 ، Xeonهای E7450 و L7455 از دیگر نمونه های 6 هسته ای هستند. بسامد E7450 ، 4/2 گیگاهرتز است و 12 مگابایت Cache سطح سوم دارد. اینتل عدد TDP را برای این پردازنده ها ، 90 وات اعلام کرده است. L7455 که پردازنده کم مصرف تری است و Cache سطح سوم آن هم 12 مگابایت گنجایش دارد ، در سرعت 13/2 گیگاهرتز ، 65 وات انرژی مصرف می کند. اینتل همچنین چهار پردازنده از خانواده Xeonهای 7400 را با فناوری چهار هسته ای عرضه کرده که در مقایسه با گونه های 6 هسته ای یک بخش دو هسته ای کمتر دارند. در جدولی که در اینجا می بینید ، همه گونه های خانواده 7400 با شش هسته و گونه های خانواده 7300 در کنار هم آمده اند.






(وات)DTP
شمار هسته ها
Cache سطح سوم
Cache سطح دوم
بسامد
پردازنده

130
6
16 مگابایت
3 مگابایت ×3
66/2
Xeon X7460

90
6
12 مگابایت
3 مگابایت ×3
4/2
Xeon E7450

65
6
12 مگابایت
3 مگابایت ×3
13/2
Xeon L7455

90
4
16 مگابایت
3 مگابایت ×3
4/2
Xeon E7440

90
4
12 مگابایت
3 مگابایت ×3
13/2
Xeon E7430

90
4
8 مگابایت
3 مگابایت ×3
13/2
Xeon E7420

50
4
12 مگابایت
3 مگابایت ×3
13/2
Xeon L7445

130
4
-
8 مگابایت
93/2
Xeon X7350

50
4
-
8 مگابایت
86/1
Xeon L7345

80
4
-
8 مگابایت
4/2
Xeon E7340

80
4
-
6 مگابایت
4/2
Xeon E7330

80
4
-
4 مگابایت
13/2
Xeon E7320

80
4
-
4 مگابایت
6/1
Xeon E7310




CPU2006Integer: SPECint_rate_base2006

در این بخش ، Benchmarkهای SPEC در ویندوز سرویس دهنده 2008 نگارش x64 بررسی و برای Base-Rating کامپایل شده اند. برای این کار کامپایلرهای 64 بیتی IntelC++10.1 و Fortran10.1 و همچنین Visual Studio 2005.NET برای آزمای پردازش اعداد صحیح استفاده شده. لازم به ذکر است که کتابخانه های بهینه سازی شده برای این پردازنده ها به کار نرفته. در آزمایش توان پردازش اعداد صحیح در SPECint-rate-base2006 نمودارها هنگام استفاده از چند Task به بالاترین حد خود رسیده.

این نتایج ، توان بالای پردازش اعداد صحیح را هنگام کار با برنامه های استاندارد در حالت موازی ، تائید می کنند. معمولاً شمار کپی های در حال اجرای SPECint_rate_base2006 با شمار هسته پردازنده ها متناسب بوده.



CPU2006 Floating Point: SPECfp-rate-base2006

در این بخش SPEC-Benchmarks برای ويندوز سرویس دهنده 2008 در حالت 64 بیتی تنظیم و برای Base-Rating کامپایل شده. برای این کار هم از کامپایلرهای 64 بیتی Intel C++ 10.1 و Fortran 10.1 و Visual Studio 2005.NET برای آزمایش پردازش اعداد ممیز شناور استفاده شده. اینجا نیز کتابخانه های بهینه سازی شده برای پردازنده ها به کار نرفته. در آزمایش توان پردازش اعداد ممیز شناور هم SPECfp_rate_base2006 با اجرای چند Task ، نمودارها به بالاترین حد می رسند. کامپایلر Intel 10.1 با سوئیچ Q×0 از فرمان های SSE3 برای پردازنده های غیر اینتلی پشتیبانی می کند. این سوئیچ برای پردازنده های Opteron استفاده شده.



SPECjvm2008: Java Virtual Machine Performance

SPECjvm2008 بازدهي سیستم را هنگام اجرای Java Runtime Environment یا JRE ارزیابی می کند. گروه SPEC کدهای ویژه این بخش را با همکاری شرکت های ای ام دی ، Bea ، HP ، آی بی ام ، اینتل و سان آماده کرده .

در سرعت JVM گذشته از موتور جاوا (Java Engine) در درون پردازنده ، معماری حافظه نیز موثر است. SPECjvm2008 یک JVM به کار انداخته و یک Workload را در حالت Multithreaded اجرا می کند. SPECjvm همه هسته های پردازنده را به کار می گیرد و با کار در حالت Base-Run اجازه هیچ بهینه سازی و تنظیم خاصی نمی دهد. به این ترتیب بازدهی سیستم با همان JVM نصب شده ارزیابی می شود. در این کار ده آزمایش گوناگون مانند کامپایل کردن، render کردن ، رمزگذاری و فشرده سازی انجام می گیرد.



SPECPower ، بیشترین توان پردازش در Java

SPECpower_ssj2008 با به صددرصد رساندن فشار کار پردازنده گذشته از توان مصرفی ، میزان بازدهی سیستم در اجرای Java را نیز می سنجد. به عنوان Java-Engine در نگارش 64 بیتی ویندوز 2008 از Bea JRocket استفاده شده. Workload مورد استفاده SPECpower_ssj2008 با SPECjvm2008 تفاوت دارد. از این گذشته در SPECpower-ssh2008 چند jvm به کار انداخته می شود.



SPECPower ، نسبت میزان مصرف انرژی به توان پردازش

عدد نهایی حاصل از SPECpower_ssj2008 بازدهی مصرف انرژی کامپیوتر را روشن می کند. برای این کار ، بازدهی پردازنده پله به پله با فشارهای متفاوت اندازه گیری می شود. برای بهره مندی از کارکردهای صرفه جویی در مصرف انرژی در پردازنده ها، ویندوز سرویس دهنده 2008 ، حالت balanced را تدارک دیده. در آزمایش های این بخش ، عملکردهای SpeedStep(اینتل) و PowerNow!(ای ام دی) برای تنظیم بسامد و ولتاژ هسته بسته به فشار کاری پردازنده ، فعال بوده اند.



شکل 165



با انتخاب گزینه بالاترین قدرت در گزینه های مصرف انرژی ویندوز ، پردازنده ها پيوسته با بیشترین بسامد خود کار می کنند ، که در شکل بعدی نتیجه این کار را می بینید.



شکل 165 پائین



SPECPower ، منحنی های راندمان مصرف انرژی

منحنی های راندمان مصرف انرژی در SPECpower_ssj2008 مصرف انرژی را پله به پله محاسبه می کند. در این نمودارها هر چه توان پردازش بیشتر باشد ، راندمان مصرف انرژی آن بهتر است.



شکل 166 بالا



SPECPower ، بیشترین مصرف انرژی

SPECpower_ssj2008 ، با رساندن فشار کاری پردازنده به 100 درصد، بیشترین مصرف انرژی آن را بدست می آورد. همه هسته ها با تمام توان خود کار می کنند و JVMهای در حال کار هم حافظه را زير فشار می گذارند.



شکل 167 بالا



SPECpower ، پائین ترین مصرف انرژی

SPECpower_ssh2008 گذشته از بالاترین حد، پائین ترین میزان مصرف انرژی را هنگامی که پردازنده بی کار است ، نیز به دست می آورد.



شکل 167 پائین



نمودارهای مصرف انرژی در این بخش ، با انتخاب گزینه Balanced در تنظیمات مصرف انرژی نگارش 64 بیتی ویندوز 2008 به دست آمده اند. پردازنده ها هم از کارکردهای صرفه جویی در مصرف انرژی خود، استفاده کرده اند. سپس گزینه بالاترین قدرت در ویندوز 2008 انتخاب شده که توابع در مصرف انرژی پردازنده ها غیر فعال شده اند.



تحلیل نتایج با SunGard ACR

SunGard Adaptiv Credit Risk 1.0 یکی از برنامه های بررسی پردازنده است. این برنامه بر پايه شبیه سازی های مونت کارلو کار می کند و با C# در محیط .NET نوشته شده. SunGard ACR از کتابخانه های ریاضی ویژه مانند MKL محصول اینتل یا Core Math Library محصول ای ام دی استفاده نمی کند. این برنامه با استفاده از حالت Multithreading بخوبی از سیستم های چند پردازنده ای پشتیبانی می کند. SunGard هنگام پردازش عدد صحیح فشار زیادی به سیستم می آورد. همچنین میزان تبادل اطلاعات آن با حافظه نیز زیاد است.





نتیجه

اینتل با پردازنده های شش هسته ای خانواده Xeon X7460 ، در مقایسه با Opteron های ای ام دی به توان پردازش بالاتری دست پیدا کرده . این پردازنده ها به بهره مندی از Cache های بزرگ 9 و 16 مگابایتی در سطح دوم و سوم ، کاستی ذاتی و کلاسیک معماری اینتل را درباره FSB و ارتباط با حافظه از راه سری تراشه، برطرف کرده.

به این ترتیب ، Opteron برتری خود را در پردازش اعداد ممیز شناور نیز از دست داده. البته Opteron همچنان در برخی شرایط خاص ، در پردازش اعداد ممیز شناور توان برابری با Xeon های شش هسته ای از خود نشان می دهد که آن هم به بازدهی بهتر Opteron در کار با حافظه بر می گردد. در بحث توان پردازش اعداد صحیح، Xeonهای شش هسته ای نتایج نوینی به دست می دهند که البته تفاوت آن ها با Xeonهای چهار هسته ای چشمگیر نیست. در این میان رفتار برنامه ها در استفاده حداكثر از همه هسته ها نقش مهمی دارد. برای نمونه 3ds Max 2009 هنگام renderingنمی تواند از همه 24 هسته موجود در یک سیستم چهار پردازنده ای استفاده کند و شمار هسته های قابل پشتیبانی به 16 محدود می شود.

از نظر مصرف انرژی ، میان اینتل و ای ام دی تفاوت زیادی نیست. اگر چه شش هسته ای های اینتل در آزمایش Java-Performance توان بالاتری از خود نان می دهند، اما مصرف انرژی آن ها نیز بالاست.

MAHDIAR
30th May 2010, 02:52 PM
زیرنویس ها

Xeon 7400 با شش هسته بر پایه معماری 45 نانومتری Penryn ساخته شده، Xeonهای پیشین ، یعنی خانواده 7300 با فناوری 65 نانومتری ساخته شده اند.(159)

شش هسته Xeonهای Dunnington به سه بخش دو هسته ای تقسیم شده اند که هر بخش یک Cache سطح سوم به گنجایش 3 مگابایت دارد. یک Cache سطح سوم به گنجایش 16 مگابایت هم به طور مشترک در دسترس همه هسته هاست.(158)

SPECint_rate_base2006: چهار Xeon شش هسته ای بروشنی از بقیه جلوترند. البته باید توجه داشت که توان پردازش آن ها به خوبی پردازنده های ای ام دی، مقیاس پذیر نیست. همانگونه که می بینید چهار Opteron چهار هسته ای 3/2 گیگاهرتزی 94 درصد بهتر از دو Opteron چهار هسته ای 3/2 گیگاهرتزی کار می کنند. اگر چه چهار Xeon ، 95 درصد توان بیشتری در مقایسه با دو Xeon L5430 دارند اما توجه داشته باشید که شمار هسته های آن ها 24 در برابر 8 است.(162)

SPECfp_rate_base2006 : این آزمایش که حافظه را با پردازش اعداد ممیز شناور به شدت زیر فشار می گذارد روی چهار Xeon X7460 در مقایسه با چهار Opteron ، 22 درصد سريعتر اجرا می شود. Xeonهای شش هسته ای به لطف گنجایش زیاد Cache، کاستی خود را در کنترل کننده حافظه يكپارچه با پردازنده در مقایسه با محصولات ای ام دی پوشش داده اند. البته Opteron در بسامدهای پائین تر فاصله کمتری با Xeon دارد.(163 بالا)

Xeonهای شش هسته ای برنامه های Java را 14 درصد سریعتر از Xeonهای چهار هسته ای اجرا می کنند.(163 پائین)

چهار Xeon شش هسته ای در اجرای برنامه های Java از بقیه جلوترند. چهار Xeon شش هسته ای در مقایسه با دو Xeon چهار هسته ای 66/2 گیگاهرتزی ، 75 درصد سریعتر است. اما مقیاس پذیری Opteron بهتر است به گونه ای که چهار پردازنده Opteron ، 115 درصد سریعتر از دو Opteron کار می کنند. برتری Opteron ها در مقیاس پذیری به دلیل وجود کنترل کننده حافظه در درون آنهاست.(164)

اگر چه چهار پردازنده Xeon برنامه های Java را 42 درصد سریعتر از چهار پردازنده Opteron اجرا می کنند اما مصرف انرژی آن ها تقریباً برابر است.(165 بالا)

با از کار انداختن Power Now! در پردازنده های Opteron بازدهی مصرف انرژی 5 درصد پائین می آید. Xoen هم با Speed Step انرژی بیشتری مصرف می کند (165 پائین)

SpeedStep در فشار کاری 20 تا 50 درصد در چهار Xeon شش هسته ای X7460 با سرعت 66/2 گیگاهرتز حدود دو درصد بازدهی مصرف انرژی را بالا می برد. (166 بالا)

PowerNow! در فشار کاری صفر تا 50 درصد تاثیر خوبی دارد. اگر 10 درصد به فشار کاری پردازنده اضافه شود ، PowerNow! در چهار Opteron 8356 ، با سرعت 3/2 گیگاهرتز ، بازدهی مصرف انرژی را 12 درصد بالا می برد(166 پائین)

Xeonهای شش هسته ای در مقایسه با Opteronها ، انرژی بیشتری مصرف می کنند.(167 بالا)

Xeon ها در حالت بی کار تنها 32 درصد انرژی کمتری مصرف می کنند اما کاهش مصرف انرژی در Opteronها به 50 درصد می رسد (167 پائین)

Xeonهای X7460 در مقایسه با X7350 در حالت بيكار ، 2 وات انرژی بیشتری مصرف می کنند اما تفاوت مصرف انرژی Opteron ها بدون PowerNow! ، 22 وات است.(168 بالا)

چهار Xeon شش هسته ای با سرعت 93/2 گیگاهرتز در مقایسه با چهار Xeon چهار هسته ای با سرعت 93/2 گیگاهرتز ، 12 درصد سریعتر کار می کنند(168 پائین)

استفاده از تمامی مطالب سایت تنها با ذکر منبع آن به نام سایت علمی نخبگان جوان و ذکر آدرس سایت مجاز است

استفاده از نام و برند نخبگان جوان به هر نحو توسط سایر سایت ها ممنوع بوده و پیگرد قانونی دارد