MAHDIAR
23rd January 2010, 11:36 AM
رقابت با ابررایانه ها به کمک نیروی پردازش ترافلاپ کارت های گرافیکی (http://www.ramehr.com/?p=3586)
1bahman (http://www.ramehr.com/?cat=3)
mahdiarاخبار سخت افزار
یکی از بزرگترین اهداف شرکت های تولیدکننده دارای فناوری پیشرفته، شگفت زده کردن مصرف کنندگان و کاربران خود با گنجانیدن توانایی ها و کارآیی هایی بیش از حد تصور و انتظار آنها در محصولاتشان است و البته این کار آسانی نیست. این موضوعی است که در مورد radeon سری ۴۸۰۰ کارت های گرافیکی شرکت ati/amd اتفاق افتاد و حتی کارکنان و طراحان و مهندسان خود آن شرکت را از نتیجه نهایی محصول تولید شده، دچار حیرت کرد. نمونه های ابتدایی این کارت ها، رادئون ۴۸۵۰ hd و ۴۸۷۰ hd و در ادامه ۲×۴۸۵۰ hd و ۲×۴۸۷۰ hd ، هر کدام متشکل از ۲واحد پردازشگر گرافیکی یا gpu هستند اما در طرح ساختار کارتهای جدید ati ، معماری جدید gpu 770rv به کار رفته است. در مورد این طراحی معماری گرافیکی، عمده تمرکز مهندسان ati بر ارتقا و بهبود کارآیی آن بر مبنای هر وات انرژی مصرفی و همچنین کارآیی در تناسب با هر میلی مترمربع از اندازه ابعاد صفحه سیلیکونی کوچک سازنده آن بود که این روند با سری۳۸۰۰ آغاز شد و به سری ۴۸۰۰ رسید.
مقایسه صفحات سیلیکونی سازنده شرکت /amd at i خلاف کارت های گرافیکی سری ۰ ۸ ۲ g t x شرکت رقیب، انویدیا، استفاده از اندازه صفحه سیلیکونی کوچکتر از ۲۶۰میلی متر مربعی متشکل از ۹۵۶میلیون ترانزیستور را برگزید (در حالی که انویدیا، بزرگترین واحد پردازنده گرافیکی را که تاکنون ساخته شده با اندازه ۵۷۶میلی متر مربع و متشکل از ۴/۱بیلیون ترانزیستور به کار برده است.) همچنین ati ، پایگاه فناوری و مرحله تولید ۵۵میکرونی را در مقابل مرحله ۶۵نانومتری انویدیا انتخاب کرد. استفاده از صفحه سیلیکونی کوچکتر موجب شد تا ati ، قادر به فشرده کردن تعداد بیشتری تراشه در قالب ویفر (wafer) و پایین آوردن قیمت این کارت های گرافیکی شود. در ابتدا ati اندازه صفحه سیلیکونی سری۳۸۰۰ را به نصف اندازه سری۲۹۰۰ رسانید و در ادامه با افزایش ناچیز اندازه صفحه سیلیکونی، آن را از ۱۹۰میلی متر مربع در سری۲۹۰۰ به ۲۶۰میلی متر مربع در سری۴۸۰۰ افزایش داد که استعداد و قابلیتی عظیم در پهنای باند و کارآیی قابل انتظاری را به همراه نگه داشتن آنها در سطح مناسبی از قیمت به همراه آورد.
استفاده از ۵ gddr ati تصمیم گرفت تا حافظه ۵gddr را به ساختار کارت های گرافیکی بردهای گرافیک۴۸۷۰ وارد و معرفی کند (کارت های گرافیکی ۴۸۵۰ با استفاده از حافظه استاندارد ۳ gddr ساخته می شوند.) این امر برای رسیدن به درجه بالایی از کارآیی که در کارت های ۴۸۷۰ وجود دارد، لازم بود و هیچ راه دیگری برای رسیدن به پهنای باند لازم، بدون افزایش اندازه خود صفحه سیلیکونی و قیمت آن وجود نداشت.
واحدهای بافت واحد پردازشگر گرافیکی ۷۷۰rv در بردارنده ۴ واحد آدرس و ۴ واحد فیلتر بافت۱ است و نرخی یک به یک را به وجود می آورد که برای اجتناب از مشکلات زمان درنگ لازم است. ۷۷۰rv قادر است تا ۱۶۰کشش جریان در هر سیکل ساعت را ارائه دهد. در این پردازشگر گرافیکی هر یک ازحافظه های نهان بافت ۱l با یک واحد بافت در ارتباط است. هر حافظه نهان ۱l مقدار پهنای باندی معادل ۴۸۰گیگابایت بر ثانیه را ارائه می دهد. با همتراز بودن هر ۱l ، هر simd و هر واحد بافت در یک ردیف، ati مدعی است (بر اساس کاری که در گذشته با ۶۷۰rv کرده بود) در اینجا فضای ذخیره داده موثر را در واحد حافظه نهان ۱l ، ۲برابر کرده است.
حافظه نهان ۲ l هر ۴ ناحیه حافظه نهان ۲l با هر ۴ کنترلر حافظه در یک ردیف، همتراز هستند. ۷۷۰rv پهنای باندی معادل ۳۸۴گیگابایت بر ثانیه را بین ناحیه های حافظه نهان ۱l و ۲l ارائه می دهد. حافظه نهان ۲l بر اساس تفکیک پارتیشن های حافظه، به ۲ نیمه منشعب شده است. موفقیت حاصله از بهره برداری از این نسل سودمند بسیار بالا است و حافظه نهان ۲l نرخ بسیار خوبی را فراهم می آورد.
واحدهای جاری پردازش و هسته های simd در ترکیب پارتیشن بندی بالایی، هر هسته simd متشکل از ۱۶پردازشگر جاری کننده(streaming)است.یکناحیه حافظه مشترک محلی و یک واحد بافت. همچنین هر هسته simd به یک حافظه نهان ۱l دسترسی دارد. در ترکیب بندی پایینی در داخل هر هسته در درون هر یک از پردازشگرهای جریان دار نیز ۵ واحد پردازش جریان (spu( 2 یک انشعاب واحد اجرایی و ثبات ها (رجیسترها) قرار دارند. بخش درونی ۷۷۰rv دربردارنده ۱۰ هسته simd است که از ۸۰۰ spu در هر تراشه (در مقایسه با ۳۲۰ واحد پردازش جریان در ۶۷۰(rv بهره می برد. در ۶۷۰rv تنها یکی از ۵ spu ، توانایی اجرای محاسبه ریاضی عدد صحیح را داشت (آن spu واحد fat نامیده می شود) اما در نسل جدید هر ۵ spu محاسبه ریاضی عدد صحیح را جهت کارکرد بهتر با نرم افزار کاربردی ۱۰٫۱ directx انجام می دهند.
مبارزه فناوری switched hub و ring bus در واحد پردازشگر گرافیکی جدید ۷۷۰rv ، فناوری گذرگاه عمومی حلقوی که در نسخه هایی از ۶۷۰rv استفاده شده بود، کنار گذاشته شد. معماری ۷۷۰rv ، فناوری قطب مرکزی دارای هاب سوییچ دار را به همراه یک طراحی توزیع یافته برای حرکت داده به کار برد. با انتقال تنظیم کننده ها به زوایایی در گوشه های تراشه، آنها به وضعیتی که بیشترین پهنای باند تراشه را استفاده می کند، نزدیکتر شدند. عملکرد ضعیف گذرگاه حلقوی در ارائه پهنای باند داده، موجب اتلاف انرژی می شد اما در ۷۷۰rv شاهد بهینه سازی مصرف انرژی و کاهش زمان درنگ هستیم. با استفاده از یک تنظیم کننده حافظه توزیع یافته بدون نیاز به گذرگاه حلقوی و ۱۰هسته simd که در یک ردیف همتراز در مرکز یک قطعه سیلیکونی قرار گرفته اند و با داشتن امکان کنترل منطقی روی آنها، زوایای گوشه ها درست جایی است که نیاز است تا عناصر اساسی i/o در آن مکان باشند.
مدیریت انرژی پویا در سری ۴۸۰۰ از یک ریزتنظیم کننده روی تراشه، برای کنترل بصری با کمترین نیاز به مدیریت گرداننده ها و نرم افزار استفاده شده است. ati مدعی است با این سیستم مدیریت برق و دیگر اصلاحات انجام شده بر این تراشه، کارآیی آن بر مبنای وات ۲برابر سری ۳۸۰۰ و ۴برابر سری ۲۹۰۰ خواهد بود. ریزتنظیم کننده می تواند مدیریت انرژی را با کاهش دادن سرعت ساعت حافظه و پایین آوردن ولتاژ و تنظیم فن سرمایش کنترل کند. clock gating یک اصل مهارتی کاهش مصرف برق از طریق غیرفعال کردن بخش های امنیتی تراشه که مورد استفاده قرار نگرفته اند، است و اجرای آن در سری ۴۸۰۰، صرفه جویی در مصرف برق را در زمانی که حداقل ارائه و انتقال محتوا یا رندر گرافیکی مورد نیاز است، به همراه داشته است.
قدرت پردازش ترافلاپی و بالاترین حد کارآیی نتیجه همه این تغییرات، به وجود آمدن نسلی از کارت های گرافیکی بوده که در همه ابعاد، از قدرتی فوق العاده برخوردارند که توانایی عملیاتی ۱تریلیون ممیزشناور در هر ثانیه، قدرت پردازش باورنکردنی حداقل ۱ترافلاپ۳ بر ثانیه برای کارت های سری ۴۸۰۰، به همراه بهبود در هر دو کارآیی ذکر شده در ابتدای مطلب را به آسانی ممکن ساخته است.
جمع بندی برتری قابل ملاحظه این کارت های گرافیکی از نظر کارآیی بر مبنای واحد وات و تمرکز طراحی مهندسی در مورد آنها بر ایجاد کارایی در همه ابعاد به همراه استفاده از فناوری واحد پردازش گرافیکی ۷۷۰ rv و حافظه ۵gddr برای ati ، نکته کلیدی و رمزموفقیت این شرکت بود که حاصل آن یک جهش بلند رو به جلو بود و باعث جلو افتادن ati از دیگر رقیبان شد.
جام جم آنلاین
http://img.zemanta.com/pixy.gif?x-id=36ed1254-827e-81dd-a982-d102e11e59d8
1bahman (http://www.ramehr.com/?cat=3)
mahdiarاخبار سخت افزار
یکی از بزرگترین اهداف شرکت های تولیدکننده دارای فناوری پیشرفته، شگفت زده کردن مصرف کنندگان و کاربران خود با گنجانیدن توانایی ها و کارآیی هایی بیش از حد تصور و انتظار آنها در محصولاتشان است و البته این کار آسانی نیست. این موضوعی است که در مورد radeon سری ۴۸۰۰ کارت های گرافیکی شرکت ati/amd اتفاق افتاد و حتی کارکنان و طراحان و مهندسان خود آن شرکت را از نتیجه نهایی محصول تولید شده، دچار حیرت کرد. نمونه های ابتدایی این کارت ها، رادئون ۴۸۵۰ hd و ۴۸۷۰ hd و در ادامه ۲×۴۸۵۰ hd و ۲×۴۸۷۰ hd ، هر کدام متشکل از ۲واحد پردازشگر گرافیکی یا gpu هستند اما در طرح ساختار کارتهای جدید ati ، معماری جدید gpu 770rv به کار رفته است. در مورد این طراحی معماری گرافیکی، عمده تمرکز مهندسان ati بر ارتقا و بهبود کارآیی آن بر مبنای هر وات انرژی مصرفی و همچنین کارآیی در تناسب با هر میلی مترمربع از اندازه ابعاد صفحه سیلیکونی کوچک سازنده آن بود که این روند با سری۳۸۰۰ آغاز شد و به سری ۴۸۰۰ رسید.
مقایسه صفحات سیلیکونی سازنده شرکت /amd at i خلاف کارت های گرافیکی سری ۰ ۸ ۲ g t x شرکت رقیب، انویدیا، استفاده از اندازه صفحه سیلیکونی کوچکتر از ۲۶۰میلی متر مربعی متشکل از ۹۵۶میلیون ترانزیستور را برگزید (در حالی که انویدیا، بزرگترین واحد پردازنده گرافیکی را که تاکنون ساخته شده با اندازه ۵۷۶میلی متر مربع و متشکل از ۴/۱بیلیون ترانزیستور به کار برده است.) همچنین ati ، پایگاه فناوری و مرحله تولید ۵۵میکرونی را در مقابل مرحله ۶۵نانومتری انویدیا انتخاب کرد. استفاده از صفحه سیلیکونی کوچکتر موجب شد تا ati ، قادر به فشرده کردن تعداد بیشتری تراشه در قالب ویفر (wafer) و پایین آوردن قیمت این کارت های گرافیکی شود. در ابتدا ati اندازه صفحه سیلیکونی سری۳۸۰۰ را به نصف اندازه سری۲۹۰۰ رسانید و در ادامه با افزایش ناچیز اندازه صفحه سیلیکونی، آن را از ۱۹۰میلی متر مربع در سری۲۹۰۰ به ۲۶۰میلی متر مربع در سری۴۸۰۰ افزایش داد که استعداد و قابلیتی عظیم در پهنای باند و کارآیی قابل انتظاری را به همراه نگه داشتن آنها در سطح مناسبی از قیمت به همراه آورد.
استفاده از ۵ gddr ati تصمیم گرفت تا حافظه ۵gddr را به ساختار کارت های گرافیکی بردهای گرافیک۴۸۷۰ وارد و معرفی کند (کارت های گرافیکی ۴۸۵۰ با استفاده از حافظه استاندارد ۳ gddr ساخته می شوند.) این امر برای رسیدن به درجه بالایی از کارآیی که در کارت های ۴۸۷۰ وجود دارد، لازم بود و هیچ راه دیگری برای رسیدن به پهنای باند لازم، بدون افزایش اندازه خود صفحه سیلیکونی و قیمت آن وجود نداشت.
واحدهای بافت واحد پردازشگر گرافیکی ۷۷۰rv در بردارنده ۴ واحد آدرس و ۴ واحد فیلتر بافت۱ است و نرخی یک به یک را به وجود می آورد که برای اجتناب از مشکلات زمان درنگ لازم است. ۷۷۰rv قادر است تا ۱۶۰کشش جریان در هر سیکل ساعت را ارائه دهد. در این پردازشگر گرافیکی هر یک ازحافظه های نهان بافت ۱l با یک واحد بافت در ارتباط است. هر حافظه نهان ۱l مقدار پهنای باندی معادل ۴۸۰گیگابایت بر ثانیه را ارائه می دهد. با همتراز بودن هر ۱l ، هر simd و هر واحد بافت در یک ردیف، ati مدعی است (بر اساس کاری که در گذشته با ۶۷۰rv کرده بود) در اینجا فضای ذخیره داده موثر را در واحد حافظه نهان ۱l ، ۲برابر کرده است.
حافظه نهان ۲ l هر ۴ ناحیه حافظه نهان ۲l با هر ۴ کنترلر حافظه در یک ردیف، همتراز هستند. ۷۷۰rv پهنای باندی معادل ۳۸۴گیگابایت بر ثانیه را بین ناحیه های حافظه نهان ۱l و ۲l ارائه می دهد. حافظه نهان ۲l بر اساس تفکیک پارتیشن های حافظه، به ۲ نیمه منشعب شده است. موفقیت حاصله از بهره برداری از این نسل سودمند بسیار بالا است و حافظه نهان ۲l نرخ بسیار خوبی را فراهم می آورد.
واحدهای جاری پردازش و هسته های simd در ترکیب پارتیشن بندی بالایی، هر هسته simd متشکل از ۱۶پردازشگر جاری کننده(streaming)است.یکناحیه حافظه مشترک محلی و یک واحد بافت. همچنین هر هسته simd به یک حافظه نهان ۱l دسترسی دارد. در ترکیب بندی پایینی در داخل هر هسته در درون هر یک از پردازشگرهای جریان دار نیز ۵ واحد پردازش جریان (spu( 2 یک انشعاب واحد اجرایی و ثبات ها (رجیسترها) قرار دارند. بخش درونی ۷۷۰rv دربردارنده ۱۰ هسته simd است که از ۸۰۰ spu در هر تراشه (در مقایسه با ۳۲۰ واحد پردازش جریان در ۶۷۰(rv بهره می برد. در ۶۷۰rv تنها یکی از ۵ spu ، توانایی اجرای محاسبه ریاضی عدد صحیح را داشت (آن spu واحد fat نامیده می شود) اما در نسل جدید هر ۵ spu محاسبه ریاضی عدد صحیح را جهت کارکرد بهتر با نرم افزار کاربردی ۱۰٫۱ directx انجام می دهند.
مبارزه فناوری switched hub و ring bus در واحد پردازشگر گرافیکی جدید ۷۷۰rv ، فناوری گذرگاه عمومی حلقوی که در نسخه هایی از ۶۷۰rv استفاده شده بود، کنار گذاشته شد. معماری ۷۷۰rv ، فناوری قطب مرکزی دارای هاب سوییچ دار را به همراه یک طراحی توزیع یافته برای حرکت داده به کار برد. با انتقال تنظیم کننده ها به زوایایی در گوشه های تراشه، آنها به وضعیتی که بیشترین پهنای باند تراشه را استفاده می کند، نزدیکتر شدند. عملکرد ضعیف گذرگاه حلقوی در ارائه پهنای باند داده، موجب اتلاف انرژی می شد اما در ۷۷۰rv شاهد بهینه سازی مصرف انرژی و کاهش زمان درنگ هستیم. با استفاده از یک تنظیم کننده حافظه توزیع یافته بدون نیاز به گذرگاه حلقوی و ۱۰هسته simd که در یک ردیف همتراز در مرکز یک قطعه سیلیکونی قرار گرفته اند و با داشتن امکان کنترل منطقی روی آنها، زوایای گوشه ها درست جایی است که نیاز است تا عناصر اساسی i/o در آن مکان باشند.
مدیریت انرژی پویا در سری ۴۸۰۰ از یک ریزتنظیم کننده روی تراشه، برای کنترل بصری با کمترین نیاز به مدیریت گرداننده ها و نرم افزار استفاده شده است. ati مدعی است با این سیستم مدیریت برق و دیگر اصلاحات انجام شده بر این تراشه، کارآیی آن بر مبنای وات ۲برابر سری ۳۸۰۰ و ۴برابر سری ۲۹۰۰ خواهد بود. ریزتنظیم کننده می تواند مدیریت انرژی را با کاهش دادن سرعت ساعت حافظه و پایین آوردن ولتاژ و تنظیم فن سرمایش کنترل کند. clock gating یک اصل مهارتی کاهش مصرف برق از طریق غیرفعال کردن بخش های امنیتی تراشه که مورد استفاده قرار نگرفته اند، است و اجرای آن در سری ۴۸۰۰، صرفه جویی در مصرف برق را در زمانی که حداقل ارائه و انتقال محتوا یا رندر گرافیکی مورد نیاز است، به همراه داشته است.
قدرت پردازش ترافلاپی و بالاترین حد کارآیی نتیجه همه این تغییرات، به وجود آمدن نسلی از کارت های گرافیکی بوده که در همه ابعاد، از قدرتی فوق العاده برخوردارند که توانایی عملیاتی ۱تریلیون ممیزشناور در هر ثانیه، قدرت پردازش باورنکردنی حداقل ۱ترافلاپ۳ بر ثانیه برای کارت های سری ۴۸۰۰، به همراه بهبود در هر دو کارآیی ذکر شده در ابتدای مطلب را به آسانی ممکن ساخته است.
جمع بندی برتری قابل ملاحظه این کارت های گرافیکی از نظر کارآیی بر مبنای واحد وات و تمرکز طراحی مهندسی در مورد آنها بر ایجاد کارایی در همه ابعاد به همراه استفاده از فناوری واحد پردازش گرافیکی ۷۷۰ rv و حافظه ۵gddr برای ati ، نکته کلیدی و رمزموفقیت این شرکت بود که حاصل آن یک جهش بلند رو به جلو بود و باعث جلو افتادن ati از دیگر رقیبان شد.
جام جم آنلاین
http://img.zemanta.com/pixy.gif?x-id=36ed1254-827e-81dd-a982-d102e11e59d8