بررسی کارت گرافیک GTX 1080 انویدیا – قسمت اول

خرید بک لینک

معرفی کارت گرافیک جدید انویدیا، GTX1080 یکی از مهمترین رویدادهای صنعت گیمینگ در روزهای گذشته بوده و تمام کارشناسان و البته خورههای بازی منتظر دسترسی به نمونهای از این محصول برای بررسی آن بودهاند. برای بررسی قدم به قدم این پرچمدار قدرتمند با زومجی همراه باشید.

مقالات مرتبط

پس از انتشار اخبار و گمانهزنیهای فراوان در مورد نسل جدید معماری گرافیکی انویدیا و بالا گرفتن بحث بر سر مشخصات اولین کارتهای در نظر گرفته شده برای عرضه بر اساس آن، انتظارات به پایان رسید و انویدیا طی مراسمی رسمی اولین محصولات گیمینگ معماری پاسکال (همچون نسلهای گذشته بر گرفته شده از نام ریاصیدانان مشهوری مانند مَکسول و کپلر) با نامهای GTX 1080 و GTX 1070 را رونمایی کرد و مشخصات کلی و قیمت آنها را هم اعلام نمود.

در این مقاله سعی میکنیم ضمن معرفی مشخصات و قابلیتهای فنی تراشهی جدید، به تکنیکهای جدید معرفی شده با این معماری نیز بپردازیم و کارکرد و استفادهی هر یک را بیان کنیم. برخی از این قابلیتها فقط در معماری پاسکال قابل استفاده خواهند بود و برخی نیز ممکن است از طریق بروز رسانی درایور گرافیکی با کارتهای نسل قبلی جیفورس کار کنند. به خاطر داشته باشید این مشخصات بر اساس مدل مرجع انویدیا یا همان مدلی که Founders Edition نام گرفته بیان میشود و برخی مشخصههای فنی مانند فرکانس کاری GPU و همین طور فرکانس کاری تراشههای حافظه در مدلهای اختصاصی متفاوت از این ارقام خواهد بود.

GTX1080notes_MG_3864

شاید به خاطر داشته باشید که اولین محصول معماری پاسکالِ انویدیا نه یک کارت گرافیک بازی، بلکه یک کارت محاسباتی قدرتمند با نام Tesla P100 بود که بر اساس تراشهی پاسکال بزرگ یا همان GP100 ساخته شده است و شامل تمام هستههای پردازشی در نظر گرفته شده با قابلیت (single precision (FP32 و (Double precision (FP64 در این تراشه است که در مجموع شامل ۳۸۴۰+۱۹۲۰ واحد CUDA و ۲۴۰ واحد ترسیم بافت یا TU میشود. البته Tesla P100 از فناوری حافظهی HBM2 هم پشتیبانی میکند که با این تفسیر اگر قرار باشد انویدیا یک محصول گیمینگ را هم بر پایهی تراشهی GP100 عرضه کند قاعدتا باید حافظهی HBM2 داشته باشد و نه حافظههای GDDR5 معمولی یا GDDR5X، چرا که به کنترلر حافظهی متفاوتی در خودِ GPU نیاز خواهد داشت.

فناوری ساخت ۱۶ نانومتری

مقالهی مرتبط

انویدیا با وجود در دست داشتن معماری جدید با واحدهای بیشتر و راندمان بهینهتر، یک چالش کاملا جدی و بزرگ را نیز پشت سر گذاشت که اثبات موفقیتش همین عرضهی کارت GTX 1080 بود و این چالش چیزی نبود جز فناوری ساخت جدیدِ ۱۶ نانومتری. اگر مقالهی قبلی ما در مورد معرفی محصولات تجاری پاسکال را خوانده باشید، در آنجا اهمیت این موضوع را به تفضیل شرح دادیم. هم انویدیا و هم ایامدی از سال ۲۰۱۱ میلادی از معماری ۲۸ نانومتری در تراشههای خود استفاده کردهاند و تلاش برای دستیابی به فناوری ۲۰ نانومتری در دو سال گذشته هم ناکام ماند، اما امسال و در میانهی سال ۲۰۱۶ میلادی، ظرفیت و کیفیت تولید کارخانهی TSMC (سازندهی نیمه هادیها و تراشههای مبتنی بر آن که ساخت سفارشات Nvidia و AMD را بر عهده دارد) در پروسهی ساخت ۱۶ نانومتری به حدی بالغ شده که میتوان محصولات تجاری جدید را به صورت انبوه و کیفیت مناسب تولید و عرضه کرد. فناوری جدید ۱۶ نانومتری با نام FinFET نوعی روش بهینهی تولید برای کاهشِمصرف توان، کاهش ولتاژ و همینطور کاهش نشتی ترانزیستورها در این ابعاد است. انویدیا پس از مدتها به کمک این فناوری توانسته به طرز چشمگیری فرکانس کاری تراشههای پاسکال را نسبت به مکسول و کپلر افزایش و در عین حال ابعاد تراشه و میزان مصرف آنها را کاهش دهد.

NVIDIA 16nm

استفاده از GDDR5X

علاوه بر پروسهی ساخت جدید و افزایش فرکانس کاری، انویدیا برای اولین بار در این محصول از تراشههای حافظهی GDDR5X استفاده کرده است. این تراشههای حافظه با استاندارد جدید به تازگی توسط شرکت میکرون (یکی از بزرگترین سازندگان تراشههای حافظه در دنیا) به تولید انبوه رسیدهاند و بر خلاف حافظههای HBM، بدون تغییرات اساسی در نحوهی ارتباط با GPU و تغییر در کنترلر حافظهی آن میتوانند سرعت و پهنای باند بیشتری را برای کارت گرافیک فرآهم کنند. کارت GTX 1080 با این که مانند GTX 980 از گذرگاه حافظهی ۲۵۶ بیتی استفاده میکند، با کمک تراشههای GDDR5X توانسته پهنای باند حافظهای نزدیک به کارت ۳۸۴ بیتی GTX 980Ti فرآهم کند و این به تنهایی پیشرفت قابل توجهی محسوب میشود. این روزها با افزایش کاربرد نمایشگرهای بزرگتر و یا ترکیب چند گانهی آنها، پهنای باند حافظهی بیشتر اهمیت بالاتری هم پیدا میکند. در مقام مقایسه، GTX 1080 با استفاده از GDDR5X با سرعت انتقال دادهای ۱۰ گیگابیت بر ثانیه توانسته ۴۳ درصد پهنای باند بیشتری نسبت به GTX 980 فرآهم کند و با احتساب برخی بهبودهای صورت گرفته در الگوریتمهای فشرده سازی حافظه، در مجموع شاهد افزایش ۱.۷ برابری نسبت به GTX 980 هستیم.

GDDR5X ZoomG

مشخصات فنی GTX 1080

در تراشهی ردهی جیفورسِ معماری پاسکال، انویدیا تصمیم گرفته با حذف واحدهای Double Precision از واحدهای CUDA که برای بازیها مد نظر نیست و بیشتر در محاسبات علمی پیچیده کاربرد دارد، تعداد آنها را هم از مجموع ۳۸۴۰ واحد FP32 در تراشهی پاسکال بکار رفته در Tesla P100، به ۲۵۶۰ واحد کاهش داده و از پیچیدگی بی دلیل تراشه بکاهد و ضمنا هزینههای ساخت را هم کاهش دهد. تراشهی بدست آمده GP104-400-A1 نامیده میشود.

کارت مرجع یا اگر دقیقتر بگوییم مدل Founders Edition انویدیا از GTX 1080 با سرعت ساعتهای کاری پیش فرض میتواند راندمان ۹ ترافلاپس را برای محاسبات single precision مهیا کند، در حالی که این میزان در مدل مرجع همرده در نسل پیشین یعنی GTX 980 برابر با ۴.۶۱ ترافلاپس بود و حتی از توان ۶.۴ ترافلاپسی کارت رده بالاتر GTX 980Ti هم بسیار بیشتر است. طبیعی است که این کارت با استاندارد PCI-Express 3.0 کار میکند و حداکثر توان ۱۸۰ وات را در بدترین سناریو و حداقل بین ۵ تا ۱۰ وات را در حالت بیکار مصرف میکند.

GeForceGTX 1080GTX 1070GTX Titan X GTX 980 TiGTX 980
تراشهی گرافیکیGP104-400-A1GP104-200-A1GM200GM200GM204
معماریPascalPascalMaxwellMaxwellMaxwell
تعداد ترانزیستور7.2 Billion7.2 Billion8 Billion8 Billion5.2 Billion
پروسهی ساختTSMC 16 nmTSMC 16 nmTSMC 28 nmTSMC 28 nmTSMC 28 nm
تعدادهستههای CUDA25601920307228162048
تعداد واحدهای SMX2015242216
تعداد واحدهای ROPs6464969664
فرکانس پایهی تراشه1,607 MHz1,506 MHz1,002 MHz1,002 MHz1,127 MHz
فرکانس توربوی تراشه1,733 MHz1,683 MHz1,076 MHz1,076 MHz1,216 MHz
فرکانس حافظه1,250 MHz2,000 MHz1,753 MHz1,753 MHz1,753 MHz
اندازهی حافظه8 GB8 GB12 GB6 GB4 GB
عرض باند گذرگاه حافظه256-bit256-bit384-bit384-bit256-bit
پهنای باند حافظه 320 GB/s256 GB/s337 GB/s337 GB/s224 GB/s
راندمان محاسبات اعشاری 9.0 TFLOPS6.45 TFLOPS7.0 TFLOPS 6.4 TFLOPS 4.61 TFLOPS
سقف حرارتی تراشه94 C94 C91C91C95 C
توان مصرفی180 Watts150 Watts250 Watts250 Watts165 Watts
قیمت599/699$379/449$999$699$549$

پشتیبانی از نمایشگرهای HDR

انویدیا اکنون به طور کامل از قابلیت High Dynamic Rang یا به اختصار HDR پشتیبانی میکند. با این قابلیت میتوان طیف رنگی گستردهتر و رنگهای طبیعیتر، کنتراست بیشتر، روشنایی بالاتر و محتوای زندهتری را در فیلمها و بازیها انتظار داشت. نمایشگرهای دارای این قابلیت از امسال در مرحلهی تولید انبوه قرار خواهند گرفت و ابتدا تلویزیونها و سپس مانیتورها با این قابلیت در دسترس خواهند بود. پنلهای HDR قادر به نمایش رنگهای سیاه با عمق رنگ OLEDها و روشناییهای درخشان با کیفیت نمایش LCD های رایج خواهند بود و کنتراست به مراتب بالاتری نسبت به نمایشگرهای فعلی و نزدیک به حد تشخیص چشمان انسان خواهند داشت. انویدیا خواسته تا پیشاپیش این امکان را در محصولش آمادهی استفاده داشته باشد. در همین راستا هم پاسکال از استاندارد رمزگشایی و رمزگذاری یا Codec جدید 10bit-HEVC برای استریم و پخش محتوای HDR پشتیبانی میکند.

HDR ZoomG

فشرده سازی رنگ بهبود یافته

پیش از این از بهبودهای صورت گرفته در الگوریتمهای فشرده سازی حافظه سخن به میان آمد. اما این تکنیکها چیستند و چه کارکردی دارند؟ در واقع این تکنیکها را میتوان روشهایی برای صرفه جویی بیشتر در پهنای باند حافظه محسوب کرد که فشرده سازی رنگها یکی از این روشها است. بخش فشرده سازی در تراشهی گرافیکی به صورت پویا بهترین راه را از بین الگوریتمهای مختلف برای فشرده سازی انتخاب میکند. مهمترین الگوریتم Delta Color Compression نام دارد که تفاوت میان پیکسلها را در قالب بلاکهایی محاسبه کرده و آنها را به عنوان مجموعههای مرجع پیکسلی در نظر میگیرد و در مورد پیکسلهای غیر مرجع، تنها اطلاعات دلتای آنها را با بلاک مرجع ذخیره میکند. به این ترتیب دیتای حاصل شده به نصف تقلیل پیدا میکند و اصطلاحا 2:1 Compression خوانده میشود.

Delta Color Copression

حالا در پاسکال نه تنها الگوریتم فشرده سازی ۲ به ۱ بهبود یافته، بلکه الگوریتمهای جدیدتر ۴ به ۱ و همین طور ۸ به ۱ هم برای فشرده سازی رنگها معرفی شدهاند که تا حد بسیار بیشتر و با تلفیق روشهای قبلی فضای ذخیره سازی مورد نیاز را کاهش میدهند.

Asynchronous Compute

برای بهینه سازی استفاده از توان پردازشی تراشههای گرافیکی و توزیع بار کاری پردازش دربازیهای سنگین امروزی روش موثری وجود دارد که حالا در دایرکت ایکس 12 به استاندارد تبدیل شده و احتمالا با نام آن هم آشنا هستید. پردازش نامتقارن یا Asynchronous Compute از نسل قبلی مکسول در انویدیا و از خیلی قبلتر و با معماری GCN توسط ایامدی بکار گرفته شده است. سناریوی محتمل برای استفاده از چنین روشی میتواند پردازش همزمان محاسبات فیزیک و بخش گرافیک موتور بازی روی GPU و اعمال برخی افکتها مثل افکتهای Postprocessing روی تصاویر رندر شده و قبل از نمایش باشد.

pascal-dynamic-load-balancing

در معماری مکسول برای دو نوع متفاوت از بارِ کاری مثل پردازش گرافیکی و پردازش فیزیک امکان تخصیص دو پارتیشن مجزا و ثابت از ابتدای شروع همزمان این دو عملیات وجود داشت و اگر یکی از آنها زودتر به پایان میرسید، بخشی از توان GPU بدون استفاده باقی میماند، اما در معماری پاسکال این عملکرد بهبود یافته و پس از اتمام یک پردازش کاری، پردازش دیگر میتواند به صورت پویا تمام منابع تراشه را در اختیار خود بگیرد و حداکثر استفاده را از تخصیص منابع ببرد. این مزیت جدید، پردازش نامتقارن و بهبود یافته در نسل پاسکال است و باعث افزایش راندمان در حالتهای پشتیبانی شده میشود. حتما به یاد دارید که این مورد یکی از نقطه ضعفهای انویدیا در نسل قبلی بود و حواشی زیادی را در مورد بهینه نبودن راندمان آن ایجاد کرده بود. حالا انویدیا وعدهی بهبود راندمان در این قسمت را داده است.

امکانات جانبی معرفی شده با پاسکال

Ansel

راه جدیدی برای گرفتن اسکرین شاتهای دلخواه در داخل بازی است که بجای یک تصویر معمولی، یک نمای ۳۶۰ درجهی کامل از محیطی را که در بازی انتخاب کردهاید ثبت میکند. این نمای ۳ بعدی بعدا از طریق ابزار واقعیت مجازی یا VR مثل Oculus Rift و HTC Vive قابل دیدن خواهد بود و میتوان از آنها در ابزارهای ویرایش حرفهای هم تصاویری را با تنظیمات اختصاصی و رزولوشن خیلی بالا ایجاد کرد. این امکان نیاز به پشتیبانی در بازیها دارد.

Ansel ZoomG

Nvidia FAST SYNC

یک حالت جدید در بین انواع گوناگون Sync یا همگام سازی در بازیها است. رایجترین حالتی که گیمرهای پیسی آن را میشناسند V-Sync است که با همگامسازی نرخ فریم خروجی کارت گرافیک با نرخ بازسازی مانیتورتان، از ایجاد بریدگی در تصاویر جلوگیری میکند. اما ایرادش این است که با گرفتن ترمز موتور گرافیکی بازی تا سقف قابل پشتیبانی در مانیتور شما (مثلا ۶۰ هرتز) ممکن است باعث ایجاد تاخیر در ورودی یا اصطلاحا Input Lag بشود. خاموش کردن V-Sync هم با این که تاخیر در ورودی را از بین میبرد اما بریدگی در تصاویر را باز میگرداند. راه حل جدید انویدیا با نام Fast Sync هیچ کنترلی بر نرخ فریم کارت گرافیک ایجاد نمیکند و مانند حالت خاموش بودن V-Sync رفتار میکند، اما همزمان فریمهای خروجی کارت گرافیکی را که باید نمایش داده شوند از بین فریمهای مختلف انتخاب و به مانیتور ارسال میکند و نتیجه هم نمایش تصاویری با کیفیت زمانی است که V-Sync فعال است و کار میکند. با این تفاسیر تاخیر در ورودی هم حذف خواهد شد.

Fast Sync ZoomG

VR Audio

فناوری دیگر معرفی شده با کارتهای گرافیکی GTX 1080/1070 هم مشابهی چیزی است که قبلا ایامدی معرفی کرده بود و AMD True Audio نام داشت. این فناوری هم شبیه سازی صدای ۳ بعدی و بیشتر مناسب استفاده در هدستهای واقعیت مجازی است. با کمک این قابلیت GPU میتواند میزان انعکاس و جذب صدا را با توجه به محیط محاسبه و تولید کند. این گزینه هم به امکانات VRworks اضافه شده است.

Simultaneous Multi-Projection

در اینجا با قابلیت جالبی روبرو هستیم. اگر چند نمایشگر را پهلو به پهلو در کنار هم چیده باشید تا تصویری محیطی یا Surround را در بازیها ایجاد کنید، این قابلیت بسیار کمک کننده خواهد بود. در حالت عادی وقتی ۳ مانیتور در کنار هم باشند زاویهی دید تنها یک دوربین در تمام آنها شبیه سازی خواهد شد که اگر مانیتورها در یک خط باشند هیچ مشکلی نیست، اما اگر با زاویهی خاصی در پیرامونِ شما قرار داشته باشند این زاویه باعث کشیده شدن غیر طبیعی تصاویر در نمایشگرهای کناری خواهد شد. قابلیت Simultaneous Multi-Projection یا به اختصار SMP به پاسکال اجازه میدهد که تا ۱۶ زاویهی مجزا برای دوربین را به صورت سخت افزاری و تقریبا بدون تاثیر در راندمان شبیه سازی کند و در نتیجه برای مانیتورهای کناری با توجه به زاویهی قرار گرفتنشان تصاویر سه بعدی را تولید کند. این قابلیت برای تولید تصاویر در هدستهای VR هم نیاز به پردازش دو فریم مجزا برای دو چشم را از بین میبرد و باعث افزایش کاملا محسوس راندمان میشود.

NVIDIA_Pascal_SMP

GPU Boost 3.0

نسخهی جدید این فناوری در تراشههای پاسکال تعبیه شده و انعطاف عمل بیشتری را در تعیین فرکانس و ولتاژ متناسب با آن در اختیار قرار میدهد. این الگوریتم جدید میتواند به فرکانس پایدار بالاتر و راندمان بیشتر منتهی شود اگر محدودیتهای حرارت و بار کاری تراشه همزمان رعایت شده باشند. در واقع در هر مقدار ولتاژی میتوان آفست مجزایی را برای فرکانس تعیین کرد. این امکان در مکسول و نسلهای قبلی روی نموداری ثابت و همسان افزایش پیدا میکرد. نرم افزارهای اختصاصی اورکلاک باید برای بهره گیری از این حالت بروز رسانی شوند.

GPU Boost 3.0

بروز رسانی حالت SLI

در این نسل پس از مدتها قابلیت ارتباط کارتهای گرافیکی در حالت SLI یا چند گانه تغییر کرده و تنها دو کارت برای این نسل به طور رسمی پشتیبانی میشود (استفاده از سه یا چهار کارت گرافیکی دیگر توصیه نمیشود) و همزمان از دو لینک برای ارتباط کارتها استفاده خواهد شد. به این طریق پهنای باند ارتباطی کارتها دو برابر خواهد شد.

بررسی راندمان…

در این مقاله سعی کردیم به معماری پاسکال و مشخصات آن تحت تراشهی GP104-400 بپرداریم و امکانات و قابلیتهای جدید معرفی شده با آن را شرح دهیم. روشن است که تمام اینها بدون داشتن تصوری در مورد راندمان این محصول خیلی امیدوار کننده و مثمر ثمر نخواهد بود. در اینجا این وعده را میدهیم که در بخش دوم مقاله بررسی اختصاصی و ویژه از راندمان GTX 1080 در زومجی داشته باشیم و این کارت را درعمل و در بنچمارکها و بازیهای واقعی محک بزنیم. پس منتظر بخش دوم مقالهی ما باشید، چون محصول ویژهی ما در راه است!

ZoomG GeForce GTX1080 NVIDIA

تهیه شده در زومجی

زوم کن و زون کن...

ما را در سایت زوم کن و زون کن دنبال می‌کنید

برچسب: نویسنده: استخدام کار بازدید: 237 تاريخ: دوشنبه 17 خرداد 1395 ساعت: 21:23

صفحه بندی