Skip to content
Menu
bsm300gb120dlc
  • Home
  • components
  • الإخبارية
bsm300gb120dlc

مقارنة تسريع التخزين الحسابي FPGA و GPU: الأداء حسب اعتبارات الطاقة

Posted on 2022-11-13

“لتحسين أداء البنية التحتية للحوسبة الخاصة بهم ومواكبة الطلبات المتزايدة لتحليلات البيانات والذكاء الاصطناعي ، تتجه العديد من المؤسسات إلى تسريع الأجهزة كحل أساسي. في معظم الحالات ، تعد الأجهزة القابلة للبرمجة المتقدمة (بشكل أساسي وحدات معالجة الرسومات و FPGA) هي الوسيلة الأساسية للتسريع. باستخدام هذه الأجهزة المتقدمة ، تكتسب الشركات ميزة في الحوسبة ؛ ومع ذلك ، لا يزال لديهم مخاوف مشروعة بشأن صعوبة البرمجة.

“

لتحسين أداء البنية التحتية للحوسبة الخاصة بهم ومواكبة الطلبات المتزايدة لتحليلات البيانات والذكاء الاصطناعي ، تتجه العديد من المؤسسات إلى تسريع الأجهزة كحل أساسي. في معظم الحالات ، تعد الأجهزة القابلة للبرمجة المتقدمة (بشكل أساسي وحدات معالجة الرسومات و FPGA) هي الوسيلة الأساسية للتسريع. باستخدام هذه الأجهزة المتقدمة ، تكتسب الشركات ميزة في الحوسبة ؛ ومع ذلك ، لا يزال لديهم مخاوف مشروعة بشأن صعوبة البرمجة.

الشكل 1: مكونات خط أنابيب التحليلات / الذكاء الاصطناعي

يطبق مصنعو الأجهزة طرق تسريع للتخزين الحسابي ، وهو تخزين مصمم خصيصًا لاحتواء عناصر حسابية مضمنة. لقد ثبت أن هذا النهج يقدم أداءً فائقًا للتحليلات وتطبيقات الذكاء الاصطناعي (الشكل 1). يمكن تسريع التحليل والتحقق ، بمساعدة التعلم الآلي أو بدونه ، باستخدام أجهزة الذاكرة الحسابية. توفر هذه الأجهزة ميزة رئيسية ، مما يسمح بإلغاء تحميل العمليات الحسابية باهظة الثمن إلى جهاز التخزين بدلاً من الاضطرار إلى إجراؤها على وحدة المعالجة المركزية للخادم. تشمل المزايا المكتسبة من خلال التخزين الحسابي على نهج التخزين / وحدة المعالجة المركزية القياسي ما يلي:

1. قم بتخصيص الأجهزة القابلة للبرمجة باستخدام البرمجة الخاصة بالتطبيقات للحصول على أداء أعلى
2. تفريغ مهام الحوسبة من الخادم إلى جهاز التخزين ، مما يؤدي إلى تحرير موارد وحدة المعالجة المركزية
3. البيانات والحوسبة في موقع مشترك لتقليل متطلبات نقل البيانات

هذا النهج الجديد له مستقبل مشرق. ومع ذلك ، يجب عليك تقييم هذا النهج بناءً على حالة الاستخدام الخاصة بك ، مع مراعاة الأداء والتكلفة واستهلاك الطاقة وسهولة الاستخدام. تهيمن فعالية التكلفة والأداء لكل استهلاك للطاقة على اختيار تقييمات الأجهزة المتسارعة. في هذه المقالة ، سنلقي نظرة على الأداء لكل قوة (مقالة أخرى مخصصة للسعر / الأداء).

مقارنة استهلاك طاقة التخزين الحاسوبي

3 أنظمة

في هذا السيناريو ، سنقارن بين ثلاث أدوات تركز على حالات استخدام قراءة بيانات CSV: تخزين NVIDIA GPUDirect وتخزين RAPIDS ، وتخزين Samsung SmartSSD المستند إلى تقنية Xilinx. تلعب قراءات CSV دورًا مهمًا في خطوط الأنابيب المكثفة حسابيًا (انظر الشكل 1).

في ما يلي ، نحدد الأداء على أنه معدل معالجة CSV ، أو معالجة “النطاق الترددي”. لنبدأ بمراجعة سريعة لكيفية عمل الأنظمة الثلاثة.

NVIDIA GPUD Direct التخزين

• شاملة للتحليلات واحتياجات الذكاء الاصطناعي
• استخدم GPU كوحدة حسابية ، تتماشى بشكل وثيق مع تخطيط جهاز التخزين المستند إلى NVMe (GPUDirect)
• البرمجة باستخدام CUDA (RAPIDS)

تستخدم Nvidia تقنية قراءة بيانات CSV الخاصة بها لقياس مكاسب الأداء عبر محركات أقراص الحالة الصلبة القياسية. النتائج موضحة في الشكل 1. مع 1 إلى 8 مسرعات ، يكون معدل النقل المقابل من 4 إلى 23 جيجا بايت / ثانية.

محرك Samsung SmartSSD

• استخدم Xilinx FPGAs كوحدات حسابية
• الإقامة على نفس اتصال PCIe الداخلي مثل منطق التخزين
• احسب على منصة التخزين عن طريق البرمجة

عملت Bigstream ، شريك حلول تحليل البيانات Xilinx ، مع Samsung لتصميم مسرعات لـ Apache Spark ، بما في ذلك IP لملف CSV ومعالجة الباركيه. استخدمت اختبارات SmartSSD محرك تحليل CSV في الوضع المستقل لأغراض المقارنة. النتائج ، الموضحة في الشكل 2 ، تتوافق مع الإنتاجية من 4 إلى 23 جيجابايت / ثانية عند استخدام 1 إلى 12 مسرّعًا ، وتعطي أيضًا نتائج Nvidia (باستخدام 1 إلى 8 مسرعات). لاحظ أن جميع النتائج في هذه المناقشة محددة بواسطة عدد المسرعات على المحور x.

هذه النتائج مثيرة ، ولكن تأكد من مراعاة استهلاك الطاقة عند اختيار الحل الخاص بك.

مقارنة تسريع التخزين الحسابي FPGA و GPU: الأداء حسب اعتبارات الطاقة
الشكل 2: تحليل نتائج أداء CSV لمحركات أقراص SmartSSD

مقارنة الأداء لكل وحدة استهلاك الطاقة

يوضح الشكل 3 نتائج التحليل بعد أخذ استهلاك الطاقة في الاعتبار. وهي تمثل مستوى الأداء الذي تم تحقيقه لكل وحدة من وحدات استهلاك الطاقة ، وبناءً على المواد ذات الصلة المذكورة في المناقشة أعلاه ، يتم وضع الافتراضات التالية:

• وحدة معالجة الرسومات Tesla V100: 200 واط أقصى استهلاك للطاقة
• محرك SmartSSD FPGA: 30 واط أقصى استهلاك للطاقة

مقارنة تسريع التخزين الحسابي FPGA و GPU: الأداء حسب اعتبارات الطاقة
الشكل 3: مقارنة استهلاك طاقة النطاق الترددي لكل واط لتحليل CSV

في هذا السيناريو ، تُظهر الحسابات أن أداء SmartSSD لكل استهلاك للطاقة أعلى 25 مرة من تخزين GPUDirect عند استخدام جميع المسرعات الثمانية.

FPGA مقابل GPU: الأفكار النهائية حول الأداء لكل قوة

تتمثل ميزة التخزين الحسابي في أنه يمكن أن يعزز أداء تحليل البيانات وتطبيقات الذكاء الاصطناعي. ومع ذلك ، لكي يكون هذا النهج قابلاً للنشر عمليًا وعمليًا ، يجب أن يؤخذ استهلاك الطاقة في الاعتبار في التقييم.

لقد قدمنا ​​منحنيات أداء الإنتاجية المحددة من خلال استهلاك الطاقة لطريقتين مختلفتين للتخزين الحسابي لتحليل بيانات CSV. أظهرت النتائج أن محركات أقراص SmartSSD تتفوق في الأداء على طريقة تخزين GPUDirect في الأداء لكل طاقة عند مقارنتها باستخدام عدد مماثل من المسرعات.

GPUDirect هو نظام بحث توفره NVIDIA من خلال منصة تطبيق NVIDIA DGX-2.

محرك Samsung SmartSSD عبارة عن منصة PCIe قابلة للنشر وجاهزة للإنتاج ومتاحة الآن من خلال Xilinx والموزعين.

The Links:   VI-B1H-EU   DMF-50036ZNBU-FW

  • components
  • الإخبارية
  • ابدأ من أبعاد متعددة لإنشاء معدات اختبار أوتوماتيكية مستقرة وفعالة لتلبية الفرص والتحديات في عصر تكامل الدائرة المتكاملة
  • نتحدث عن حالة صناعة شنغهاي IC
  • Fuji 2MBI100U4A-120 New Stock
  • Fuji 2MBI200U4H-120 New Stock
  • ما هو الفرق بين المستشعر والمشغل
©2022 bsm300gb120dlc | Created by bsm300gb120dlc
Go to mobile version