
فيليب ميرانجيلا، كبير موظفي التسويق والمنتجات، EdgeConneX.
توقف عن التفكير في الحافة كامتداد بعيد للسحابة وابدأ في التعامل معها كطبقة قرار موزعة.
على مدى عقدين، كانت الحافة تدور في الغالب حول تقريب المحتوى من المستخدمين. في عصر الذكاء الاصطناعي، أصبحت المكان الذي تتخذ فيه الأنظمة الذكية قرارات في الوقت الحقيقي. مع استمرار زيادة أحمال الاستنتاج، يتحول التركيز من “أين يمكننا جمع قوى حسابية هائلة؟” إلى “أين يجب أن تعيش الذكاء لكي تعمل التطبيق؟”
الحافة قبل الذكاء الاصطناعي وظهور السحابة
في أيام “ما قبل السحابة” – عندما احتفظت المنظمات بخوادمها في القبو بالمقر الرئيسي أو استأجرت مساحة في مراكز البيانات من مزودي الطرف الثالث، عندما كانت نتفليكس ترسل أقراص DVD وأمازون كانت ترسل كتب، لم يكن هناك فرق كبير بين النواة والحافة.
في عام 1999، قامت أكاماي “قربت الويب من المستخدمين” من خلال تكرار محتوى الويب الشائع عبر شبكة عالمية من الخوادم ونقل المحتوى وفقًا للطلب الإقليمي. ساعد ذلك في إنشاء نمط تقديم التطبيقات الذي شكل العقدين التاليين: حساب وتخزين مركزين في مراكز بيانات مركزية، مع تخزين مؤقت حساس للكمون على الحافة، بالقرب من المستخدمين النهائيين.
في عام 2006، ساعد إطلاق أمازون لـ AWS في تحديد عصر السحابة الحديثة، محولًا تكنولوجيا المعلومات المؤسسية إلى مراكز بيانات هايبر سكال في مناطق منظمة في مناطق توفر و، مع مرور الوقت، امتدت ذلك النموذج نحو الخارج من خلال مواقع الحافة وبنية تحتية لشبكة توصيل المحتوى ومداخل السحابة.
تدريب نماذج الذكاء الاصطناعي في مراكز البيانات ‘جيغاسكيل’
تضع تدريب نماذج الذكاء الاصطناعي متطلبات مختلفة جدًا على تصميم مراكز البيانات مقارنة بأحمال العمل السحابية التقليدية. أولًا، تعتمد على الوصول إلى طاقة ضخمة وأراضٍ. غالبًا ما تُشار إلى “منشآت” تدريب النماذج بأنها “جيغاسكيل” – جيجاوات واحدة أو أكثر، وهو ما يعادل 10 أضعاف حجم مركز بيانات السحابة العادي. يمكن أن تغطي مئات الأفدنة. وقد دفعت هذه المتطلبات إلى منطق “نقل مركز البيانات إلى الطاقة” ودفع التنمية نحو أسواق جديدة، غالبًا في المناطق الريفية.
تشغيل أحمال التدريب يتم بكثافات أعلى بكثير من أحمال السحابة. على سبيل المثال، تُدرج أحدث أنظمة نيفيديا عند 132–140 كيلوواط لكل رف وتوجه خرائط الطريق الصناعية نحو أرفف كثافة أعلى مع مرور الوقت. (في المقابل، يبلغ متوسط نشر السحابة حوالي 10 كيلوواط لكل رف.) عند هذه الكثافات، لا يكون التبريد بالهواء كافيًا غالبًا أو اقتصاديًا. لذا، بالإضافة إلى دفع مراكز البيانات إلى مواقع جديدة، فإن الطلب على تدريب نماذج الذكاء الاصطناعي يجعل أيضًا التبريد السائل المباشر ضروريًا بشكل متزايد. يمثل ذلك طريقة مختلفة بشكل دراماتيكي في تصميم وتشغيل مركز البيانات.
لكن التدريب هو جانب واحد فقط من قصة بنية الذكاء الاصطناعي التحتية. بمجرد نشر النماذج، تصبح التحديات التشغيلية في تقديمها بشكل فعال وموثوق.
في عصر استنتاج الذكاء الاصطناعي، هذه ليست حافة والديك
يقلب استنتاج الذكاء الاصطناعي الحافة من مكان يتم فيه جمع البيانات إلى مكان يتم فيه اتخاذ القرارات.
مع زيادة اعتماد الذكاء الاصطناعي، تصبح حصة أكبر من الأحمال هي استنتاج – عملية استخدام نموذج مدرب لتحليل بيانات جديدة وإنتاج مخرجات. ماكينزي تتوقع أن يتجاوز الاستنتاج التدريب بحلول عام 2030، مما يمثل أكثر من نصف حساب الذكاء الاصطناعي وتقريبًا 30%-40% من إجمالي الطلب على مراكز البيانات. (بالطبع، سيظل التدريب مهمًا استراتيجيًا حتى مع تحول الاستنتاج إلى نوع الحمولة السائدة في الذكاء الاصطناعي.)
يدفع هذا التحول إلى الاستنتاج اتخاذ القرارات أقرب إلى حيث يتم إنشاء البيانات: المصانع والمتاجر والمستشفيات والمركبات والأجهزة والكاميرات ومواقع الفروع. آي دي سي تتوقع أن إنفاق الحوسبة على الحافة عالميًا سينمو بنسبة تصل إلى 14% تقريبًا (CAGR) بين عامي 2025 و2028، مع “نمو معزز” في أحمال الذكاء الاصطناعي على الحافة.
حيث كان التركيز لأحمال التدريب على تدريب نماذج أكبر، بالنسبة للاستنتاج، يصبح تقديم تلك النماذج بشكل موثوق وفعال من حيث التكلفة، على النطاق، طوال اليوم. تحتاج التطبيقات التي يواجهها المستخدم إلى زمن استجابة منخفض ووقت ثابت للاستجابة. القرب ضروري لجعل الذكاء الاصطناعي قابلًا للاستخدام في المنتجات الحية: وكلاء الصوت، مساعدات التشفير، كشف الاحتيال، الألعاب، سير العمل الطبي، الروبوتات، الواقع المعزز/الواقع الافتراضي، أتمتة المصانع، تخصيص العملاء وخطوط العمل الوكيلة.
تتحول الحافة إلى طبقة تنفيذ الذكاء الاصطناعي.
نظرًا لأن متطلبات أحمال الاستنتاج مختلفة عن تدريب النماذج، فإن استراتيجية مركز البيانات مختلفة أيضًا. تُنشر أحمال الاستنتاج عبر العديد من المواقع الموزعة، بالقرب من المستخدمين، مع تحسينها لخدمة مستمرة وحساسة للكمون. لا تزال الطاقة مهمة؛ الاستنتاج أقل كثافة لكل حمولة مقارنة بالتدريب ولكن الطلب الكلي مستمر وهائل.
هذه ليست حافة والديك، التي كانت غالبًا صغيرة، قليلة الموظفين ومهيأة للتخزين المؤقت أو أحمال العمل المؤسسية البسيطة. قد تحتاج حافة استنتاج الذكاء الاصطناعي إلى مسرعات، نطاق ذاكرة عالي، شبكات قوية، تبريد أفضل، مرونة أعلى وتنسيق معقد. الاستنتاج أكثر تشابهًا من الناحية التشغيلية مع خدمة مباشرة أكثر من كونه عمل دفعي.
بنية الذكاء الاصطناعي مصممة حول الأحمال
ليس كل حمولة من الذكاء الاصطناعي تنتمي إلى نفس المكان. قد يبقى تدريب النماذج الكبيرة مركزيًا، بينما قد تعمل أحمال الاستنتاج في مراكز البيانات الإقليمية ومرافق الحافة وكذلك في البيئات الخاصة أو الأجهزة. ومع استمرار بناء مراكز البيانات لأغراض تدريب نماذج الذكاء الاصطناعي الكبيرة إلى حد ما، ستدعم المزيد من مراكز البيانات أحمال مختلطة – تدريب النماذج، استنتاج وأحمال العمل السحابية أو المؤسسية التقليدية.
بالنسبة لقادة التكنولوجيا، فإن السؤال العملي ليس سواء اختر قمت باختيار السحابة أو الحافة. بل هو كيفية وضع الأحمال بناءً على خمسة عوامل: الكمون، حساسية البيانات، توفر الطاقة، تكلفة الخدمة ومرونة التشغيل. قد ينتمي التدريب، الاستنتاج، تخزين البيانات واتخاذ القرار إلى أماكن مختلفة اعتمادًا على التطبيق.
لن تكون المرحلة التالية من بنية الذكاء الاصطناعي محددة بوجهة واحدة تُسمى “السحابة” أو “الحافة”. بل سيتم تحديدها من خلال وضع الأحمال: وضع التدريب، الاستنتاج، البيانات واتخاذ القرار حيثما يتم إنشاء أكبر قيمة. بالنسبة لقادة التكنولوجيا، لم تعد الحافة تُعتبر محيطًا للهندسة المعمارية، بل أصبحت واحدة من الأماكن التي يفكر فيها العمل ويتصرف.
مجلس تكنولوجيا فوربس هو مجتمع يُدعى إليه حصريًا لرؤساء المعلومات من الطراز العالمي، ومديري التكنولوجيا التنفيذية وكبار المسؤولين التنفيذيين في التكنولوجيا. هل أؤهل؟
