
بروفيدنس، رود آيلاند — كان عالم الحاسوب لويس كاستريكاتو في عامه الثامن يدرس نماذج اللغة الكبيرة — تقنية الذكاء الاصطناعي التي تقف وراء الدردشة الآلية مثل ChatGPT وكلاود — عندما بدأ يشعر أنه يواجه طريقًا مسدودًا.
قال كاستريكاتو: “لقد تجاوزنا في الأساس نقطة القيام ببحوث حقيقية في LLM”. “الآن هي مجرد تطبيقات.”
تخلى الباحث عن دراسته في جامعة براون وبدأ شركة جديدة، تُدعى Overworld. طموحها في اسمها: ذكاء اصطناعي يمكنه فهم والتنقل في العالم، وليس مجرد الكلمات.
لا يزال هناك الكثير من المال لكسبه من دردشات الذكاء الاصطناعي — حيث يتوقع المستثمرون ذلك مع التزامهم بـ تريليونات الدولارات للمطورين الرائدين مثل أنثروبيك وأوبن إيه آي. لكن عددًا متزايدًا من رواد الأعمال في مجال الذكاء الاصطناعي يكرسون أنفسهم لما يرونه الحدود التالية: “نماذج العالم” التي تعلم أنظمة الذكاء الاصطناعي، وأحيانًا الروبوتات، كيفية الرد في بيئة جسدية.
تتضمن بعض أبرز العلماء في هذا المجال، مثل “أم الذكاء الاصطناعي” في-في لي، التي تصف مفهوم نموذج العالم بأنه “واحد من أكثر المصطلحات أهمية وكثرة الاستخدام في الذكاء الاصطناعي اليوم.”
في قلب أبحاث نموذج العالم تكمن فكرة أن الذكاء الاصطناعي لا يمكن أن يكون ذكيًا حقًا إذا كان يمكنه فقط قراءة كتاب. يحتاج أيضًا إلى قراءة الغرفة.
كتبت لي، مؤسسة شركة World Labs الناشئة في سان فرانسيسكو، في مقال نُشر هذا الشهر: “حيث تتعلم نماذج اللغة التركيب الإحصائي للنص، تتعلم نماذج العالم التركيب الإحصائي للفضاء والزمان: كيف تسقط الضوء على سطح، كيف يبدو الحديقة من زاوية لم تلتقطها أي كاميرا، كيف تستجيب الأشياء للقوة وتتبع قوانين الفيزياء.”
مدافع آخر هو الرائد في الذكاء الاصطناعي يان لوكون، الذي ترك وظيفته كعالم رئيسي للذكاء الاصطناعي في ميتا العام الماضي ليؤسس Advanced Machine Intelligence Labs في باريس.
قال لوكون: “نموذج العالم أصبح بسرعة كلمة رنانة”، في بودكاست حديث بعنوان “التعلم غير الخاضع للإشراف”. وأعرب عن رأيه أنه يمثل شيئًا يمكّن عميل الذكاء الاصطناعي “من توقع عواقب أفعاله.”
هناك طرق متعددة لتعريف نماذج العالم، وغالبًا تكون مستندة إلى التقنيات التي يأمل شخص ما في بناءها باستخدامها — سواء كانت الروبوتات أو لعبة فيديو تفاعلية أكثر.
التدريب على كل كتب البشرية والمقالات الإخبارية ووسائل الإعلام المرئية، كما فعلت نماذج لغة الذكاء الاصطناعي، أدى إلى مساعدي الذكاء الاصطناعي الذين يغيرون طبيعة العمل المكتبي وبعض المجالات الإبداعية. لكن بعض المدافعين يرون أن هناك قيودًا في نماذج الذكاء الاصطناعي التوليدية التي تعمل عن طريق توقع الكلمة أو البكسل التالي بشكل متكرر لإنتاج حوار جديد أو صور أو سطور من الشيفرات.
لا يمكن للدردشات الآلية التقاط فنجان قهوة، كما يشير مارتن هيبرت، عميد علوم الكمبيوتر في جامعة كارنيجي ميلون.
قال هيبرت: “هناك كل هندسة العالم، الديناميكية لكيفية تحريك يدي، التفاعل الفيزيائي للاتصال مع الكوب”. “هذا أكثر تعقيدًا بكثير من مجرد توقع الكلمة التالية في الجملة.”
بالنسبة لعلماء مثل هيبرت، الذي قضى أكثر من أربعة عقود في البحث في مجال الروبوتات، فإن أكثر التطبيقات فائدة لنماذج العالم هي كطريق أسرع وأرخص نحو “الذكاء الاصطناعي الفيزيائي” — مصطلح آخر رنان في صناعة التكنولوجيا.
قراءات شائعة
قال هيبرت في مقابلة: “قد تكون لدى بعض الناس تعريفات مختلفة، لكن الذكاء الاصطناعي الفيزيائي والمتمثل هو نوع من تطور ما كنا نسميه الروبوتات.” بعض التقدم في الذكاء الاصطناعي الذي جعل الدردشات الآلية مفيدة للغاية يمكن أن يُطبق أيضًا على بناء ذكاء اصطناعي يمتلك وعيًا واسعًا كفاية ببيئته للعمل مثل عقل الروبوت، كما قال.
قال: “في جسمك ونخاعك الشوكي لديك نموذج عام جدًا لكيفية التوازن، وكيفية المشي، ويمكنك التكيف مع ألم ركبتك في الصباح، لذلك الآن تمشي قليلاً بشكل مختلف”. “لا تحتاج إلى التفكير في ذلك. لديك نموذج عام في مكان ما في نظامك العصبي ودماغك يسمح لجسدك بالتكيف بسرعة كبيرة.”
الروبوتات الأكثر ذكاءً ليست اللعبة النهائية الوحيدة لنماذج العالم. بدأ كاستريكاتو Overworld العام الماضي والبدء الناشئ الذي يتخذ من رود آيلاند مقرًا له يقوم الآن ببناء عوالم ألعاب الفيديو حيث يمكن لمشهد، على سبيل المثال، غابة مخيفة، أن يتكيف عندما ينتقل شخصية افتراضية من خلالها ويتفاعل مع الأشياء الموجودة فيها.
قال في مقابلة: “لا يوجد نموذج عالم آخر يمكنك من خلاله السير عبر الأبواب أو حيث يمكنك التفاعل مع بيئة تفصيلية مثل هذه”. “نحن نOptimise للتفاعل فوق أي شيء آخر.”
بينما التطبيقات قصيرة المدى ليست واضحة كما هي أدوات برمجة الذكاء الاصطناعي، يجذب صانعو نماذج العالم اهتمام المستثمرين مثل ستيف جانج، الشريك المؤسس والمدير في شركة Kindred Ventures.
تستثمر الشركة في Overworld وشركات أخرى تركز على نماذج العالم، بما في ذلك Causal Labs، التي تبني نماذج الذكاء الاصطناعي للتنبؤ بالطقس، وExtropic، التي تبني شرائح كمبيوتر متخصصة مناسبة لنماذج العالم.
قال جانج: “أعتقد أن المستقبل هو العديد من أنواع النماذج مع العديد من الفلسفات والهندسات المختلفة”. “لا أعتقد أنه سيكون هناك نموذج كبير وكثيف يحكمهم جميعًا.”
في مقالها الأخير، سعت لي إلى إنشاء “تصنيف لنماذج العالم” لمساعدتها في فرز الارتباك حول الرؤى المتنافسة.
كتبت: “نموذج فيديو ينتج لهبًا رائعًا ولكنه مستحيل فيزيائيًا، نموذج لغة يرتجل لعبة قابلة للعب، ومحرك فيزياء يحاكي الاحتراق بدقة يجتمعون جميعهم تحت نفس الاسم.”
قسمت نماذج العالم إلى ثلاث فئات. الأكثر قابلية للتسويق اليوم هي “المصورات” التي تعطي الأولوية للأمان البصري للعوالم الافتراضية التي تنشئها ولكن لا يمكن الوثوق بها لتعليم الروبوتات الكثير.
ثم هناك “المحاكيات” التي تخلق ميادين تدريب افتراضية تمثل بدقة الهيكل الفيزيائي لعالم؛ و”المخططين” الذين يحاولون توقع ما يجب على عميل الذكاء الاصطناعي أو الروبوت أن يفعله في عالم غير منظم.
كتبت: “الروبوت الذي يمكنه التخطيط هو روبوت يمكنه العمل، والصناعة بأسرها تتسابق لتكون هي التي تصل إلى هناك أولاً.”
