
سكوت بريتينوثر، المؤسس المشارك والرئيس التنفيذي لـ Kilo Code.
بينما يتأرجح النقاش حول تكاليف الذكاء الاصطناعي بين نقطتين متطرفتين (هل ننفق الكثير أم لا بما فيه الكفاية؟)، ينسى القادة المقياس الوحيد الذي يهم: العائد على الاستثمار.
عبّر المستثمر المغامر تشامات باليهابتييا عن إحباطه من تكاليف الذكاء الاصطناعي لشركته البرمجية، التي تضاعفت ثلاث مرات منذ نوفمبر، متجهة نحو 10 ملايين دولار سنوياً. في الطرف الآخر من الطيف، “المجريين لتأمين التوكنز” يتنافسون على عدد الوكلاء الذين لديهم، وبعض الشركات تحتفل بالمنفقين الكبار.
يريد المحسنون لتكاليف الذكاء الاصطناعي أن يعرفوا: أي نموذج تسعير أكثر قابلية للتنبؤ، وأي الأدوات أو النماذج تحرق أكبر عدد من التوكنز؟ هل فاتورة الاستهلاك ستغرق سوق أدوات البرمجة بالذكاء الاصطناعي أخيرًا؟
هذه أسئلة تستحق طرحها، لكن لا التقتير ولا إلقاء المال على الذكاء الاصطناعي سيساعدك في الإجابة عن السؤال الأكثر أهمية: ماذا تعود عليك فعلاً من استثمارك في الذكاء الاصطناعي؟
جدل التسعير هو تشتيت.
لكل من نماذج التسعير المعتمدة على المقاعد والاستهلاك مزاياها.
تقدم الاشتراكات الثابتة قدرًا من التنبؤ (حتى الآن) بينما تنقل مخاطر التكلفة على مقدمي الخدمة—ومعظمهم يتكبد خسائر على مستخدميهم الأكثر شغفًا، بعد أن رهنوا بأن تكاليف الاستدلال ستنخفض بسرعة كافية للتعويض.
من المحتمل أن تخسر معظم المنصات المال في تلك المراهنة، لأن المهندسين الذين يستخدمون الذكاء الاصطناعي بشكل مكثف يستمرون في الترقية إلى نماذج حدودية جديدة وأكثر تكلفة بدلاً من البقاء على النماذج الأرخص التي افترضها التسعير.
تكون فواتير الاستهلاك أكثر شفافية حول هذه الحقيقة، لكنها تقدم توترها الخاص: مشكلة صدمة الفواتير، حيث تصبح التكاليف غير متوقعة مع زيادة حجم الفرق والتجارب.
لم تحل أي من النموذجين تمامًا بالنسبة لواقع أننا لا نزال في المراحل الأولى من فهم كيف تبدو إنتاجية الذكاء الاصطناعي فعليًا على نطاق واسع.
قبل بضع سنوات، قد يمتلك إنسان واحد روبوت محادثة أو مساعد برمجة يطلب ملاحظات كل دقيقتين. هذا يعني أنه كان غير نشط حوالي 95٪ من الوقت. اليوم، مع الوكلاء، قد تكون مدة المهمة ساعتين. مع تقليل المدخلات البشرية، يمكن لمهندس واحد أن يشغل وكيلًا بنسبة 50٪ من الوقت.
حتى مع أن النماذج الأحدث تصبح أكثر كفاءة في استهلاك التوكنز – تتوقع غارتنر تخفيض بنسبة 90% في تكاليف الاستدلال مع بعض النماذج بحلول عام 2030 – يطلب الوكلاء المزيد من التوكنز لكل مهمة، مما يزيد من تكاليف الاستدلال لكل عامل.
تشجع الشركات على تحسين المقياس الخاطئ.
تتغير العوامل الاقتصادية بطرق تجعل تحسين التكلفة هدفًا متحركًا.
لم يكن التركيز على المدخلات ذا مغزى كما هو الحال مع قياس المخرجات، وذات الأمر ينطبق على الذكاء الاصطناعي: قد يكون المهندسون الذين يستخدمون الذكاء الاصطناعي بشكل مكثف هم من يقودون القيمة الأكبر. تقييد وصولهم لحماية بند الميزانية يعد تحسينًا للمتغير غير الصحيح.
أنت بالفعل تدفع حوالي 25 ألف دولار كل شهر لمهندس—القلق بشأن إنفاق 2 إلى 3 آلاف دولار في التوكنز يأتي من زواية خاطئة. يبدو أن الذكاء الاصطناعي هو مركز تكلفة، لكن إذا تم نشره بفعالية، فإنه يعد مضاعفًا للإنتاجية.
ما يهم هو العائد على الاستثمار: عوامل مثل الإنتاج لكل مهندس، سرعة الشحن وقدرتهم على تولي عمل أكثر طموحًا. تقييد استخدام الذكاء الاصطناعي يعرقل إمكانيات فريقك.
عدم كفاءة التوكنز هي مرحلة، وليست فشل سياسة.
توجد منحنى تعليمي للعمل بفاعلية مع أدوات الذكاء الاصطناعي. في المراحل المبكرة، يكون المهندسون غير فعالين بشكل حتمي. بدون تجربة، قد يديرون جلسات أطول مما هو ضروري، يغفلون عن الفرص لإدارة السياق أو يفضلون النماذج الحدودية لمهام أبسط عندما يمكن أن تنجح النماذج القديمة والأرخص.
هذا طبيعي – وغالبًا ما يكون مؤقتًا. من تجربتي، بشرط أن تُمنح الفرق مساحة للتجربة، غالبًا ما يستهلك صارفو الوكلاء عددًا أقل من التوكنز بعد أن يفهموا بشكل أفضل كيف تعمل الأدوات.
كما تقول النكتة القديمة، “يسأل المدير المالي المدير التنفيذي، “ماذا يحدث إذا استثمرنا في تطوير موظفينا ورحلوا عنا؟” يرد المدير التنفيذي، “ماذا يحدث إذا لم نفعل، وبقوا؟”
ت undergong engineering is witnessing a fundamental transformation, and everyone is learning on the job. Organizations that restrict AI investment during this period don’t avoid the cost—they defer the capability. Their teams would likely never develop the context management skills, the model routing judgment or the workflow discipline that make AI use efficient. The bill stays high because the skills never develop.
قم بقياس ما يهم فعلاً.
السؤال الذي ينبغي على قادة الهندسة طرحه ليس “كم ننفق على التوكنز؟” بل “ماذا نشحن، وهل يضيف قيمة؟”
لا تزال مقاييس DORA التقليدية—طلبات السحب المدمجة، وتكرار النشر، ومعدل فشل التغيير—مفيدة كمرجع.
اجمعها مع بيانات وقت التشغيل والأداء، وابدأ بتحقيق صورة حقيقية لتأثير الذكاء الاصطناعي. قدّر أحد المؤسسين على لينكد إن أن $3K في نفقات التوكن لكل مهندس سمح بتحسين إنتاجهم خمس مرات.
سيرى النقاش حول اقتصاديات الذكاء الاصطناعي بشكل مختلف بعد عام أو حتى ستة أشهر. مع تحوّل الاستدلال إلى سلعة، سيتضاءل جدل نماذج التسعير في الأهمية، تمامًا كما أصبحت مسألة الخادم السحابي الذي يعمل عليه تطبيقك تقريبًا غير مرئية للمطورين.
سيتحول المنافسة نحو الأنظمة التي توجّه المهام إلى النموذج الصحيح، وتوازن التكلفة مع الجودة تلقائيًا وتختصر قرارات البنية التحتية التي تأخذ حاليًا انتباه الهندسة.
ومع ذلك، من المهم أن نتذكر أن وضوح التكلفة لا يزال مهمًا. ارتفاع إنفاق التوكنز دون زيادة مقابلة في الإنتاج، أو جلسات طويلة بدون التزامات، أو الاستخدام المتسق للنماذج الحدودية للمهام البسيطة هي جميع إشارات تستحق التحقيق. الهدف هو فهم لماذا بدلاً من تقييد الوصول.
في الممارسة العملية، تعد إدارة السياق هي المهارة الأكثر تأثيرًا التي يمكن للمهندسين تطويرها: معرفة مقدار نافذة السياق التي يستخدمونها، ومتى يجب بدء جلسة جديدة وأي نموذج مناسب لمهمة معينة. الفرق التي تطور تلك العادات تنفق أقل وتقوم بالشحن بشكل أسرع. يجب أن تتطور محادثة CFO بما يتجاوز تحديد حدود الإنفاق إلى التوافق على ما تنتجه النفقات.
ستتحرك أهداف القياس، لكن البرمجة لا تزال تدور حول تقديم قيمة للعميل. سيكون هناك طرق للقياس فريدة لعملك، وهذا ما يجب أن تركز على تتبعه. إنفاق التوكنز وحده ليس أكثر بُعدًا هنا من أسطر الكود المولدة.
مجلس التكنولوجيا في فوربس هو مجتمع بدعوة فقط لكبار مديري المعلومات، وكبار المدراء التكنولوجيين، والتنفيذيين في التكنولوجيا. هل أستحق؟
