ملخص تقرير مؤشر ستانفورد للذكاء الاصطناعي لعام 2026م (ج2) – اعداد محمد جواد آل السيد ناصر الخضراوي

The 2026 AI Index Report
(جامعة ستانفورد – Stanford University)

أصدرت جامعة ستانفورد النسخة التاسعة من تقرير مؤشر الذكاء الاصطناعي، المعنون بـ “مؤشر ستانفورد للذكاء الاصطناعي لعام 2026م”، ويشير التقرير إلى أن الذكاء الاصطناعي يتقدم بسرعة، وينتشر على نطاق واسع، ويخلق قيمة اقتصادية حقيقية، إلا أن الحوكمة والسلامة والفهم العام لا يواكب هذا التطور. كما يسلط الضوء على اتساع الفجوة بين قدرات الذكاء الاصطناعي واستعداد المجتمع لإدارته.

وجاء التقرير في 425 صفحة، وشارك في إعداده مجموعة كبيرة من الأكاديميين في الجامعة، ويحتوي مقدمة وتسعة فصول وملحق.

الفصل الأول: البحث والتطوير
أنتجت الصناعة أكثر من 90% من نماذج الذكاء الاصطناعي البارزة في عام 2025، لكنّ أكثر النماذج كفاءةً هي الآن الأقل شفافية. ولم يعد يتم الكشف عن رمز التدريب، وعدد المعاملات، وأحجام مجموعات البيانات، ومدة التدريب للعديد من الأنظمة التي تستهلك موارد كثيرة، بما في ذلك أنظمة “أوبن ايه آي” و”أنثروبيك” و”غوغل”. وتتصدر الصين مجال البحث، بينما تتصدر الولايات المتحدة تطوير النماذج البارزة.
وتتصدر الصين حجم المنشورات، والاستشهادات، ومنح براءات الاختراع، بينما تحتفظ الولايات المتحدة ببراءات اختراع ذات تأثير أكبر، وأنتجت 59 نموذجًا بارزًا في عام 2025 مقابل 35 نموذجًا للصين. تتصدر كوريا الجنوبية براءات اختراع الذكاء الاصطناعي للفرد، وارتفعت حصة الصين من بين أفضل 100 ورقة بحثية في مجال الذكاء الاصطناعي من حيث عدد الاستشهادات من 33 ورقة في عام 2021 إلى 41 ورقة في عام 2024.
وظلت المعاملات المُبلغ عنها تُقاس بالتريليونات مع انخفاض مستوى الإفصاح. وظل عدد المعاملات قريبًا من تريليون معامل لثلاث سنوات، على الرغم من توقف التقارير من المختبرات الرائدة. واستمرت قدرة الحوسبة التدريبية، التي يمكن تقديرها بشكل مستقل، في الارتفاع.
ولا تزال البيانات الاصطناعية لا تحل محل البيانات الحقيقية في مرحلة ما قبل التدريب، لكن جودة البيانات وتقنيات ما بعد التدريب تُظهر نتائج واعدة. ويحقق نموذج “اولمو 3.1 ثينك 32 بي” (OLMo 3.1 Think 32B)، الذي يحتوي على معاملات أقل بنحو 90 مرة من “غروك 4″، نتائج مماثلة في العديد من المعايير القياسية من خلال التقليم وإزالة التكرار والتنقيح فقط.
وقد نمت قدرة الحوسبة العالمية للذكاء الاصطناعي بمقدار 3.3 أضعاف سنويًا منذ عام 2022، لتصل إلى 17.1 مليون وحدة مكافئة لـ “اتش 100” (H100). وتستحوذ “انفيديا” (Nvidia) على أكثر من 60% من إجمالي قدرة الحوسبة، بينما تُوفر غوغل و أمازون معظم النسبة المتبقية، وتحتفظ “هواوي” (Huawei) بحصة صغيرة ولكنها متنامية. ويُعزى هذا التوسع إلى توسع مراكز بيانات الشركات العملاقة والطلب المستمر على تدريب النماذج الرائدة واستنتاجها.
وتتصدر الولايات المتحدة مراكز بيانات الذكاء الاصطناعي، حيث يقوم مصنع تايواني واحد بتصنيع غالبية الرقائق داخلها. وتستضيف الولايات المتحدة 5427 مركز بيانات، أي أكثر من عشرة أضعاف أي دولة أخرى، وتستهلك طاقة أكثر من أي منطقة أخرى. وتقوم شركة واحدة، هي “تي اس ام سي”، بتصنيع جميع رقائق الذكاء الاصطناعي الرائدة تقريبًا، مما يجعل سلسلة توريد أجهزة الذكاء الاصطناعي العالمية تعتمد على مصنع واحد في تايوان، على الرغم من أن توسع “تي اس ام سي” في الولايات المتحدة بدأ العمل في عام 2025.
ويتزايد الأثر البيئي للذكاء الاصطناعي في مجالات الطاقة والمياه والانبعاثات. ففي عام 2025، بلغت انبعاثات التدريب المقدرة لـ”غروك 4″ ما يعادل 72816 طنًا من ثاني أكسيد الكربون. ارتفعت سعة الطاقة لمراكز بيانات الذكاء الاصطناعي إلى 26.6 غيغاواط، وهو ما يعادل استهلاك ولاية نيويورك في ذروة الطلب، وقد يتجاوز استهلاك المياه السنوي للاستدلال لـ “جي بي تي – 4 او” وحده احتياجات مياه الشرب لـ 1.2 مليون شخص.
ويستمر تطوير الذكاء الاصطناعي مفتوح المصدر في التوسع، حيث بلغ عدد المشاريع على منصة “غيت هوب” (GitHub) 5.6 مليون مشروع، وتضاعفت عمليات تحميل تطبيق “هوغنغ فيس” (Hugging Face) ثلاث مرات منذ عام 2023. ولا تزال المشاريع الأمريكية تحظى بأكبر قدر من التفاعل، إذ بلغ مجموع نجومها على منصة “غيت هوب” 30 مليون نجمة للمشاريع التي تجاوزت عتبة العشر نجوم.

الفصل الثاني: الأداء التقني
تتجاوز قدرات الذكاء الاصطناعي المعايير المصممة لقياسها، بل وتتفوق على الأداء البشري. فقد حققت النماذج الرائدة مكاسب بلغت 30 نقطة مئوية في عام واحد فقط في اختبار “الاختبار الأخير للبشرية”، وهو معيار مصمم ليكون صعبًا على الذكاء الاصطناعي ومفيدًا للخبراء البشريين. أما التقييمات التي كان من المفترض أن تكون صعبة لسنوات، فقد أصبحت مكتملة في غضون أشهر، مما يقلل من الفترة التي تظل فيها المعايير مفيدة لتتبع التقدم.
ويتقارب أداء أفضل النماذج، حيث تتجمع الآن 4 شركات ضمن نطاق 25 نقطة في تصنيف “إيلو” (Elo) (المستوحى من تصنيفات الشطرنج) عند تقييمها مقابل بعضها البعض من خلال التصويت البشري في “أرينا ليدربورد اندو بينشمارك” (Arena Leaderboard and benchmark) . واعتبارًا من مارس 2026، تحتل كل من “أنثروبيك” (1503)، و”إكس إيه آي” (1495)، و”غوغل” (1494)، و”أوبن إيه آي” (1481)، و”علي بابا” (1449)، و”ديب سيك” (1424) أعلى مستويات تصنيفات “أرينا إيلو”، مما يحول الضغط التنافسي نحو التكلفة والموثوقية والأداء الخاص بالمجال.
وقد عادت فجوة أداء النماذج المفتوحة للظهور في عام 2025 بعد أن انحسرت لفترة وجيزة في عام 2024. واعتبارًا من مارس 2026، يتفوق أفضل نموذج مغلق على أفضل نموذج مفتوح بنسبة 3.3%، بعد أن كانت النسبة 0.5% في أغسطس 2024. ستة من أفضل عشرة نماذج في قائمة “ارينا ليدربورد” مغلقة الآن.
أما فجوة أداء نماذج الذكاء الاصطناعي بين الولايات المتحدة والصين فقد انحسرت بشكل فعلي. وتبادلت النماذج الأمريكية والصينية المراكز في صدارة تصنيفات الأداء عدة مرات منذ أوائل عام 2025. ففي فبراير 2025، عادل “ديب سيك – آر 1” لفترة وجيزة أفضل نموذج أمريكي. واعتبارًا من مارس 2026، يتفوق أفضل نموذج أمريكي بنسبة 2.7%، مع فجوة تذبذبت خلال العام الماضي لكنها ظلت ضمن خانة الآحاد.
وتواجه المعايير المستخدمة لقياس تقدم الذكاء الاصطناعي مخاوف متزايدة بشأن الموثوقية والتلاعب، حيث تصل معدلات الخطأ إلى 42% في التقييمات واسعة الانتشار. وقد وجدت مراجعة أن معدلات الأسئلة غير الصالحة تتراوح بين 2% في اختبار فهم اللغة متعدد المهام الضخم (MMLU) للرياضيات و42% في اختبار رياضيات المرحلة الابتدائية 8 كي (GSM8K). وتشير دراسة منفصلة إلى أن ترتيب المتصدرين في منصة “أرينا ليدربورد” قد يعكس جزئيًا التكيف مع المنصة وليس القدرات العامة.
وبدأت نماذج توليد الفيديو في فهم سلوك الأجسام. وقد أظهر نموذج “فيو 3” (Veo 3) من “غوغل ديب مايند”، الذي تم اختباره على أكثر من 18000 فيديو مُولّد، قدرات مثل محاكاة الطفو وحل المتاهات دون تدريب مسبق على هذه المهام.
ويمكن لنماذج الذكاء الاصطناعي الفوز بميدالية ذهبية في أولمبياد الرياضيات الدولي، لكنها لا تزال غير قادرة على تحديد الوقت بدقة، مما يوضح ما يسميه الباحثون “الذكاء غير المتجانس”. وحقق برنامج “جيمني ديب ثينك 35” ((Gemini Deep Think 35 نقطة (ذهبية) في أولمبياد الرياضيات الدولي 2025، حيث أنجز المهمة كاملةً باللغة الطبيعية خلال مهلة 4.5 ساعات، متقدمًا بذلك على 28 نقطة (فضية) التي حققها في عام 2024. وفي اختبار “كلوك بنتش” (ClockBench)، قرأ النموذج الأفضل الساعات التناظرية بدقة 50.6% من الوقت، مقارنةً بنسبة 90.1% للبشر.
وتتوسع 8 نماذج ذكاء اصطناعي لتشمل مجالات مهنية، حيث تُظهر أداءً يتراوح بين 60% و90% في تقييمات الضرائب، ومعالجة الرهون العقارية، وتمويل الشركات، والاستدلال القانوني. ويفصل بين أداء أفضل 15 نموذجًا ما لا يتجاوز 3 نقاط مئوية في كل معيار. ولا تزال هذه المجالات، التي تتطلب كفاءة وموثوقية عاليتين، تشكل تحديًا كبيرًا لنماذج الذكاء الاصطناعي.
وفي عام 2025، انتقلت 9 أنظمة ذكاء اصطناعي من مجرد الإجابة على الأسئلة إلى إنجاز المهام، على الرغم من أنها لا تزال تفشل في حوالي ثلث محاولاتها في المعايير المنظمة. في منصة “أو اس وورلد” (OSWorld)، التي تختبر أداء الروبوتات في مهام حاسوبية حقيقية عبر أنظمة تشغيل مختلفة، ارتفعت الدقة من حوالي 12% إلى 66.3%، بفارق لا يتجاوز 6 نقاط مئوية عن الأداء البشري.
ولا تزال الروبوتات تفشل في معظم المهام المنزلية، حتى مع تفوقها في البيئات الخاضعة للتحكم. إذ لا تنجح إلا في 12% فقط من المهام المنزلية الحقيقية، مما يُبرز مدى بُعد الذكاء الاصطناعي عن إتقان العالم المادي. في منصة “آر ال بينتش” (RLBench)، بلغت نسبة نجاح التلاعب الروبوتي في عمليات المحاكاة البرمجية 89.4%، لكن الفجوة بين بيئات المختبرات القابلة للتنبؤ والبيئات المنزلية غير القابلة للتنبؤ واسعة.
وقد وصلت المركبات ذاتية القيادة إلى الانتشار الواسع النطاق في عام 2025. وسجلت شركة “ويمو” (Waymo) حوالي 450,000 رحلة أسبوعيًا في خمس مدن أمريكية. وفي الصين، أكملت شركة “ابوللو غو 11” (Apollo Go 11) مليون رحلة بدون سائق بالكامل، بزيادة قدرها 175% على أساس سنوي. وتعمل شركات التشغيل الأوروبية بنشاط في هذا المجال، لكن بيانات النشر المقارنة غير متاحة للجمهور، مما يحد من الصورة العالمية. عمليات الانتشار حتى الآن تتم في مناطق ذات طقس مواتٍ بشكل عام، ويتواجد أفراد خارج الموقع لتولي زمام الأمور عند الضرورة.
وانخفض عدد باحثي ومطوري الذكاء الاصطناعي الذين ينتقلون إلى الولايات المتحدة بنسبة 89% منذ عام 2017. ويتسارع هذا الانخفاض، حيث انخفض بنسبة 80% في العام الماضي وحده. ولا تزال الولايات المتحدة موطنًا لأكبر عدد من المواهب في مجال الذكاء الاصطناعي مقارنة بأي دولة أخرى، لكنها تستقطب المواهب الجديدة بأدنى معدل لها منذ أكثر من عقد.
وتشهد خريطة مواهب الذكاء الاصطناعي تحولًا، لكن الفجوات بين الجنسين لا تزال متجذرة بعمق. وتتصدر سويسرا وسنغافورة العالم في عدد باحثي ومطوري الذكاء الاصطناعي نسبةً إلى عدد السكان، وتُظهر بعض الدول تمثيلًا نسائيًا أعلى نسبيًا، بما في ذلك المملكة العربية السعودية (32.3%)، وكندا (29.6%)، وأستراليا (30.1%)، مع العلم أنه لا توجد دولة تقترب من التكافؤ بين الجنسين.

الفصل الثالث: الذكاء الاصطناعي المسؤول
يتزايد استخدام معايير الذكاء الاصطناعي المسؤول، لكنها لا تواكب التطورات والتطبيقات الحديثة في هذا المجال. ويقدم معظم مطوري النماذج الرائدة نتائجهم على معايير القدرات مثل “ام ام ال يو” (MMLU) و”اس دبليو إي-بينتش” (SWE-bench)، إلا أن التقارير المتعلقة بمعايير الذكاء الاصطناعي المسؤول لا تزال قليلة. وقد استمرت حوادث الذكاء الاصطناعي الموثقة في الارتفاع، حيث سجلت قاعدة بيانات حوادث الذكاء الاصطناعي 362 حادثة في عام 2025، مقارنة بـ 233 حادثة في عام 2024.
و تواجه نماذج الذكاء الاصطناعي صعوبة في التمييز بين المعرفة والاعتقاد. ففي معيار دقة جديد، تراوحت معدلات الهلوسة بين 22% و94% في 26 نموذجًا من أفضل النماذج. وانخفضت دقة “جي بي تي 4.0″ (GPT-40) من 98.2% إلى 64.4%، وانخفضت دقة”ديب سيك آر1” (DeepSeek R1) من أكثر من 90% إلى 14.4%. وعندما تُعرض عبارة خاطئة على أنها شيء يعتقده شخص آخر، تتعامل النماذج معها بشكل جيد. أما عندما تُعرض العبارة الخاطئة نفسها على أنها شيء يعتقده المستخدم، ينهار الأداء.
و تعمل المنظمات على إضفاء الطابع الرسمي على ممارسات الذكاء الاصطناعي المسؤولة، إلا أن فجوات المعرفة والميزانية لا تزال تعيق التبني. وقد نمت أدوار الحوكمة الخاصة بالذكاء الاصطناعي بنسبة 17% في عام 2025، وانخفضت نسبة الشركات التي لا تملك سياسات للذكاء الاصطناعي المسؤول انخفاضًا حادًا من 24% إلى 11%. ولا تزال العقبات الرئيسية أمام التنفيذ تتمثل في فجوات المعرفة (59%)، وقيود الميزانية (48%)، وعدم اليقين التنظيمي (41%).
ويتجه مزيج اللوائح التي تُشكل ممارسات الذكاء الاصطناعي المسؤولة نحو أطر عمل ومعايير تقنية خاصة بالذكاء الاصطناعي. ولا تزال اللائحة العامة لحماية البيانات “جي دي بي آر” (GDPR) هي التأثير التنظيمي الأكثر شيوعًا، ولكن نسبة استخدامها انخفضت من 65% في عام 2024 إلى 60% في عام 2025. وتشمل الإضافات الجديدة في عام 2025 معيار “ايزو/آي إي سي 42001” (ISO/IEC 42001)، وهو معيار لنظام إدارة الذكاء الاصطناعي، والذي ذكره 36% من المشاركين، وإطار إدارة مخاطر الذكاء الاصطناعي الصادر عن المعهد الوطني للمعايير والتقنية (NIST)بنسبة 33%. وانخفضت نسبة المنظمات التي أفادت بعدم وجود أي تأثير تنظيمي على الإطلاق من 17% إلى 12%.
ويعمل الذكاء الاصطناعي بشكل أفضل باللغة الإنجليزية، والفجوة أوسع مما تشير إليه المعايير العالمية. وفي اختبار “هيلم ارابك” (HELM Arabic)، تفوّق نموذجٌ مُطوّرٌ إقليميًا للغة العربية على نموذجي “جي بي تي – 5.1″ (GPT-5.1) و”جيمني 2.5 فلاش” (Gemini 2.5 Flash). وتتسع الفجوة على مستوى اللهجات. ففي اختبارٍ للمنطق السليم في اللغة السلوفينية، فقدت العديد من النماذج الرائدة ما يقارب نصف دقتها عند اختبارها بلهجةٍ إقليمية بدلًا من اللغة القياسية.
وتراجعت شفافية شركات الذكاء الاصطناعي هذا العام. فبعد ارتفاع مؤشر شفافية نماذج مؤسسة الذكاء الاصطناعي من 37 إلى 58 بين عامي 2023 و2024، انخفض متوسط الدرجات إلى 40 في عام 2025. ولا تزال هناك فجواتٌ كبيرةٌ في الإفصاح عن بيانات التدريب، وموارد الحوسبة، وتأثير ما بعد النشر.
وتُحقق نماذج الذكاء الاصطناعي أداءً جيدًا في اختبارات السلامة في الظروف العادية، لكن دفاعاتها تضعف عند تعرضها لهجومٍ مُتعمّد. ففي معيار “أيه آي لومينيت” (AILuminate) [معيار للذكاء الاصطناعي]، حصلت العديد من النماذج الرائدة على تقييمات سلامة “جيدة جدًا” أو “جيدة” في ظل الاستخدام القياسي. وعند اختبارها ضد محاولات اختراق باستخدام مطالباتٍ مُضلّلة، انخفض أداء السلامة في جميع النماذج المختبرة.
وتتعارض أبعاد الذكاء الاصطناعي المسؤول، كالأمان والإنصاف والخصوصية، فيما بينها، ولا تزال المفاضلات بينها غير مفهومة تمامًا. وقد وجدت دراسات تجريبية حديثة أن أساليب التدريب التي تهدف إلى تحسين أحد أبعاد الذكاء الاصطناعي المسؤول تؤدي باستمرار إلى تدهور الأبعاد الأخرى.

قريبا: ملخص تقرير مؤشر ستانفورد للذكاء الاصطناعي لعام 2026م (ج3).

رابط الجزء الأول: https://www.qatifscience.com/?p=34800

المصدر:
https://hai.stanford.edu/ai-index/2026-ai-index-report

شاهد تقرير مرئي عن اعلان اصدار التقرير عبر الرابط:
https://www.youtube.com/watch?v=ouIeC1fogvU&t=63s

المهندس محمد جواد آل السيد ناصر الخضراوي

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *