أدوات الذكاء الاصطناعي تفشل في أداء المهام المالية الأساسية دقة نتائجها لم تتجاوز 50 % مما يقدمه محلل مالي مبتدئ.. اخبار عربية

نبض اليمن - كاف بوست


أدوات الذكاء الاصطناعي تفشل في أداء المهام المالية الأساسية دقة نتائجها لم تتجاوز 50 % مما يقدمه محلل مالي مبتدئ


كتب كاف بوست أدوات الذكاء الاصطناعي تفشل في أداء المهام المالية الأساسية دقة نتائجها لم تتجاوز 50 % مما يقدمه محلل مالي مبتدئ..اخبار عربية عبر موقع نبض الجديد - شاهد بينما يتوقع عدد كبير من رواد التكنولوجيا أن الذكاء الاصطناعي سيحلّ محل البشر، وينجز حتى المهامّ المعقدة بسرعة ودقة، فقد دحضت دراسة مستقلة جديدة هذه التوقعات، إذ وجدت أن أدوات الذكاء الاصطناعي غالباً ما تفشل في أدائها عند تنفيذ المهام المالية... , نشر في الأربعاء 2025/04/23 الساعة 11:49 ص بتوقيت مكة المكرمة التفاصيل ومشاهدتها الان .

بينما يتوقع عدد كبير من رواد التكنولوجيا أن الذكاء الاصطناعي سيحلّ محل البشر، وينجز حتى المهامّ المعقدة بسرعة ودقة، فقد دحضت دراسة مستقلة جديدة هذه التوقعات، إذ وجدت أن أدوات الذكاء الاصطناعي غالباً ما تفشل في أدائها عند تنفيذ المهام المالية الأساسية، كما كتبت نيتاشا تيكو، وأندريا خيمينيز في «واشنطن بوست».





22 نموذجاً للذكاء الاصطناعي- دقة أقل 50 %

أظهر اختبار لـ22 نموذجاً للذكاء الاصطناعي للأغراض العامة من «أوبن إيه آي» و«أنثروبيك»، و«إكس إيه آي»، و«ميتا»، و«غوغل»، وغيرها من الشركات الرائدة في مجال الذكاء الاصطناعي، أن جميعها حققت دقة للمهام البسيطة المطلوبة من المحللين الماليين المبتدئين، كانت أقل من 50 في المائة، في المتوسط.

قال رايان كريشنان، الرئيس التنفيذي لشركة فالس للذكاء الاصطناعي «Vals AI»، التي أجرت الدراسة: «إن مستوى الهراء (المصاحب للترويج للذكاء الاصطناعي) الذي نراه، منافٍ للعقل.

ويحقق أحدث نماذج الذكاء الاصطناعي نتائج جيدة في المعايير العامة التي تقيس مهارات الرياضيات أو البرمجة؛ لأن أسئلة هذه الاختبارات منتشرة على نطاق واسع عبر الإنترنت، ومن المرجح أنها أصبحت جزءاً من البيانات التي تُدرَّب عليها أنظمة الذكاء الاصطناعي».

وأضاف: «يُطلق الناس كثيراً من الادعاءات الجريئة حول الذكاء الاصطناعي، لكنها ليست حقيقية لأنها تحمل طابعاً ذاتياً… (وفي الواقع) ليس لدينا ما يُشبه مراجعة (للنتائج) من الأقران الآخرين أو مُدقّقي الحسابات التابعين لجهات خارجية».

500 سؤال لتقييم النماذج

ولتقييم النماذج، طوّرت «فالس للذكاء الاصطناعي» مجموعة بيانات خاصة تضم أكثر من 500 سؤال، كُتبت بالتعاون مع أحد البنوك الرائدة؛ لتقييم مهارات مثل أبحاث السوق والتوقعات.

واجهت معظم نماذج الذكاء الاصطناعي صعوبة في المهام الشائعة، مثل البحث عن معلومات حول «EDGAR»، وهي قاعدة بيانات عامة متاحة للجمهور تابعة لهيئة الأوراق المالية والبورصات الأميركية لملفات الشركات، وهي مورد أساسي للبيانات المالية يستخدمه المحللون والمساهمون والصحافيون ومُختارو الأسهم.

* نموذج «أوبن إيه آي»: حقق أحدث إصدار من الشركة o3، وهو نموذج «استدلال» مصمم للتحدث مع نفسه بصفته وسيلة لتوليد إجابات أكثر دقة عن الاستفسارات المعقدة، دقةً بنسبة 48.3 في المائة، في المتوسط، ولكن بتكلفة 3.69 دولار أميركي للسؤال الواحد في المتوسط.

* نموذج الاستدلال من «أنثروبيك»، المسمى «Claude 3.7 Sonnet»، حقق دقةً بنسبة 44.1 في المائة بسعر أقل بكثير بلغ 1.05 دولار أميركي للسؤال.

* نموذج «ميتا» للذكاء الاصطناعي الأكثر انفتاحاً نسبياً Llama، كان أداؤه ضعيفاً بشكل خاص، حيث سجلت ثلاثة إصدارات دقة أقل من 10 في المائة في المتوسط.

شركات لاختبار وتصنيف الذكاء الاصطناعي

تُعد «فالس إيه آي»، الشركة الناشئة التي تتخذ من سان فرنسيسكو مقراً لها، التي تقف وراء الدراسة، جزءاً من مجموعة متنامية من شركات الطرف الثالث التي تعد باختبار نماذج الذكاء الاصطناعي أو تصنيفها أو فحصها، في ظل ازدياد صعوبة تحليل الضجيج والتهويل في هذا المجال. ومن بين الشركات الجديدة الأخرى في هذا المجال، «Artificial Analysis»، و«Chatbot Arena»؛ وهو مشروع بحثي أكاديمي شهير تحوَّل أخيراً إلى شركة تُعرف الآن باسم «LMArena».

يقول كريشنان إن الاختبار الدقيق والمستقل لكيفية أداء وكلاء الذكاء الاصطناعي مهام محددة أمر حيوي


اقرأ على الموقع الرسمي

شاهد أدوات الذكاء الاصطناعي تفشل في

كانت هذه تفاصيل أدوات الذكاء الاصطناعي تفشل في أداء المهام المالية الأساسية دقة نتائجها لم تتجاوز 50 % مما يقدمه محلل مالي مبتدئ نتمنى بان نكون قد وفقنا بإعطائك التفاصيل والمعلومات الكامله .

و تَجْدَرُ الأشارة بأن المقال الأصلي قد تم نشرة ومتواجد على كاف بوست ونحيطكم علما بان قام فريق التحرير في نبض الجديد بالتاكد منه وربما تم التعديل فيه وربما قد يكون تم النقل بالكامل اوالاقتباس منه ويمكنك قراءة ومتابعة مستجدادت هذا الخبر او المقال من مصدره الاساسي.

تابع نبض الجديد على :
اخبار عربية اليوم