التخزين، وليس السيليكون، هو ما سيُحفّز الاختراق القادم للذكاء الاصطناعي | رأي

الإفصاح: الآراء والأفكار الواردة هنا تنتمي فقط إلى المؤلف ولا تمثل آراء ووجهات نظر هيئة تحرير crypto.news.

الجدل حول قوة معالجة الرسومات ليس جديدًا. الناجحون في المستقبل هم من يتقنون إدارة البيانات. ومع استمرار النمو الهائل في إنتاج البيانات عالميًا، ستُحرم الشركات المتأخرة من مرحلة الابتكار التالية.

ملخص

  • تتزايد أحجام البيانات بشكل هائل، حيث من المتوقع أن يتجاوز حجم الإنتاج العالمي 200 زيتابايت بحلول نهاية عام 2025، وهو ما يزيد عن إجمالي الناتج البشري السابق مجتمعاً.
  • يعد التخزين السحابي المركزي بمثابة عنق زجاجة الذكاء الاصطناعي، حيث يؤدي إلى تضخم التكاليف بنسبة تصل إلى 80% مع رسوم الخروج وإبطاء عمليات نقل البيانات على نطاق واسع إلى أيام.
  • توفر شبكات التخزين اللامركزية حلاً، من خلال تقسيم البيانات عبر العقد المستقلة وتضمين أدلة تشفيرية لمسارات التدقيق الجاهزة للامتثال.
  • إن التنظيم مثل قانون الذكاء الاصطناعي في الاتحاد الأوروبي يرفع المخاطر، ويفرض إثبات مصدر البيانات – مما يجعل التخزين أولوية استراتيجية، وليس مجرد أداة خلفية.

منالمتوقع أن يصل حجم إنتاج البيانات إلى 200 زيتابايت عالميًا بحلول نهاية عام 2025؛ وهو ما يكفي لبث جميع الأفلام التي أُنتجت على الإطلاق أكثر من 100 مليار مرة. ويشمل هذا التقدير كمية من المواد الرقمية تفوق ما أنتجته البشرية في كل عام سابق مجتمعة.

بالتزامن مع هذه الطفرة، كشفت فرق بحثية عن أول نموذج لغوي عام مُكوّن من تريليون مُعامل. هذا النموذج العملاق، الذي كان بإمكان مجموعة تدريباته وحدها أن تملأ أرشيفات وطنية كاملة قبل عشر سنوات، هو مثال على هذا النموذج العملاق الذي يستهلك بيتابايتات في الساعة.

بدون خطوط أنابيب التخزين التي يمكنها استيعاب البيانات وتوزيعها وبثها بهذه المقاييس المكتشفة حديثًا، حتى أسرع المعالجات سوف تعاني من الإحباط الناتج عن الخمول.

السحب المركزية هي عنق الزجاجة الجديد

لا تزال معظم المؤسسات تعتمد على عدد قليل من صوامع التخزين الضخمة المصممة لتطبيقات الويب، وليس على العلوم المتقدمة. والتكاليف المالية باهظة.

كشف تدقيقٌ صناعيٌّ نُشر في أبريل/نيسان أن رسومَ الخروج والاسترجاع الخفية قد تزيد تكاليف التخزين الفعلية بنسبة تصل إلى 80%، مما يجعل إعادة تدريب النماذج الروتينية مسعىً مُرهِقًا للميزانية. والأسوأ من ذلك، أن نقل عشرات البيتابايتات عبر المناطق قد يستغرق أيامًا؛ وهو وقتٌ طويلٌ جدًا عندما تُقاس الميزة التنافسية بدورات التكرار.

لذا، فإن المركزية لا تقتصر على تضخيم الفواتير؛ بل تُرسّخ عدم المساواة مباشرةً في اقتصاد الذكاء الاصطناعي، مانحةً الشركات القائمة ذات الثروات الطائلة أفضليةً تلقائية على الآخرين. واستجابةً لهذا الواقع، يكتسب نموذجٌ مختلف زخمًا متزايدًا، حيث تُمهّد شبكات التخزين اللامركزية، التي تُقسّم البيانات عبر آلاف العُقد المستقلة، الطريق لمستقبلٍ قائمٍ على المساواة.

من الأمور الحيوية أيضًا ضرورة وجود مسارات تدقيق شفافة تُلبي متطلبات الإفصاح المُلحة حول كيفية الحصول على بيانات التداول، ومعالجتها، وإدارتها. في نهاية المطاف، سيكون التنظيم هو العامل الحاسم في تحديد ما إذا كانت نماذج الغد ستُبصر النور أم ستواجه دعاوى قضائية.

اختبار الضغط الجديد للتخزين

يتجاوز الذكاء الاصطناعي الآني حدود مراكز البيانات، دافعًا النماذج إلى مصانع ومستشفيات ومركبات ذاتية القيادة. في هذه المناطق، قد يؤدي ضياع جزء من الثانية بسبب بطء عمليات الإدخال والإخراج إلى عطل في الإنتاج أو خطر على السلامة.

تثبت أحدث معايير MLPerf Storage v2.0 الضغط: حيث يستغرق الآن فحص حمل عمل من فئة GPT عبر 10000 مسرع 37 ثانية، وحتى مجموعة فائقة من وحدات معالجة الرسومات تحتوي على 100000 وحدة معالجة رسومات لا تزال تتوقف لمدة 4.4 ثانية أثناء الانتظار على الأقراص بدلاً من إجراء العمليات الحسابية.

ما لم تتمكن خطوط الأنابيب من توصيل البيتابايتات دفعةً واحدة، ثم تكرار البيانات نفسها على آلاف المواقع الصغيرة، سيظل "الذكاء الاصطناعي على الحافة" أكثر أهميةً من الواقع. ويردِّد المحللون بالفعل تحذيراتهم من أن معدل نقل البيانات في التخزين، وليس الذاكرة أو الشبكات، سيكون العائق الرئيسي الذي يُعيق نمو مجموعات البيانات من الجيل التالي.

وتضيف اللوائح التنظيمية طبقة أخرى من الإلحاح، مثل قانون الذكاء الاصطناعي للاتحاد الأوروبي، الذي دخل موجة التنفيذ الثانية في الثاني من أغسطس/آب ــ مما أجبر مقدمي النماذج للأغراض العامة على توثيق كل جزء من بيانات التدريب… أو المخاطرة بغرامات تصل إلى 7% من إجمالي المبيعات العالمية.

تُكافح الصوامع المركزية لتلبية هذه المهمة. تُشوّه النسخ المُكررة المصدر، وتُعيق سجلات الخروج المُبهمة مسارات التدقيق للمحاسبين. على النقيض من ذلك، تُدمج الشبكات اللامركزية أدلة تشفيرية للتكرار في بنيتها الأساسية، مما يُحوّل الامتثال إلى مُنتج ثانوي بدلاً من إضافة مُكلفة.

تجاهل التخزين على حساب الخطر

مع زمن وصول طرفي يُقاس بالميكروثانية، وعقوبات قانونية تُقاس بالمليارات، لم يعد التخزين مجرد أداة مساعدة؛ بل هو الركيزة الأساسية الوحيدة التي يُمكن للذكاء الاصطناعي المستقبلي أن يعمل عليها قانونيًا وماديًا. الشركات التي لا تزال تُعامل السعة كسلعة أساسية تُواجه ديونًا تقنية وصدمة تنظيمية بنفس القدر.

وسوف تستمر الابتكارات في مجال الحوسبة في سرقة عناوين الأخبار، ولكن بدون إعادة التفكير الجذري بنفس القدر في مكان (وكيفية) وجود البيانات، فإن أكثر أنواع السيليكون تقدماً سوف تظل خاملة في حين تتزايد التكاليف ومخاطر الامتثال.

بدأ سباق الهيمنة على الذكاء الاصطناعي، وسيفوز به من يرفعون التخزين إلى أولوية استراتيجية من الطراز الأول، ويتبنون اللامركزية، ويبنون قنوات جاهزة للتدقيق، تتوسع من النواة إلى الحافة. سيكتشف الجميع أن أي قوة وحدة معالجة رسومية (GPU) لا يمكنها تجاوز عنق الزجاجة المتجذر في أسس مجموعتهم.

كاي واورزينيك

كاي واورزينيك

كاي فاورزينيك هو أحد مؤسسي شركتي إمبوسيبل كلاود وشبكة إمبوسيبل كلاود. وهو رائد أعمال مخضرم حاصل على درجة الدكتوراه في القانون، وله سجل حافل في بناء مشاريع ناجحة. إدراكًا منه للحاجة إلى حلول على مستوى المؤسسات في مجال الويب 3، أسس كاي شبكة إمبوسيبل كلاود (ICN)، وهي منصة سحابية لامركزية تهدف إلى إيجاد بديل لامركزي لخدمات أمازون ويب. قبل تأسيس ICN، أسس كاي شركة جودجيم ستوديوز، وهي شركة ألعاب إلكترونية، ونما عدد موظفيها إلى أكثر من 1000 موظف، وحققت إيرادات تجاوزت مليار يورو، وأُدرجت أسهمها في بورصة ناسداك عام 2018 من خلال اندماج عكسي.

source

Leave a Reply

Your email address will not be published. Required fields are marked *