مع تحوّل الذكاء الاصطناعي من النصوص إلى الروبوتات، تدخل معركة بيانات التدريب مرحلة جديدة. تُرسّخ شركة بوسيدون، بدعم من a16z، مكانتها كحَكَمٍ في اقتصاد البيانات من الجيل الجديد، حيث لا مجال للتفاوض بشأن المنشأ والترخيص.
في 22 يوليو، أعلنت Poseidon، وهي طبقة البيانات اللامركزية التي تركز على الذكاء الاصطناعي والمبنية على Story Protocol، عن جولة تمويل أولية بقيمة 15 مليون دولار بقيادة الذراع المشفرة لشركة Andreessen Horowitz، بمشاركة من الداعمين الرئيسيين في الصناعة.
تأسست شركة Poseidon بواسطة Story وشارك في تأسيسها الباحث في مجال الذكاء الاصطناعي Sandeep Chinchali والمهندس Sarick Shah. تدخل Poseidon السوق بمهمة واضحة: فتح وتنظيم وترخيص البيانات الواقعية التي تتطلبها أنظمة الذكاء الاصطناعي من الجيل التالي ولكنها تفتقر إليها حاليًا.
وذكرت الشركة الناشئة أن بنيتها التحتية مصممة لتسهيل جمع وتنظيم البيانات المادية طويلة الأمد، بما في ذلك مقاطع الفيديو الشخصية للأعمال المنزلية وتسجيلات الكلام متعددة اللغات، مع ترميز مصدر IP على مستوى البروتوكول.
يراهن داعمو Poseidon، بما في ذلك a16z crypto، على أن الشركة يمكن أن تصبح النسيج الضام بين المساهمين في البيانات والمطورين الذين يقومون ببناء أنظمة الذكاء الاصطناعي التي تعمل خارج المتصفح.
كيف تخطط شركة بوسيدون لحل مشكلة نقص البيانات في مجال الذكاء الاصطناعي
يرتكز إطار عمل بوسيدون على أربعة مبادئ أساسية، يعالج كلٌ منها عيبًا جوهريًا في مسار تدريب الذكاء الاصطناعي الحالي. أولًا، يُغيّر تصميمه الذي يُركّز على الطلب النموذج التقليدي: فبدلًا من انتظار تحميل المساهمين لبيانات مفيدة، يُحدّد بوسيدون ما يحتاجه مطورو الذكاء الاصطناعي فعليًا، ويُحفّز جمعها بشكل منهجي.
ثانياً، يعترف النطاق اللامركزي بأن التنوع في العالم الحقيقي لا يمكن تزييفه؛ تستخدم المنصة حزم تطوير البرامج للهواتف الذكية والتطبيقات المتخصصة لجمع البيانات على مستوى العالم، مما يضمن التنوع الإقليمي والوضعي.
ثالثًا، يضمن التحقق المنظم خلوّ المدخلات الخام من التكرارات، وتوحيدها لخطوط الأنابيب، وإثرائها بالبيانات الوصفية، مما يُعالج مشكلة "الدخول غير المرغوب فيه، الخروج غير المرغوب فيه" التي تُعاني منها العديد من مجموعات بيانات الذكاء الاصطناعي. وأخيرًا، يُدمج ترخيص الملكية الفكرية، افتراضيًا، الوضوح القانوني في كل أصل عبر سلسلة الكتل الخاصة ببروتوكول القصة، مُتجاوزًا بذلك عوائق حقوق النشر التي أعاقت مشاريع مثل مشروع ويسبر من OpenAI.
صرحت بوسيدون أن هذه البنية تُعدّ حلاً متكاملاً لقيود بيانات الذكاء الاصطناعي. على مستوى التجميع، تتراوح أدواتها من تكاملات محمولة خفيفة الوزن للمساهمين غير الرسميين إلى شراكات أجهزة مخصصة للبيانات المتخصصة.
بمجرد استيعابها، تعمل خطوط أنابيب التعلم الآلي على أتمتة عملية التنظيم، وتجريد المعلومات الشخصية القابلة للتعريف، والإشارة إلى العينات ذات الجودة المنخفضة، وتوجيه الحالات الهامشية إلى المراجعين البشريين.
لكن العنصر الأكثر إزعاجًا هو إدارة الملكية الفكرية: حيث يتم سك كل مجموعة بيانات كأصل قابل للتكوين على blockchain الخاص بـ Story، مع فرض تقسيمات المنشأ والملكية من خلال العقود الذكية.