أنت تسبح في بحر من البيانات. تُنتج بيانات جديدة كل يوم. إذا كان تطبيقك الصحي يحسب خطواتك؟ فهذه بيانات جديدة. خاتم أورا الذي يتتبع بياناتك الحيوية؟ بيانات قيّمة. منشوراتك على مواقع التواصل الاجتماعي، حتى النكات السخيفة التي لم تحظَ بأي إعجابات؟ المزيد من البيانات.
هذه كلها بيانات ترغب شركات الذكاء الاصطناعي في جمعها. لا يمكن بناء ذكاء اصطناعي جيد بدون بيانات جيدة، ولذلك يعتبر الكثيرون البيانات "السلاح الجديد" في سباق الذكاء الاصطناعي. لكن المشكلة تكمن في أنه على الرغم من قيمة بياناتك نظريًا ، إلا أنه في الواقع يصعب تحقيق الربح من بياناتك الشخصية، لأنك لا تملك أي نفوذ كفرد. (الذكاء الاصطناعي المفتوح لا يطرق بابك لشراء تغريداتك القديمة).
هنا يأتي دور فانا . تقول آنا كازلاوسكاس، الشريكة المؤسسة لفانا والرئيسة التنفيذية لمختبرات البيانات المفتوحة: "أعتقد أن البيانات هي هذا المورد الأساسي الذي يُحرك الجيل القادم من الذكاء الاصطناعي، بل الجيل القادم من اقتصادنا الرقمي". وتضيف: "بصراحة، كثير من الناس لا يدركون أنهم يمتلكون بياناتهم بالفعل".
لكن بياناتك ملكك. وهي قيّمة… إذا استطعتَ بطريقة ما التعاون مع ملايين الآخرين الذين يملكون بياناتهم أيضًا. سيمنحك هذا قوة تفاوضية. وهذه هي مهمة فانا: إنشاء نظام بيئي للبيانات المملوكة للمستخدمين، والذي بدوره يُغذي الذكاء الاصطناعي الخاص بهم.
يتضمن هذا النظام البيئي مزيجًا من منظمات البيانات اللامركزية المستقلة (Data DAOs) (اتحاد عمالي للبيانات)، وأسواق البيانات اللامركزية، ورمز VRC-20 الذي أُطلق مؤخرًا، وتعاونًا جديدًا مع Flower Labs لبناء أول نموذج أساسي مملوك للمستخدم في العالم. (يُظهر الدليل الأول أن الذكاء الاصطناعي اللامركزي يتسلل إلى التيار الرئيسي: غطت مجلة WIRED تعاون Vana/Flower.)
ستلقي كازلاوسكاس كلمة رئيسية في قمة الذكاء الاصطناعي ضمن مؤتمر "كونسنسوس 2025" تستعرض فيها هذه الرؤية، وتعرض لمحة عنها هنا. وترى أن الزخم يتغير. "بدأنا بالفعل نشهد هذا التحول، حيث يدرك المزيد من الناس أن بياناتهم مهمة جدًا للذكاء الاصطناعي، وأنهم يمتلكونها بالفعل". وتتوقع أنه في غضون بضع سنوات، سينضم أكثر من 100 مليون مستخدم إلى هذه المجموعة. وبعد 10 سنوات؟ "سيبلغ عدد سكان العالم أكثر من 10 مليارات".
تم اختصار المقابلة وتحريرها قليلاً من أجل الوضوح.
لماذا تعتبر بيانات المستخدم مهمة جدًا بالنسبة لك؟
آنا كازلاوسكاس: يفترض معظم الناس أن البيانات مملوكة للمنصات التي تُخزَّن عليها، لكن هذا ليس صحيحًا. تمامًا كما هو الحال عندما تضع سيارتك في موقف السيارات، فإن موقف السيارات لا يملكها. يمكنك دائمًا استعادتها. أنت تملكها بالكامل.
تُجنى أموال طائلة اليوم، معظمها من شركات التكنولوجيا الكبرى، من هذه البيانات، لكن المستخدمين هم المالكون الشرعيون. لذا أعتقد أنه من المهم استعادة هذه الملكية، سواءً من منظور المستخدم أو من منظور المطور.
هل يمكنك ربط النقاط حول كيفية مساعدة هذا للمطورين؟
كمطور، وخاصةً في عالم الذكاء الاصطناعي، يُعدّ الوصول إلى البيانات الصحيحة أمرًا بالغ الأهمية. وهو أمرٌ بالغ الصعوبة حاليًا، لأن معظم البيانات محجوزة داخل أسوار شركات التكنولوجيا الكبرى. الكثير من أصدقائي الأذكياء الذين يعملون في مجال الذكاء الاصطناعي يذهبون للعمل في المختبرات الكبرى، لأن البيانات والحوسبة موجودة هناك. ولكن ليس بالضرورة أن يكون الأمر كذلك.
كيف تتلاءم منظمات البيانات اللامركزية المستقلة مع هذه الرؤية بالضبط؟
لذا، فإن DataDAO أشبه بنقابة عمالية للبيانات. حيث يوجد في الأساس مجموعة كبيرة من الأشخاص يجمعون بياناتهم معًا، ثم يتخذون قرارات جماعية بشأن مصير تلك البيانات.
أهمية ذلك تكمن في أن بياناتك، بمفردها، ليست مفيدة، أليس كذلك؟ بل هي أكثر فائدة عندما تكون كمية كبيرة منها كافية لتدريب نموذج ذكاء اصطناعي.
ما هي بعض منظمات البيانات اللامركزية المستقلة التي تثير اهتمامك أكثر؟
هناك عدد قليل من الشركات في مجال الصحة مثيرة للاهتمام حقًا. هناك شركة في مرحلة مبكرة تُجري عمليات تصدير كاملة للسجلات الطبية للمرضى، والتي أعتقد أنها ستُسهم بشكل كبير في تطوير الكثير من الأبحاث في هذا المجال. هناك بعض الشركات المتعلقة بالقياسات الحيوية، والنوم، والصحة. وهناك شركة أخرى تعمل مع مختبرات برنامج ولاء السائقين (DLP)؛ حيث تُنشئ بيانات السيارات. وضمن مجموعة بياناتها، تُعتبر بيانات تسلا مثيرة للاهتمام حقًا لأن معظم الناس يعتبرون تسلا قيّمة لأنها تمتلك بيانات رئيسية، أليس كذلك؟ في الواقع، يُمكن للمستخدمين الحصول على الكثير من هذه البيانات.
أنتم تنتقلون من النظرية إلى التطبيق العملي مع تعاونكم الجديد مع فلاور لابز لبناء COLLECTIVE-1. ما الهدف من ذلك؟
COLLECTIVE-1 هو أول نموذج أساسي مملوك للمستخدم. عادةً، عندما يفكر الناس في نموذج أساسي، يتبادر إلى أذهانهم عادةً شركة واحدة تُدير مهمة تدريب ضخمة في مركز بيانات واحد، أليس كذلك؟ مثل OpenAI. والسبب في إجرائه عادةً بطريقة مركزية هو أنه يتطلب، أولاً، قوة حوسبة هائلة، وثانياً، كمية هائلة من البيانات.
Flower AI هي الشركة الرائدة في مجال التدريب الفيدرالي [اللامركزي]. لقد قاموا بعمل رائع في بناء هذه المكتبات مفتوحة المصدر الرائعة. لقد ساهموا في تطوير جانبَي التدريب والخوارزميات. ومع Vana، نركز بشكل كبير على هذه البيانات، أليس كذلك؟ إذًا، لدينا كل هذه البيانات التي يمكن للناس التدريب عليها. ثم نمنح المستخدمين الملكية النهائية للنموذج، ويمكنهم تحديد ما يُسمح للنموذج بفعله. إذًا، هذا هو أول نموذج أساسي من نوعه.
والنظرية هي أنه في النهاية، ومع بيانات أفضل، يُمكن بناء ذكاء اصطناعي ليس فقط قادرًا على منافسة اللاعبين الرئيسيين، بل أفضل أيضًا ، أليس كذلك؟ إذًا، الأمر لا يتعلق بالأيديولوجيا فحسب، بل بالأداء أيضًا.
بالضبط، أجل، هذا صحيح تمامًا. في سياق لامركزي، أعتقد أن الناس غالبًا ما يتفقون من حيث المبدأ على أن "نعم، يجب أن يكون لدينا ذكاء اصطناعي مملوك للشعب. يجب أن يكون لدينا ذكاء اصطناعي لامركزي". ولكن ما الذي يمكننا تحسينه في سياق لامركزي؟ البيانات هي الحل. لكل شركة حصة واحدة فقط من مجموعة البيانات. لدى آبل بياناتها، ولدى جوجل بياناتها. ولكن إذا كنت تتعامل مع المستخدم، يمكنك تجاوز المنصات المختلفة وبناء مجموعات بيانات أفضل من أي شركة بمفردها. البيانات هي السر الذي يجعل كل شيء ناجحًا.
رائع. شكرًا آنا، نلتقي في قمة الذكاء الاصطناعي في تورنتو.
سيستضيف جيف ويلسر قمة الذكاء الاصطناعي في Consensus 2025، وهو مضيف برنامج The People's AI: The Decentralized AI Podcast .