مؤخراً، حققت أسهم إنفيديا أعلى مستوياتها على الإطلاق، حيث عززت التقدم في نماذج متعددة الأنماط المزايا التقنية لـ Web2 AI. من المحاذاة الدلالية إلى الفهم البصري، ومن الإدخالات عالية الأبعاد إلى دمج الميزات، تقوم النماذج المعقدة بدمج طرق التعبير المختلفة بسرعات غير مسبوقة، مما يبني مرتفعات AI مغلقة بشكل متزايد. كما أن سوق الأسهم الأمريكية أعطى تأكيداً عملياً، سواء كانت الأسهم المتعلقة بالعملات المشفرة أو أسهم الذكاء الاصطناعي، فقد أظهرت جميعها موجة من الاتجاه الصعودي الصغير.
ومع ذلك، يبدو أن هذه الحماسة لا علاقة لها بمجال العملات المشفرة. لقد لاحظنا محاولات Web3 AI، وخاصةً استكشافات Agent في الأشهر القليلة الماضية، يبدو أن الاتجاه يعاني من انحراف: محاولة تجميع نظام نمطي متعدد الوسائط على طراز Web2 باستخدام هيكل لامركزي، في الواقع هي نوع من عدم التوافق الفني والفكري. في ظل الترابط القوي بين الوحدات، وعدم استقرار توزيع الميزات، وتزايد الطلب على القدرة الحاسوبية، من الصعب أن تجد الأنظمة النمطية المتعددة الوسائط موطئ قدم لها في بيئة Web3.
مستقبل Web3 AI لا يكمن في التقليد البسيط، بل في المناورة الاستراتيجية. من محاذاة المعاني في الفضاءات عالية الأبعاد، إلى عنق الزجاجة في آلية الانتباه، وصولاً إلى محاذاة الميزات تحت القوة الحاسوبية غير المتجانسة، هذه كلها قضايا تحتاج إلى تفكير عميق.
التحديات التي تواجه Web3 AI
معضلة توافق المعاني
في أنظمة الويب 2 الحديثة متعددة الوسائط للذكاء الاصطناعي، تشير "محاذاة المعنى" إلى رسم معلومات مختلفة من أوضاع متعددة إلى نفس الفضاء الدلالي، مما يمكّن النموذج من فهم ومقارنة المعاني الكامنة وراء هذه الإشارات التي تبدو مختلفة تمامًا. يتطلب ذلك وجود فضاء تضمين عالي الأبعاد كشرط مسبق لتحقيق Modularization في سير العمل وزيادة الكفاءة.
ومع ذلك، فإن بروتوكول Web3 Agent يصعب تحقيقه في الإدخال عالي الأبعاد. معظم Web3 Agent ليست سوى تجميع API الجاهزة في وحدات مستقلة، مما يفتقر إلى مساحة إدخال مركزية موحدة وآلية انتباه عبر الوحدات، مما يؤدي إلى عدم قدرة المعلومات على التفاعل بين الوحدات من زوايا متعددة وبأبعاد متعددة، ولا يمكن أن تعمل إلا وفقًا لعملية خطية، مما يجعل من الصعب تشكيل تحسين حلقة مغلقة شاملة.
لتحقيق وكيل ذكي شامل تنافسي، يجب أن نبدأ من النمذجة المشتركة من النهاية إلى النهاية، والتضمين الموحد عبر الوحدات، بالإضافة إلى الهندسة النظامية لتدريب ونشر متعاون. لكن يبدو أنه لا توجد مثل هذه الطلبات في السوق الحالية.
قيود آلية الانتباه
تحتاج النماذج المتعددة الوسائط عالية المستوى إلى آلية انتباه مصممة بدقة. تعتبر آلية الانتباه في جوهرها وسيلة لتوزيع موارد الحساب بشكل ديناميكي، مما يسمح للنموذج بالتركيز بشكل انتقائي على الأجزاء الأكثر صلة عند معالجة إدخال معين.
ومع ذلك، فإن Web3 AI القائم على النمذجة يعاني من صعوبة في تحقيق جدولة انتباه موحدة. أولاً، تعتمد آلية الانتباه على مساحة موحدة من Query-Key-Value، بينما تختلف تنسيقات البيانات وتوزيعها التي تعود بها APIs المستقلة، مما يجعل من الصعب تشكيل Q/K/V قابلة للتفاعل. ثانياً، يسمح الانتباه متعدد الرؤوس بالتركيز في وقت واحد على مصادر معلومات مختلفة، بينما عادةً ما تكون APIs المستقلة استدعاءات خطية، مما يفتقر إلى القدرة على المعالجة المتوازية، والوزن الديناميكي المتعدد المسارات. أخيراً، تعتمد آلية الانتباه الحقيقية على تخصيص الأوزان ديناميكياً لكل عنصر بناءً على السياق العام، بينما يفتقر نموذج API إلى السياق المركزي القابل للمشاركة في الوقت الحقيقي بين الوحدات.
قيود دمج الميزات
توقفت Web3 AI في مجال دمج الميزات عند مرحلة التجميع الثابت البسيط. الشرط الأساسي لدمج الميزات الديناميكية هو الفضاء عالي الأبعاد وآلية الانتباه الدقيقة، وعندما لا تتوفر هذه الشروط، يصبح من الصعب بالطبع تحقيق نتائج مدمجة فعالة.
تميل الذكاء الاصطناعي في الويب 2 إلى التدريب المشترك من النهاية إلى النهاية، حيث تعالج ميزات متعددة النماذج في نفس الفضاء عالي الأبعاد، وتقوم بتحسين التعاون مع طبقات المهام السفلية من خلال طبقات الانتباه وطبقات الدمج. بالمقابل، يعتمد الذكاء الاصطناعي في الويب 3 بشكل أكبر على تجميع الوحدات المنفصلة، مما يفتقر إلى هدف تدريبي موحد وتدفق تدرجات عبر الوحدات.
حواجز صناعة الذكاء الاصطناعي وفرص المستقبل
تتعمق حواجز التقنية في صناعة الذكاء الاصطناعي، لكن النقاط المؤلمة الحقيقية لم تظهر بعد. نظام النماذج المتعددة في Web2 AI هو مشروع هندسي ضخم يتطلب كميات هائلة من البيانات، وقوة حسابية قوية، وخوارزميات متطورة، وتنفيذ هندسي فعال، مما يشكل حاجزاً قوياً للغاية في الصناعة.
يجب أن يتبنى تطوير Web3 AI استراتيجية "تحيط القرى بالمدن"، من خلال دخول المشاهد الهامشية، والبحث عن الفرص في المهام الخفيفة والهياكل القابلة للتوازي والمحفزة. على سبيل المثال: ضبط LoRA، مهام التدريب بعد التوافق السلوكي، تدريب ووسم البيانات عن طريق الحشود، تدريب نماذج أساسية صغيرة، وتدريب متزامن للأجهزة الهامشية.
ومع ذلك، فإن الحواجز الحالية لـ Web2 AI قد بدأت للتو في التشكيل، وهذه هي المرحلة المبكرة من المنافسة بين الشركات الرائدة. قد تظهر الفرص الحقيقية لـ Web3 AI عندما تختفي عوائد Web2 AI تمامًا. قبل ذلك، تحتاج مشاريع Web3 AI إلى اختيار نقاط دخول بحذر، وضمان قدرتها على التكرار باستمرار في السيناريوهات الصغيرة، مع الحفاظ على المرونة للتكيف مع الاحتياجات المتغيرة للسوق.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 13
أعجبني
13
6
إعادة النشر
مشاركة
تعليق
0/400
ChainSherlockGirl
· 08-15 05:54
الآن، أين يوجد وقت لإدارة web3، الجميع مشغول في تداول أسهم N ليصبح غنياً، هل تعلم؟
أزمات تطوير Web3 AI: الحاجة إلى اختراق توافق المعنى وآلية الانتباه
فرص وتحديات تطوير Web3 AI
مؤخراً، حققت أسهم إنفيديا أعلى مستوياتها على الإطلاق، حيث عززت التقدم في نماذج متعددة الأنماط المزايا التقنية لـ Web2 AI. من المحاذاة الدلالية إلى الفهم البصري، ومن الإدخالات عالية الأبعاد إلى دمج الميزات، تقوم النماذج المعقدة بدمج طرق التعبير المختلفة بسرعات غير مسبوقة، مما يبني مرتفعات AI مغلقة بشكل متزايد. كما أن سوق الأسهم الأمريكية أعطى تأكيداً عملياً، سواء كانت الأسهم المتعلقة بالعملات المشفرة أو أسهم الذكاء الاصطناعي، فقد أظهرت جميعها موجة من الاتجاه الصعودي الصغير.
ومع ذلك، يبدو أن هذه الحماسة لا علاقة لها بمجال العملات المشفرة. لقد لاحظنا محاولات Web3 AI، وخاصةً استكشافات Agent في الأشهر القليلة الماضية، يبدو أن الاتجاه يعاني من انحراف: محاولة تجميع نظام نمطي متعدد الوسائط على طراز Web2 باستخدام هيكل لامركزي، في الواقع هي نوع من عدم التوافق الفني والفكري. في ظل الترابط القوي بين الوحدات، وعدم استقرار توزيع الميزات، وتزايد الطلب على القدرة الحاسوبية، من الصعب أن تجد الأنظمة النمطية المتعددة الوسائط موطئ قدم لها في بيئة Web3.
مستقبل Web3 AI لا يكمن في التقليد البسيط، بل في المناورة الاستراتيجية. من محاذاة المعاني في الفضاءات عالية الأبعاد، إلى عنق الزجاجة في آلية الانتباه، وصولاً إلى محاذاة الميزات تحت القوة الحاسوبية غير المتجانسة، هذه كلها قضايا تحتاج إلى تفكير عميق.
التحديات التي تواجه Web3 AI
معضلة توافق المعاني
في أنظمة الويب 2 الحديثة متعددة الوسائط للذكاء الاصطناعي، تشير "محاذاة المعنى" إلى رسم معلومات مختلفة من أوضاع متعددة إلى نفس الفضاء الدلالي، مما يمكّن النموذج من فهم ومقارنة المعاني الكامنة وراء هذه الإشارات التي تبدو مختلفة تمامًا. يتطلب ذلك وجود فضاء تضمين عالي الأبعاد كشرط مسبق لتحقيق Modularization في سير العمل وزيادة الكفاءة.
ومع ذلك، فإن بروتوكول Web3 Agent يصعب تحقيقه في الإدخال عالي الأبعاد. معظم Web3 Agent ليست سوى تجميع API الجاهزة في وحدات مستقلة، مما يفتقر إلى مساحة إدخال مركزية موحدة وآلية انتباه عبر الوحدات، مما يؤدي إلى عدم قدرة المعلومات على التفاعل بين الوحدات من زوايا متعددة وبأبعاد متعددة، ولا يمكن أن تعمل إلا وفقًا لعملية خطية، مما يجعل من الصعب تشكيل تحسين حلقة مغلقة شاملة.
لتحقيق وكيل ذكي شامل تنافسي، يجب أن نبدأ من النمذجة المشتركة من النهاية إلى النهاية، والتضمين الموحد عبر الوحدات، بالإضافة إلى الهندسة النظامية لتدريب ونشر متعاون. لكن يبدو أنه لا توجد مثل هذه الطلبات في السوق الحالية.
قيود آلية الانتباه
تحتاج النماذج المتعددة الوسائط عالية المستوى إلى آلية انتباه مصممة بدقة. تعتبر آلية الانتباه في جوهرها وسيلة لتوزيع موارد الحساب بشكل ديناميكي، مما يسمح للنموذج بالتركيز بشكل انتقائي على الأجزاء الأكثر صلة عند معالجة إدخال معين.
ومع ذلك، فإن Web3 AI القائم على النمذجة يعاني من صعوبة في تحقيق جدولة انتباه موحدة. أولاً، تعتمد آلية الانتباه على مساحة موحدة من Query-Key-Value، بينما تختلف تنسيقات البيانات وتوزيعها التي تعود بها APIs المستقلة، مما يجعل من الصعب تشكيل Q/K/V قابلة للتفاعل. ثانياً، يسمح الانتباه متعدد الرؤوس بالتركيز في وقت واحد على مصادر معلومات مختلفة، بينما عادةً ما تكون APIs المستقلة استدعاءات خطية، مما يفتقر إلى القدرة على المعالجة المتوازية، والوزن الديناميكي المتعدد المسارات. أخيراً، تعتمد آلية الانتباه الحقيقية على تخصيص الأوزان ديناميكياً لكل عنصر بناءً على السياق العام، بينما يفتقر نموذج API إلى السياق المركزي القابل للمشاركة في الوقت الحقيقي بين الوحدات.
قيود دمج الميزات
توقفت Web3 AI في مجال دمج الميزات عند مرحلة التجميع الثابت البسيط. الشرط الأساسي لدمج الميزات الديناميكية هو الفضاء عالي الأبعاد وآلية الانتباه الدقيقة، وعندما لا تتوفر هذه الشروط، يصبح من الصعب بالطبع تحقيق نتائج مدمجة فعالة.
تميل الذكاء الاصطناعي في الويب 2 إلى التدريب المشترك من النهاية إلى النهاية، حيث تعالج ميزات متعددة النماذج في نفس الفضاء عالي الأبعاد، وتقوم بتحسين التعاون مع طبقات المهام السفلية من خلال طبقات الانتباه وطبقات الدمج. بالمقابل، يعتمد الذكاء الاصطناعي في الويب 3 بشكل أكبر على تجميع الوحدات المنفصلة، مما يفتقر إلى هدف تدريبي موحد وتدفق تدرجات عبر الوحدات.
حواجز صناعة الذكاء الاصطناعي وفرص المستقبل
تتعمق حواجز التقنية في صناعة الذكاء الاصطناعي، لكن النقاط المؤلمة الحقيقية لم تظهر بعد. نظام النماذج المتعددة في Web2 AI هو مشروع هندسي ضخم يتطلب كميات هائلة من البيانات، وقوة حسابية قوية، وخوارزميات متطورة، وتنفيذ هندسي فعال، مما يشكل حاجزاً قوياً للغاية في الصناعة.
يجب أن يتبنى تطوير Web3 AI استراتيجية "تحيط القرى بالمدن"، من خلال دخول المشاهد الهامشية، والبحث عن الفرص في المهام الخفيفة والهياكل القابلة للتوازي والمحفزة. على سبيل المثال: ضبط LoRA، مهام التدريب بعد التوافق السلوكي، تدريب ووسم البيانات عن طريق الحشود، تدريب نماذج أساسية صغيرة، وتدريب متزامن للأجهزة الهامشية.
ومع ذلك، فإن الحواجز الحالية لـ Web2 AI قد بدأت للتو في التشكيل، وهذه هي المرحلة المبكرة من المنافسة بين الشركات الرائدة. قد تظهر الفرص الحقيقية لـ Web3 AI عندما تختفي عوائد Web2 AI تمامًا. قبل ذلك، تحتاج مشاريع Web3 AI إلى اختيار نقاط دخول بحذر، وضمان قدرتها على التكرار باستمرار في السيناريوهات الصغيرة، مع الحفاظ على المرونة للتكيف مع الاحتياجات المتغيرة للسوق.