تحتاج إلى الكثير من البيانات عالية الجودة للتشغيل، باستثناء أنه لا يمكنك فقط جمع بيانات الروبوتات من الإنترنت لأنها تحتاج إلى خبرة وعوامل من العالم الحقيقي.
لا يوجد "إنترنت إجراءات الروبوتات."
تعمل العديد من الفرق وتستثمر أموالاً طائشة في الروبوتات البشرية لأنها الصناعة الواضحة ذات القيمة التي تصل إلى عشرة تريليونات دولار بسبب كفاءتها في تحويل قوة العمل إلى ( أكثر كفاءة من متوسط الأجر الهندي البالغ 50 ألف دولار أمريكي لكل منها ).
لكن أكبر سباق، مثل الذكاء الاصطناعي هو:
1. الحصول على بيانات عالية الجودة 2. مهام التدريب
نماذج المؤسسة تشبه نماذج اللغة الكبيرة في الذكاء الاصطناعي، ولكن بدلاً من إنتاج النصوص، فإنها تنتج أفعالًا للروبوتات.
هناك عدة نهج مختلفة تتبناها الفرق في تدريب المهام، حيث يستخدم البعض مجموعات بيانات عالية الدقة صغيرة الحجم مع التسمية مثل الشكل، بينما يتجه الآخرون إلى الأسلوب العشوائي مع نماذج ضخمة.
الهدف هو تزويد الروبوتات بقدرة واسعة على الفهم العام المدرب مسبقًا والقدرة على التعميم عبر المهام والبيئات.
بدلاً من برمجة روبوت لكل مهمة، تقوم بتدريب نموذج ضخم على بيانات متنوعة ( فيديوهات للبشر، محاكاة، عروض حقيقية للروبوت، صور مع أوصاف نصية للمهام، إلخ )، ويتعلم النموذج فهمًا تجسيديًا للعالم المادي.
يمكنك بعد ذلك توجيه الروبوت للقيام بشيء ( من خلال أمر أو مثال )، ويدخل "معرفة" النموذج الأساسي في العمل للتعامل مع ذلك، مثل كيفية طرح أي سؤال على ChatGPT.
لذا فإن الانفصال الكبير بالنسبة للكثير من هذه الشركات سيكون في مجال تدريب المهام، حيث أنهم يركزون حاليًا بشكل عميق على جانب البيانات (محاكاة العالم، البيانات الاصطناعية، مسارات الروبوتات، مقاطع الفيديو البشرية، إلخ) حيث يحتاجون إلى ذلك للتفاعل بشكل مثالي مع العالم الحقيقي ولكن لا يوجد الكثير من التطوير حول ما يمكن أن تفعله الروبوتات/البشر.
تتقدم شركة إنفيديا في أحد نماذج الأساس الرئيسية (Issac GR00T) التي قامت بفتح مصدرها بالكامل. لقد عملت فرق خارجية بالفعل على بناء تطبيقات فوق هذا النموذج وتحسين الكفاءة بشكل كبير ( حيث قامت بشكل أساسي بإنشاء برنامج للإنسان الآلي لتنظيف غرفة مع تغييرات بسيطة على بيانات نماذج الأساس ).
لذا فإن التداخل الكبير بين العملات المشفرة والذكاء الاصطناعي والروبوتات من المرجح أن يكمن في هذا القطاع الخاص بتدريب المهام ( مثل متجر تطبيقات الروبوتات ) حيث أن نماذج الأساس الرائدة أصبحت بالفعل مفتوحة المصدر ومن المحتمل أن تكون هناك نماذج حوافز كبيرة للمطورين المستقلين للمساهمة وبناء برامج / مهام رائعة للبشر الآليين.
هناك الكثير من التقدم والتطور السائد الذي سيحدث في نهاية العام / أوائل العام المقبل حيث أعتقد أن الروبوتات ستشهد لحظة "تشات جي بي تي" الخاصة بها ( إيلون يروج بقوة لنماذجه البشرية الجديدة، مقاطع فيديو فيروسية للبشر الآليين وهم يقومون بمهام في العالم الحقيقي، تدفق الأموال بشكل حدسي، تسريحات للعمال، إلخ ).
يمكنني أن أعدك أنني لست مخطئًا في هذه الفكرة، تبدو مطابقة تمامًا للذكاء الاصطناعي في عام 2023. الأمر متعلق بالوقت، وليس إذا.
لا تتجاهل واحدة من أكثر التقدمات التكنولوجية ابتكارًا التي حدثت في حياتنا ولا تتجاهل $CODEC، وهو العنوان الوحيد المتاح الذي يجلس عند تقاطع هذه الاتجاه.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تعمل الروبوتات بشكل مشابه جدًا للذكاء الاصطناعي.
تحتاج إلى الكثير من البيانات عالية الجودة للتشغيل، باستثناء أنه لا يمكنك فقط جمع بيانات الروبوتات من الإنترنت لأنها تحتاج إلى خبرة وعوامل من العالم الحقيقي.
لا يوجد "إنترنت إجراءات الروبوتات."
تعمل العديد من الفرق وتستثمر أموالاً طائشة في الروبوتات البشرية لأنها الصناعة الواضحة ذات القيمة التي تصل إلى عشرة تريليونات دولار بسبب كفاءتها في تحويل قوة العمل إلى ( أكثر كفاءة من متوسط الأجر الهندي البالغ 50 ألف دولار أمريكي لكل منها ).
لكن أكبر سباق، مثل الذكاء الاصطناعي هو:
1. الحصول على بيانات عالية الجودة
2. مهام التدريب
نماذج المؤسسة تشبه نماذج اللغة الكبيرة في الذكاء الاصطناعي، ولكن بدلاً من إنتاج النصوص، فإنها تنتج أفعالًا للروبوتات.
هناك عدة نهج مختلفة تتبناها الفرق في تدريب المهام، حيث يستخدم البعض مجموعات بيانات عالية الدقة صغيرة الحجم مع التسمية مثل الشكل، بينما يتجه الآخرون إلى الأسلوب العشوائي مع نماذج ضخمة.
الهدف هو تزويد الروبوتات بقدرة واسعة على الفهم العام المدرب مسبقًا والقدرة على التعميم عبر المهام والبيئات.
بدلاً من برمجة روبوت لكل مهمة، تقوم بتدريب نموذج ضخم على بيانات متنوعة ( فيديوهات للبشر، محاكاة، عروض حقيقية للروبوت، صور مع أوصاف نصية للمهام، إلخ )، ويتعلم النموذج فهمًا تجسيديًا للعالم المادي.
يمكنك بعد ذلك توجيه الروبوت للقيام بشيء ( من خلال أمر أو مثال )، ويدخل "معرفة" النموذج الأساسي في العمل للتعامل مع ذلك، مثل كيفية طرح أي سؤال على ChatGPT.
لذا فإن الانفصال الكبير بالنسبة للكثير من هذه الشركات سيكون في مجال تدريب المهام، حيث أنهم يركزون حاليًا بشكل عميق على جانب البيانات (محاكاة العالم، البيانات الاصطناعية، مسارات الروبوتات، مقاطع الفيديو البشرية، إلخ) حيث يحتاجون إلى ذلك للتفاعل بشكل مثالي مع العالم الحقيقي ولكن لا يوجد الكثير من التطوير حول ما يمكن أن تفعله الروبوتات/البشر.
تتقدم شركة إنفيديا في أحد نماذج الأساس الرئيسية (Issac GR00T) التي قامت بفتح مصدرها بالكامل. لقد عملت فرق خارجية بالفعل على بناء تطبيقات فوق هذا النموذج وتحسين الكفاءة بشكل كبير ( حيث قامت بشكل أساسي بإنشاء برنامج للإنسان الآلي لتنظيف غرفة مع تغييرات بسيطة على بيانات نماذج الأساس ).
لذا فإن التداخل الكبير بين العملات المشفرة والذكاء الاصطناعي والروبوتات من المرجح أن يكمن في هذا القطاع الخاص بتدريب المهام ( مثل متجر تطبيقات الروبوتات ) حيث أن نماذج الأساس الرائدة أصبحت بالفعل مفتوحة المصدر ومن المحتمل أن تكون هناك نماذج حوافز كبيرة للمطورين المستقلين للمساهمة وبناء برامج / مهام رائعة للبشر الآليين.
هناك الكثير من التقدم والتطور السائد الذي سيحدث في نهاية العام / أوائل العام المقبل حيث أعتقد أن الروبوتات ستشهد لحظة "تشات جي بي تي" الخاصة بها ( إيلون يروج بقوة لنماذجه البشرية الجديدة، مقاطع فيديو فيروسية للبشر الآليين وهم يقومون بمهام في العالم الحقيقي، تدفق الأموال بشكل حدسي، تسريحات للعمال، إلخ ).
يمكنني أن أعدك أنني لست مخطئًا في هذه الفكرة، تبدو مطابقة تمامًا للذكاء الاصطناعي في عام 2023. الأمر متعلق بالوقت، وليس إذا.
لا تتجاهل واحدة من أكثر التقدمات التكنولوجية ابتكارًا التي حدثت في حياتنا ولا تتجاهل $CODEC، وهو العنوان الوحيد المتاح الذي يجلس عند تقاطع هذه الاتجاه.