تعلمت الذكاء الاصطناعي لشركة NVIDIA من 5,000 حركة بشرية: تركيب الرسوم المتحركة الواقعية

اكتشف كيف تقوم أحدث أبحاث الذكاء الاصطناعي في NVIDIA بتوليد رسوم متحركة واقعية من النص، وتتعلم من 5,000 حركة بشرية، وتمكّن التحكم في الشخصيات القائمة على الفيزياء. هذه التقنية المتطورة تفتح آفاقًا جديدة للاتساق في الشخصيات، والسرد القصصي، والتجارب التفاعلية. استكشف إمكانات تحويل النص إلى رسوم متحركة والآثار المستقبلية على الرسومات والمحاكاة وما وراءها.

٢٣ ديسمبر ٢٠٢٤

party-gif

اكتشف أحدث التطورات في تقنيات الرسوم المتحركة والمحاكاة المدعومة بالذكاء الاصطناعي التي تغير الطريقة التي نبتكر بها المحتوى الرقمي. من إنشاء شخصيات متسقة إلى محاكاة الحركات المعقدة القائمة على الفيزياء، يستكشف هذا المنشور المدونة البحوث الرائدة التي تدفع حدود ما هو ممكن في الرسومات الكمبيوتر والمؤثرات البصرية.

فتح اتساق الشخصية في الذكاء الاصطناعي من النص إلى الصورة

يُظهر البحث المقدَّم تقدمًا كبيرًا في أنظمة الذكاء الاصطناعي لتحويل النص إلى صورة، حيث يعالج التحدي الأساسي لاتساق الشخصيات. في الماضي، كانت هذه الأنظمة تعاني من صعوبة في إنشاء نفس الشخصيات عبر العديد من الصور، مما أدى إلى عدم الاتساق. ومع ذلك، طور الباحثون نهجًا جديدًا يسمح بإنشاء نفس الشخصيات في مواقف مختلفة.

الابتكار الرئيسي هو القدرة على الحفاظ على هوية الشخصية عند إنشاء صور بناءً على تعليمات نصية. هذا يعني أنه عند طلب نفس الشخص في سيناريوهات مختلفة، سينتج نظام الذكاء الاصطناعي صورًا تتميز بشخصية ثابتة. علاوة على ذلك، يدعم النظام ControlNet، مما يتيح للمستخدمين تقديم وضعيات شخصية عصا التي سيتبناها الشخص بسلاسة، وكل ذلك في غضون 10 ثوان فقط.

يمهد هذا الاختراق الطريق لإنشاء سرديات وقصص متماسكة باستخدام الذكاء الاصطناعي لتحويل النص إلى صورة، حيث لن تتغير الشخصيات المنشأة بشكل غير متوقع بين الصور. إن التطبيقات المحتملة لهذه التكنولوجيا واسعة النطاق، مما يسمح بإنشاء محتوى بصري مبهر بشكل فعال مع الحفاظ على سلامة الشخصية طوال الوقت.

تحريك الحركات المعقدة باستخدام الذكاء الاصطناعي من النص إلى الرسوم المتحركة

يسمح لنا هذا البحث الجديد من NVIDIA بكتابة نص بسيط، وسينشئ الحركة المقابلة على شخصية افتراضية. يمكن للنظام إنشاء مجموعة واسعة من الحركات المعقدة، من البسيطة مثل التنقل إلى الأكثر تعقيدًا مثل الرقص والفنون القتالية.

قام الباحثون بتدريب الذكاء الاصطناعي على حوالي 5,000 حركة مختلفة، مما دفع حدود ما هو موجود عادةً في مجموعات البيانات التدريبية. تتميز التحريكات الناتجة بمستوى عال من التعقيد والواقعية، وذلك بفضل الطبيعة القائمة على الفيزياء لنظام التحريك. ومع ذلك، فإن هذا النهج القائم على الفيزياء يعني أيضًا أن النظام حساس لصياغة التعليمات المستخدمة. قد تؤدي التغييرات الطفيفة في النص إلى نتائج مختلفة تمامًا، حيث يجب على الذكاء الاصطناعي ضمان التزام الحركات المنشأة بقوانين الفيزياء.

على الرغم من هذه القيود، فإن إمكانات هذه التكنولوجيا لتحويل النص إلى تحريك هائلة. يمكن للباحثين الآن إنشاء مجموعة واسعة من التحريكات بسهولة من خلال وصف الحركات المطلوبة بلغة طبيعية، دون الحاجة إلى أعمال تحريك يدوية مكثفة. يفتح هذا إمكانات جديدة للسرد القصصي وتطوير الألعاب والتطبيقات الأخرى التي تتطلب تحريكات ديناميكية محركة بالشخصيات.

محاكاة الرسوم المتحركة القائمة على الفيزياء المتنوعة

يقدم هذا البحث الجديد تقنية مвпечатляющая تسمح لنا بتركيب تحريكات شخصية معقدة من تعليمات نصية بسيطة. تعلم النظام من مجموعة بيانات تضم حوالي 5,000 حركة مختلفة، تغطي مجموعة واسعة من الحركات، من التنقل الأساسي إلى الإجراءات الأكثر تعقيدًا مثل الرقص والفنون القتالية.

ما هو ملاحظ بشكل خاص هو أن هذا نظام تحريك قائم على الفيزياء، مما يعني أن الحركات المنشأة مؤسسة على الواقعية الفيزيائية، بدلاً من كونها إجرائية فقط. يجلب هذا مزايا وتحديات - فالتحريكات دقيقة وواقعية، ولكن النظام أيضًا حساس لصياغة التعليمات، وقد يتسبب في فقدان التوازن أو السقوط إذا تم الضغط عليه بشكل كبير.

على الرغم من هذه القيود، فإن إمكانات هذه التكنولوجيا هائلة. من خلال القدرة على إنشاء تحريكات متنوعة وقائمة على الفيزياء من النص، يمكن للمبدعين إحضار أفكارهم إلى الحياة بسرعة وسهولة، دون الحاجة إلى أعمال تحريك يدوية مكثفة. الأداء في الوقت الفعلي على أجهزة المستهلك مبهر أيضًا.

كما هو الحال مع أي بحث متطور، من المهم النظر إلى ما هو أبعد من القدرات الحالية والنظر في الآثار المستقبلية. مع استمرار تحسين هذه التقنية وتطويرها، ستنمو إمكانات تحويل النص إلى تحريك فقط، مما قد يثور في طريقة إنشاء المحتوى المتحرك.

تقدم في التحليل الحراري والمحاكاة البصرية للموجات

غالبًا ما واجهت تقنيات المحاكاة السابقة صعوبات مع الهندسة المفصلة للغاية، مما جعل مهام مثل التحليل الحراري للأجسام المعقدة مثل مسبار الفضاء الأمريكي كيوريوسيتي على المريخ تحديًا وباهظ التكلفة. ومع ذلك، فإن هذه التقنية المحاكاة الجديدة يمكنها التعامل مع مجموعة واسعة من تمثيلات المدخلات، بما في ذلك الشبكات والسحابات النقطية والحقول الإشعاعية العصبية وغير ذلك، وكل ذلك بخوارزمية واحدة.

يستعير هذا التقدم تقنيات من محاكاة نقل الضوء وتتبع الأشعة، مما يسمح له بمعالجة المشاكل التي كانت مستحيلة أو بطيئة للغاية في السابق. على سبيل المثال، يمكن للتقنية الآن حساب انتشار تغطية الإشارة الخلوية عبر المدينة، مع مراعاة انحناء وانكسار موجات الضوء، مما يؤدي إلى محاكاة أكثر واقعية مقارنة بتمثيلات الأشعة البسيطة.

بينما لا تزال المحاكاة البصرية الموجية بطيئة نسبيًا، يخدم هذا العمل كدليل على المفهوم، مما يُظهر إمكانات هذا النهج. تتوفر التعليمات البرمجية الكاملة للمصدر، مما يتيح للباحثين مواصلة استكشاف وبناء على هذه التقنيات.

بشكل عام، تمثل هذه التطورات في التحليل الحراري والمحاكاة البصرية الموجية تقدمًا كبيرًا في هذا المجال، مما يفتح إمكانات جديدة للمحاكاة الدقيقة والفعالة للظواهر المادية المعقدة.

الخاتمة

إن التطورات التي تم عرضها في هذا البحث مذهلة حقًا. إن القدرة على إنشاء شخصيات متسقة في سيناريوهات مختلفة، فضلاً عن الدمج السلس لتركيب النص إلى الحركة، هي تطورات مغيرة للعبة في مجال الرسومات والتحريك الحاسوبي.

إن إدخال تقنية محاكاة متعددة الاستخدامات قادرة على التعامل مع مجموعة واسعة من التمثيلات الهندسية هو خطوة كبيرة إلى الأمام، مما يمكّن من إجراء محاكاة فعالة ودقيقة عبر مختلف المجالات. يُعد استكشاف محاكاة الضوء البصري الموجي لتحليل تغطية الإشارة الخلوية المحسّنة إنجازًا آخر مبهرًا، مما يُظهر إمكانات دفع حدود ما هو ممكن في الفيزياء الحاسوبية.

تُبرز هذه الابتكارات التقدم السريع الذي يتم إحرازه في مجال الذكاء الاصطناعي والرسومات الحاسوبية. كما يشير القانون الأول للأوراق البحثية، فإن الإمكانات الحقيقية لهذه التقنيات تكمن في تطبيقاتها المستقبلية، حيث يمكن تحسينها وتكاملها في مشاريع أكثر طموحًا.

يؤكد الأداء في الوقت الفعلي والإمكانية الوصول إلى هذه الأدوات، كما هو موضح في تسليم البيتزا المبهر في مقهى NVIDIA، على الآثار العملية لهذا البحث. يحمل المستقبل إمكانات مثيرة للباحثين والممارسين على حد سواء لاستخدام هذه التطورات ودفع حدود ما هو ممكن في مجال الرسومات الحاسوبية والتحريك وما إلى ذلك.

التعليمات