كشفت مجموعة “علي بابا” (Alibaba) الصينية عن نموذجها الأحدث للذكاء الاصطناعي Qwen2.5-Omni-7B، والذي يتمتع بقدرات متعددة الوسائط، إذ يستطيع معالجة النصوص والصور والمقاطع الصوتية والفيديوهات، إلى جانب توليد استجابات نصية وصوتية طبيعية بشكل لحظي.
وقالت الشركة، عبر صفحة النموذج الرسمية على موقع Hugging Face، إن النموذج الجديد مصمم للعمل بكفاءة عالية حتى على الأجهزة الطرفية مثل الهواتف المحمولة، دون أن يؤثر ذلك في أدائه، ما يجعله خياراً مثالياً لتطوير وكلاء ذكاء اصطناعي مرنين ومنخفضي التكلفة، خاصة في التطبيقات الصوتية الذكية.
وضربت الشركة مثالاً على ذلك باستخدام هذا النموذج لمساعدة الأشخاص المكفوفين، من خلال تقديم أوصاف صوتية لما تراه كاميرا هواتفهم الذكية، مما يُمكّنهم من التنقل في محيطهم بسهولة.
