تشخیص هویت و لب خوانی خودکار در محیط چندگوينده با استفاده از هوش مصنوعی
Category: نرمافزار و فناوری اطلاعات
توضیحات
این محصول یک سیستم لبخوانی هوشمند است که میتواند گفتار افراد را تنها بر اساس حرکات لبها به متن تبدیل کند، حتی زمانی که صدا خراب، نامفهوم یا بهطور کامل در دسترس نباشد. عملکرد این محصول به این صورت است که ابتدا ویدئوی فرد دریافت میشود، سپس با الگوریتمهای پیشرفته تشخیص چهره و استخراج لب، ناحیهی مربوط به حرکت دهان جدا شده و پس از انجام پردازشهای لازم به مدل یادگیری عمیق ارسال میگردد. مدل با تحلیل دقیق تغییرات لبها، محتوای گفتار را بازسازی کرده و به صورت متن خروجی میدهد. این سیستم میتواند در حوزههایی مانند ارتباط برای ناشنوایان، بازسازی مکالمات در شرایط نویزی، امنیت و پزشکی قانونی مورد استفاده قرار گیرد و یک راهکار نوآورانه برای تبدیل ویدئوهای بیصدا یا با صدای آسیبدیده به متن محسوب میشود.










