توضیحات

این محصول یک سیستم لب‌خوانی هوشمند است که می‌تواند گفتار افراد را تنها بر اساس حرکات لب‌ها به متن تبدیل کند، حتی زمانی که صدا خراب، نامفهوم یا به‌طور کامل در دسترس نباشد. عملکرد این محصول به این صورت است که ابتدا ویدئوی فرد دریافت می‌شود، سپس با الگوریتم‌های پیشرفته تشخیص چهره و استخراج لب، ناحیه‌ی مربوط به حرکت دهان جدا شده و پس از انجام پردازش‌های لازم به مدل یادگیری عمیق ارسال می‌گردد. مدل با تحلیل دقیق تغییرات لب‌ها، محتوای گفتار را بازسازی کرده و به صورت متن خروجی می‌دهد. این سیستم می‌تواند در حوزه‌هایی مانند ارتباط برای ناشنوایان، بازسازی مکالمات در شرایط نویزی، امنیت و پزشکی قانونی مورد استفاده قرار گیرد و یک راهکار نوآورانه برای تبدیل ویدئوهای بی‌صدا یا با صدای آسیب‌دیده به متن محسوب می‌شود.