TechBord Logo
TechBord detail

تشخیص گفتار (Speech Recognition) چیست؟

تشخیص گفتار توانایی یک دستگاه الکترونیکی برای درک کلمات گفتاری است. یک میکروفون (Microphone) صدای شخص را ضبط می کند و سخت افزار (Hardware) سیگنال را از امواج صوتی آنالوگ (Analog) به دیجیتال (Digital) تبدیل می کند. سپس داده‌های صوتی توسط نرم افزار (Software) پردازش می‌شوند، که صدا را به عنوان کلمات جداگانه تفسیر می‌کند.

یک نوع رایج تشخیص گفتار، نرم‌افزار "گفتار به متن" یا "دیکته" است. مانند Dragon Naturally Speaking که هنگام صحبت کردن، متن را خروجی می دهد. در حالی که می توانید برنامه های تشخیص گفتار را خریداری کنید، نسخه های مدرن سیستم عامل مکینتاش (Macintosh) و پنجره ها (Windows) دارای ویژگی دیکته داخلی هستند. این قابلیت به شما امکان می دهد متن را ضبط کنید و همچنین دستورات اساسی سیستم را انجام دهید.

در ویندوز، برخی از برنامه ها به طور خودکار از تشخیص گفتار پشتیبانی می کنند در حالی که برخی دیگر این کار را نمی کنند. می‌توانید با انتخاب همه برنامه‌ها ← لوازم جانبی ← سهولت دسترسی ← تشخیص گفتار ویندوز و کلیک کردن روی "فعال کردن دیکته در همه جا"، تشخیص گفتار را برای همه برنامه کاربردی (Application) فعال کنید. در OS X، می‌توانید دیکته را در بخش ترجیحی سیستم «Dictation & Speech» فعال کنید. برای روشن کردن قابلیت گفتار به نوشتار، کافی است دکمه «روشن» را در کنار دیکته علامت بزنید. برای شروع دیکته کردن در یک برنامه پشتیبانی شده، ویرایش → شروع دیکته را انتخاب کنید. همچنین می‌توانید با باز کردن پنجره تنظیمات «دسترس‌پذیری» و انتخاب «موارد قابل گفتن»، دستورات گفتاری را در OS X مشاهده و ویرایش کنید.

یک نوع دیگر از تشخیص گفتار، گفتار تعاملی است که در دستگاه‌های تلفن همراه رایج است. مانند گوشی هوشمند (Smartphone) و تبلت (Tablet). هر دو دستگاه سیستم عامل آیفون (iOS) و اندروید (Android) به شما امکان می دهند با تلفن خود صحبت کنید و پاسخ شفاهی دریافت کنید. نسخه iOS "Siri" نام دارد و به عنوان دستیار شخصی عمل می کند. می توانید از سیری بخواهید که یادآوری را در تلفن شما ذخیره کند، پیش بینی آب و هوا را به شما بگوید، مسیرها را به شما بدهد یا به بسیاری از سوالات دیگر پاسخ دهد. این نوع تشخیص گفتار یک رابط کاربری طبیعی (یا رابط کاربری طبیعی (NUI)) در نظر گرفته می‌شود، زیرا به طور طبیعی به ورودی (Input) گفتاری شما پاسخ می‌دهد.

در حالی که بسیاری از سیستم‌های تشخیص گفتار تنها هستند. پشتیبانی از زبان انگلیسی، برخی از نرم افزارهای تشخیص گفتار از چندین زبان پشتیبانی می کنند. این به یک فرهنگ لغت منحصر به فرد برای هر زبان و الگوریتم (Algorithm) اضافی برای درک و پردازش لهجه های مختلف نیاز دارد. برخی از سیستم‌های دیکته، مانند Dragon Naturally Speaking، می‌توانند برای درک صدای شما آموزش ببینند و به مرور زمان برای درک دقیق‌تر شما سازگار می‌شوند.

تعریف اصطلاح تشخیص گفتار (Speech Recognition) توسط تک بورد

تعریف تشخیص گفتار (Speech Recognition) در این صفحه یک تعریف پایه نگاشته شده توسط تک بورد است. اگر مایل به ارجاع به این صفحه یا استناد به این تعریف هستید، با شرط درج لینک به این صفحه می توانید از این محتوا استفاده کنید.

هدف تک بورد توضیح اصطلاحات کامپیوتری به روشی است که به راحتی قابل درک باشد. ما برای سادگی و دقت با هر تعریفی که منتشر می کنیم تلاش می کنیم. اگر بازخوردی درباره تعریف تشخیص گفتار (Speech Recognition) دارید یا می‌خواهید یک اصطلاح فنی جدید پیشنهاد کنید، لطفاً با ما تماس بگیرید.

آیا می خواهید اصطلاحات فنی بیشتری یاد بگیرید؟ در خبرنامه روزانه یا هفتگی مشترک شوید و شرایط و آزمون های ویژه را در ایمیل خود تحویل بگیرید.