مقالات

فناوری های تشخیص صدا و پردازش گفتار چیستند و چگونه کار می کنند؟

فناوری های تشخیص صدا و پردازش گفتار چیستند و چگونه کار می کنند؟

تشخیص صدا که نام دیگرش شناسایی گوینده است، یکی از علومی است که مربوط به حوزه علوم رایانه و هوش مصنوعی است. هدف از ایجاد این تکنولوژیف شناختن یک فرد فقط و فقط از روی صدای آن شخص است.

در این مقاله از سامانه استوکستان به موارد زیر پیرامون تشخیص صدا می پردازیم:

1- نحوه عملکرد این فناوری

2- کاربرد های این فناوری

3- مراکز استفاده کننده از این تکنولوژی

نحوه عملکرد این فناوری در شناسایی یک صدا

فناوری تشخیص صدا به این صورت عمل می کند که یک مدل دیجیتالی از صدای فرد برمیدارد و آن را به عنوان الگویی از صدای شخص ذخیره می کند. واژه ها و عبارت ها را به صورت یک الگو در می آورد و این ها را به روش های مختلف با یکدیگر ترکیب می نماید. در نهایت چیزی که به دست می آید، یک الگوی منحصر به فرد است که مانند اثر انگشت برای هر فرد منحصر به فرد است.

کاربردهای فناوری تشخیص و پردازش صدا

ایجاد چنین سیستمی چندین سال جزو تحقیقات محققان اساتید و دانشجویان بوده است. در طی یکی دو سال اخیر مهم ترین دستاورد تکنولوژی تشخیص صدا سیستم های تشخیص بوده است. کاربردهایی مانند تشخیص گفتار تلفنی. هر چه تعداد واژگانی که سیستم می تواند تشخیص دهد بیشتر باشد، به معنای این است که دایره  واژگان سیستم بیشتر است و در نتیجه شباهت میان کلمات بیشتر می شود و کارآیی سیستم کاهش پیدا می کند.

تمای فعالیت های مربوط به سیستم های تشخیص هویت بیو متریک در حال پیشرفت هستند. به نظر می رسد کاربران نسبت به استفاده از این فناوری کمتر از خود مقاومت نشان می دهند. زیرا در این فناوری نیاز به برقراری تماس فیزیکی نیست و کاربران با آن به راحتی ارتباط برقرار می کنند.

چه مراکزی می توانند از این تکنولوژی استفاده کنند

مراکزی مثل مدارس، دانشگا ه ها و ادارات می توانند برای حضور و غیاب و کنترل ورود و خروج از تکنولوژی تشخیص صدا استفاده کنند. 

درباره این فناوری بیشتر در ویکیپدیا بخوانید.

نوشته های مشابه

دیدگاهتان را بنویسید