- Persian/Farsi Keyword Spotting (Fa-KWS) System as a software
-
Available Datasets:
PAVID-CVs: A Persian Audio-Visual Database of CV syllables (Paper)
SBU-KWS: A Persian Spoken Dataset for Evaluation of Keyword Spotting Systems (Paper)
E2PCast: An English To Persian Voice Casting Dataset (Paper)
Robat-e-Beheshti: A Persian Wake Word Detection Dataset for Robotic Purposes (Paper)
M-ShEMO: Modification of Labels for Sharif Emotional Speech Database (ShEMO dataset) (Paper)
محصول گفتارپرداز: (Speech Analytics)
سامانه جامع پردازش و تحلیل سیگنالهای گفتاری در فایلهای صوتی (در حال توسعه و تکمیل)
شرح قابلیتها و فناوریهای بکارگرفته شده در سامانه:
– تعیین بخشهای گفتاری و غیرگفتاری (Speech Activity Detection)
– تشخیص کیفیت گفتار و بخش بندی و جداسازی بخشهای نویزی (Speech Quality Estimator)
– تشخیص زبان و لهجه گویندگان (Language and Dialect Identification)
– جداسازی و خوشه بندی بخش های گفتاری گویندگان (Speaker Diarization)
– تشخیص جنسیت گویندگان (Gender Identification)
– تخمین محدوده سنی گویندگان (Age Estimation)
– شناسایی و تصدیق گویندگان تعیین شده توسط کاربر (Speaker Identification & Verification)
– تخمین نرخ گفتار گویندگان (Speech Rate Estimation)
تشخیص کلمات کلیدی (فارسی و انگلیسی و عربی) تعیین شده توسط کاربر (Keyword Spotting)
Recent Comments