fanavaran
آخرین اخبار
   
    کد خبر : 72800
    تاریخ انتشار : 24 فروردین 1394 11:16
    تعداد بازدید : 771

    با راه‌اندازی نرم‌افزاری از سوی شورای عالی اطلاع‌رسانی

    سامانه های تبدیل متن به گفتار فارسی ارزیابی می شوند

    معصومه لطفی- با توجه به تعدد و اهمیت سامانه های تبدیل متن به گفتار فارسی، نرم افزاری به منظور ارزیابی همه جانبه و دقیق این سامانه ها در وبگاه SCICT.IR در اختیار محققین قرار گرفته است.
     محمدمهدی همایون پور، مدیر این پروژه در خصوص نرم افزار  SESSS که به عنوان ارزیابی عملکرد سامانه های تبدیل متن به گفتار فارسی ارایه شده است گفت: سیستم تبدیل متن به گفتار با دریافت ورودی در قالب متن، خروجی آن را در قالب دیگری از زبان طبیعی یعنی گفتار عرضه می کند. از این رو تلاش و تحقیقات بسیاری در جهت طراحی و ساخت سیستم های تبدیل متن به گفتار و بهبود کیفیت صدای خروجی آن ها صورت می گیرد و ارزیابی چگونگی عملکرد و کیفیت کار این سیستم ها و اجزاء تشکیل دهنده آن ها از اهمیت ویژه ای برخوردار است. مشابه سیستم های تبدیل متن به گفتار، سیستم های کدینگ و فشرده سازی گفتار نیز در خروجی خود اقدام به تولید سیگنال گفتاری می کنند. در نتیجه ارزیابی کیفیت گفتار بازسازی شده در خروجی این گونه سیستم ها نیز حایز اهمیت است.  
    وی در توضیح نحوه عملکرد نرم افزار SESSS که به سفارش دبیرخانه شورای عالی اطلاع رسانی و توسط آزمایشگاه پردازش هوشمند داده های چندرسانه ای دانشکده مهندسی کامپیوتر دانشگاه صنعتی امیرکبیر انجام شده است، بیان داشت: در این نرم افزار به ارزیابی جنبه های متفاوت صوتی سیگنال بازسازی (سنتز) شده در سیستم های سنتز و کدینگ گفتار پرداخته شده است. این ارزیابی ها شامل ارزیابی میزان قابل فهم بودن اصوات تولید شده خصوصا همخوان اول، وسط و آخر هجاها، نحوه انتقال از واکه به همخوان، میزان قابل فهم بودن واکه ها، خوشه های همخوانی، کلمات در جملات و جملات است.
    وی گفت: در این ارزیابی ها عملکرد بخش سنتزکننده های گفتار از نقطه نظر جنبه های متفاوت صوتی بررسی می شود. آزمون های ارزیابی ارائه شده شامل تست تشخیص قافیه، تست قافیه اصلاح شده، ارزیابی تشخیص همخوان میانی، ارزیابی قطعه ای استاندارد، آزمون کلمات بی معنی و انتقال واکه به همخوان، آزمون قابل فهم بودن جفت های کمینه، ارزیابی در سطح جمله است.
    وی افزود: علاوه بر این در نرم افزار SESSS امکان انجام ارزیابی ها به صورت ذهنی با انجام تست های شنیداری فراهم شده است. در این ارزیابی ها شنونده ها با گوش دادن به صدای حاصل از سیستم تبدیل متن به گفتار و کدینگ گفتار، نسبت به مواردی چون وضوح و میزان کیفیت صوت سنتز شده از نقطه نظرهای مختلف مانند میزان خوشایند بودن، طبیعی بودن، قابل فهم و درک بودن، سرعت بیان، سلیس و روان بودن، خشن بودن و بسیاری موارد دیگر و حتی نحوه تلفظ و سرعت با استفاده از روش های ارزیابی میانگین امتیازات نظردهی MOS، تست تخمین دسته ای CE، تست ITUT و پروتکل تحلیل پروفایل گفتاری امتیاز می دهند. میانگین نظرات شنوندگان بیانگر نتیجه ارزیابی است. برای اکثر این روش های ارزیابی داده های ارزیابی برای زبان فارسی نیز ارایه شده است.
    همایون پور با بیان اینکه در سیستم های تبدیل متن به گفتار و کدینگ گفتار، کیفیت نوای گفتار از اهمیت بالایی برخوردار است، بیان داشت: عوامل متعددی چون ایجاد تکیه ها، آهنگ جملات، احساسات، کنش های گفتاری و بسیاری از حالات گفتار به نوای آن بستگی دارد. نوای مناسب در طبیعی و خوشایند بودن گفتار و نیز در انتقال مفاهیم و مقصود گوینده بسیار موثر است.
    وی تاکید کرد: در نرم افزار SESSS به چگونگی ارزیابی اینگونه سیستم ها در تولید نوا شامل ارزیابی زیروبمی در سطوح هجا، کلمه و جمله، ارزیابی دیرش و شدت واحدهای گفتاری و نهایتاً به چگونگی ارزیابی کیفی سیستم های سنتز گفتار از نقطه نظر تولید تکیه و آهنگ پرداخته شده است.
    به گفته وی روش های ارزیابی نوا هم به صورت ذهنی و هم به صورت عینی ارایه شده و به کمک نرم افزار SESSS قابل اجرا هستند.
     وی در خصوص ارزیابی ذهنی گفت: در این روش، جملات از نقطه نظر ویژگی های نوایی متفاوت ارزیابی می شوند. ارزیابی ذهنی نوا با استفاده از تست امتیاز میانگین نظرات MOS انجام می شود . در این نوع آزمون، جملات سنتز شده برای شنوندگان شرکت کننده در آزمون پخش شده و آنها نسبت به کیفیت نوای گفتار سنتز شده، رعایت تکیه ها، آهنگ یا احساسات و مانند آن نظر می دهند. میانگین نظرات شنوندگان بیانگر نتیجه ارزیابی است. وی گفت: در ارزیابی دوم یعنی ارزیابی عینی نوا، می توان پارامترهای نوایی همچون زیروبمی، دیرش و شدت که یک بار از طریق مدل سازی و روش های خودکار به دست آمده اند و بار دیگر از گفتار گوینده واقعی استخراج شده اند را از طریق دو معیار ضریب همبستگی و ضریب تعیین، بصورت کمی توسط نرم افزار SESSS مقایسه نمود. همچنین می توان منحنی تغییرات هر یک از پارامترهای نوا را رسم و به صورت چشمی کار مقایسه را انجام داد.
    گفتنی است در حال حاضر نسخه بتا از نرم افزار جامع SESSS در سایت دبیرخانه ارایه شده و پس از رفع مشکلات احتمالی نسخه نهایی آن ارایه می شود.


    نظر شما



    نمایش غیر عمومی
    تصویر امنیتی :