• AR
  • EN

پایــگاه خبــری

  • فهرست اخبار
  • آموزشی
  • پژوهشی
  • دانشجویی و فرهنگی
  • اداری
  • دستاوردها
  • نشست‌ها
  • انتصاب‌ها
  • خبرنامه‌ها
    > فهرست اخبار > جلسه دفاع پایان نامه: سمیه حمیدی طبس، گروه مهندسی فناوری اطلاعات
تاریخ: 1403/9/10
ساعت: 12:12
بازدید: 166
شماره خبر: 24007

چاپ خبر
ارسال خبر

اخبار مرتبط

گالری

برچسب‌ها

    به اشتراک بگذارید

     
    جلسه دفاع پایان نامه: سمیه حمیدی طبس، گروه مهندسی فناوری اطلاعات

    جلسه دفاع پایان نامه: سمیه حمیدی طبس، گروه مهندسی فناوری اطلاعات

    خلاصه خبر:

    عنوان پايان نامه: ارائه رويكردي جهت تشخيص هيجانات مبتني بر اطلاعات زيستي انسان (با تمركز بر گفتار) با استفاده از رويكرد شبكه هاي پيچشي گراف

    ارائه کننده : سمیه حمیدی طبس
    استاد راهنما: دكتر توكتم خطيبي
    استاد داور داخلي: دكتر بابك تيمورپور
    استاد داور خارج از دانشگاه: دكتر هادي زارع
    نماينده تحصيلات تكميلي: دكتر بابك تيمورپور
    زمان: 1403/09/13      
    ساعت: 11:00
    مكان: اتاق 351 دانشكده فني و مهندسي

    چکیده:
    تشخیص هیجانات انسانی از طریق گفتار یکی از چالش‌های مهم در حوزه پردازش سیگنال و هوش مصنوعی است. این مسئله در زمینه‌هایی مانند تعامل انسان-کامپیوتر، سیستم‌های مراقبت بهداشتی هوشمند و مراکز تماس خودکار اهمیت ویژه‌ای دارد. تشخیص دقیق هیجانات می‌تواند به بهبود کیفیت ارتباطات، افزایش رضایت مشتری و حتی تشخیص زودهنگام اختلالات روانی کمک کند. هدف این پژوهش ارائه یک روش اتوماتیک برای تشخیص هیجانات گفتاری است. در این پژوهش، از دو مجموعه‌داده  Cafe (شامل گفتار به زبان فرانسوی) و یک مجموعه داده فارسی استفاده شده است. هر دو مجموعه داده شامل نمونه‌های صوتی با هیجانات مختلف مانند شادی، غم، خشم و تعجب هستند. روش حل پیشنهادی بر اساس استفاده از شبکه‌های پیچشی گرافی (GCN) است که یک رویکرد نوآورانه در پردازش سیگنال‌های گفتاری محسوب می‌شود. نوآوری اصلی این روش، استفاده از ساختار گرافی برای نمایش سیگنال گفتار، و همینطور استفاده همزمان از سه روش معروف ضرایب کپسترال فرکانس مل (MFCC)، نرخ عبور از صفر (ZCR) و ریشه میانگین انرژی مربع (RMSE) برای پیش‌پردازش سیگنال گفتار است که امکان استخراج ویژگی‌های پیچیده‌تر را فراهم می‌کند. مدل پیشنهادی برای مجموعه داده Cafe دقت 86% و برای مجموعه داده فارسی دقت 80% را نشان می‌دهد. این نتایج حاکی از عملکرد قابل قبول مدل در هر دو زبان است. در هر دو مجموعه داده، مدل در تشخیص هیجان تعجب بهترین عملکرد و در تشخیص ترس ضعیف‌ترین عملکرد را دارد. مزیت اصلی روش پیشنهادی، توانایی آن در استخراج ویژگی‌های پیچیده از ساختار زمانی سیگنال گفتار است که در روش‌های سنتی کمتر مورد توجه قرار می‌گیرد. این پژوهش نشان می‌دهد که استفاده از GCN در تشخیص هیجان از گفتار پتانسیل قابل توجهی دارد. با این وجود، برای کاربردهای عملی، نیاز به بهینه‌سازی بیشتر مدل وجود دارد.

    خبر بعدی خبر قبلی

    ما را در شبکه‌های اجتماعی دنبال کنید

    © تمامی حقوق سایت برای دانشگاه تربیت مدرس محفوظ است.