عنوان :
بهسازي گفتار با استفاده از روش سنتز بر مبناي كتاب كد
نويسنده اصلي :
دوست رقيه
كليدواژه فارسي :
104ص.جدول،تصوير47ص.ضميمه 58+1 كتابنامه
چكيده :
در اين پايان‌نامه به بهسازي گفتار نويزي با SNRهاي خيلي پايين ( ونيز بالا ) مي‌پردازيم. علاوه بر اين نويزهاي مورد بررسي مي‌توانند غيرايستاني شديدي داشته باشند. روشي كه به‌كار گرفته مي‌شود سنتز گفتار بهسازي شده با استفاده از كتاب كد مي‌باشد. بردارهاي مورد استفاده نيز پارامترهاي STFT است. به اين منظور در ابتدا يك تابع فاصله‌ي اقليدسي كه بر اساس مشخصه‌هاي شنيداري وزن داده شده است، استخراج مي‌گردد. اين تابع فاصله به منظور چندي كردن برداري دامنه‌هاي STFT به كار مي‌رود. قبل از وزن دادن به تابع فاصله، دامنه‌هاي STFT مورد پيش‌پردازش لگاريتمي قرار مي‌گيرند. نتايج شبيه‌سازي نشان مي‌دهد كه كتاب كد حاصل از اين تابع فاصله وزن داده شده، به طور قابل توجهي داراي كيفيت شنيداري بهتري نسبت به تابع فاصله اقليدسي معمول مي‌باشد. سپس بهسازي گفتار وابسته به گوينده با استفاده از كتاب‌هاي كد گفتار و نويز صورت مي‌گيرد. به اين منظور در ابتدا كتاب‌هاي كد گفتار و نويز حاوي پارامترهاي STFT طراحي مي‌شود. براي طراحي كتاب كد گفتار، گفتار كافي از گوينده‌اي مشخص استفاده مي‌شود. تخمين‌گري كه به منظور جستجو در كتاب كدها استفاده مي‌شود بر اساس تابع فاصله‌ي طراحي شده مي‌باشد. با استفاده از اين تخمين‌گر انديس‌هاي درست از كتاب‌هاي كد گفتار و نويز انتخاب مي‌گردد. سپس با استفاده از انديس‌هاي انتخاب شده از كتاب كد گفتار، گفتار بهسازي شده سنتز مي‌شود. زمان لازم براي بهسازي با روش ارئه شده طولاني و وقت‌گير مي‌باشد. به منظور اصلاح اين عيب دو روش ارائه مي‌گردد. اول اين‌كه، يك روش جهت كاهش طول كتاب كدها ارائه مي‌شود. دوم اين‌كه، با استفاده از رابطه‌ي مركز ثقل طيفي بين گفتار نويزي، گفتار و نويز، حوزه‌ي جستجو بين كتاب‌هاي كد گفتار و نويز كاهش مي‌يابد. به اين‌ترتيب زمان لازم براي بهسازي نيز كاهش مي‌يابد. نتايج شبيه‌سازي‌ها نشان مي‌دهد كه روش ارائه شده قابليت بهسازي گفتار نويزي با SNRهاي زير صفر دسيبل را داراست. علاوه بر اين از آن‌جايي كه روش ارائه شده فريم به فريم انجام شده و در بهسازي هر فريم نويزي از فريم‌هاي ديگر استفاده‌اي نمي‌شود، پس اين روش توانايي مقابله با نويزهايي با غيرايستاني بالا را نيز برخوردار است. در گام بعدي پايان‌نامه‌ي حاضر به طراحي تخمين‌گر ديگري مي‌پردازيم. با استفاده از تخمين‌گر بيشينه درستنمايي براي بخش حقيقي و موهومي STFT و تابع فاصله‌ي معادل با آن كتاب كدهايي براي بخش حقيقي و موهومي STFT طراحي مي‌نماييم. به اين ترتيب در فازهاي طراحي كتاب كد، جستجو و سنتز، از انتخاب فاز بي‌نياز مي‌شويم. نتايج شبيه‌سازي، حاكي از بهبود نتايج حاصل از بهسازي مي‌باشد. سپس روش‌هاي ارائه شده در پايان‌نامه را با سه روش ديگر مقايسه نموديم. از لحاظ كيفيت شنيداري روش‌هاي طراحي شده در پايان‌نامه موفق‌تر از روش‌هاي مقايسه‌اي عمل نمودند. اين برتري از حيث SNR خروجي نيز محقق گرديد. در مورد اعوجاج طيفي به خصوص در SNRهاي بالاتر از صفر دسيبل روش‌هاي مقايسه‌اي برتري داشتند. البته هدف پايان‌نامه نيز بالا بردن كيفيت شنيداري گفتار بهسازي شده، مخصوصاً در SNRهاي كمتر از صفر دسيبل مي‌باشد. اين هدف با طراحي كتاب‌هاي كد وابسته به گوينده و وابسته به نويز محقق گرديد. اين كتاب‌ها با در نظر داشتن معيارهاي شنيداري گوش انسان طراحي گرديدند. از آن‌جايي كه يكي از مباحث بهسازي گفتار، تخمين SNR مي‌باشد، در پيوست به ارائه روشي جهت تخمين SNRهاي منفي مي‌پردازيم. اين روش فريم به فريم و در بازه‌هاي فعال گفتار انجام مي‌گيرد. به اين منظور گشتاورهاي‌هاي مرتبه‌ي چهارم بخش حقيقي و موهومي مؤلفه‌هاي فركانسي گفتار و نويز به طور جداگانه استخراج مي‌گردند. سپس، نسبت سيگنال به نويز در هر مؤلفه‌ي فركانسي به‌دست مي‌آيد. هم‌چنين روابط به‌دست آمده نسبت سيگنال به نويز هر فريم را نيز نتيجه مي‌دهند. آن‌چه روش ارائه شده را از ديگر روش‌هاي ارائه شده در اين زمينه متمايز مي‌كند، اين است كه در تحليل‌هاي صورت‌گرفته، با نويز و گفتار به طور يكسان برخورد شد. به اين ترتيب روش ارائه شده مي‌تواند SNRهاي منفي را به خوبي تخمين بزند.
شماره ركورد :
76908
دانشگاه :
دانشگاه صنعتي اميرکبير
استاد راهنما :
دكتر ابوالقاسم صياديان
آدرس اينترنتي :
لينک به اين مدرک :

بازگشت