رفتن به مطلب
  • 0

تبدیل متن به گفتار فارسی


mehdi.m

سوال

باسلام خدمت اساتید و انجمنی ها

هر چی تاپیک هارو زیر و رو کردم چیزی با این موضوع نیافتم.

کتابخونه TTS هم که فارسی رو پشتیبانی نمیکنه

تنظیمات گوشی رو هم چک کردم (قسمت تبدیل متن به گفتار)فارسی رو نداشت کلا

خواستم ببینم کلا راهی هست که به برنامه یه متن فارسی رو بدی بعد بخونتش.

غیر از ضبط صدا و پخش |:

لینک ارسال
به اشتراک گذاری در سایت های دیگر

3 پاسخ به این سوال تاکنون داده شده است

ارسال‌های توصیه شده

در 2 ساعت قبل، mehdi.m گفته است :

باسلام خدمت اساتید و انجمنی ها

هر چی تاپیک هارو زیر و رو کردم چیزی با این موضوع نیافتم.

کتابخونه TTS هم که فارسی رو پشتیبانی نمیکنه

تنظیمات گوشی رو هم چک کردم (قسمت تبدیل متن به گفتار)فارسی رو نداشت کلا

خواستم ببینم کلا راهی هست که به برنامه یه متن فارسی رو بدی بعد بخونتش.

غیر از ضبط صدا و پخش |:

راه که هست مثلا بشینی خودت یک سیستم بسازی که حروف و متون رو تشخیص بده و بعد صدا های از قبل زخیره شده خودت رو به هم بچسبونه

این راه خیلی خیلی سخته

 

راه راحت تر هم بلد نیستم

لینک ارسال
به اشتراک گذاری در سایت های دیگر

باسلام

راه ضبط وپخش صدا هم خیلی زیاد سخت نیست !

دیتابیس لغت نامه دهخدا رو تهیه کنیدواز اون استفاده کنید(دقت فرمایید بهتراست خود کتاب اصلی لغتنامه دهخدا رو ملاحظه کنید ودیتابیس رو با اون مقایسه کنید چون برخی دیتابیس ها قسمت ضبط وحرکات حروف رو حذف کردند!که اون به درد نمیخوره)

تو دهخدا حرکات حروف (ضبط صحیح کلمات) رو داخل کروشه بعد از هر کلمه داره

سوای آن اینکه برای نقش ترکیبی کلمات اعم از اینکه این کلمه فعل است یا اسم است یا صفت است ویا حرف ربط است هم علامتی گذاشته که برای اینکه بدانیم جمله تمام شده است یا نه وسط کلام است تا حرکه آخر کلمه متحرک باشه یا ساکن بدرد میخوره و مثلا اگه کلمه صفت یا مضاف الیه (اسم بعدازاسم مثل درب منزل-گل سبز) که کلمه اولی مکسور میشه وامثال آن بدرد میخوره .مثلا مصدر ها اگر مضاف واقع بشن باید مکسور بشن . یا جمله اگه جمله اسمیه باشه وبا اسم شروع بشه مبتدا حرکه اش ساکن میشه و خلاصه باید قواعد ادبیات فارسی رو حداقل بصورت تجربی در نرم افزار بکار ببرید .

و تنها نیاز هست که فایل صوتی تک تک حروف و حرکات اعرابی را که سریع تلفظ میشن را ضبط کنی (البته بهتره هر حرف رو یکبار ساکن ضبط کنید و همان حرف رو با شش حرکه اعرابی (با فتحه وکسره وضمه وتنوین فتح وتنوین ضم وتنوین کسر)در شش فایل مجزا ضبط وذخیره کنید )و در نرم افزار قرار بدی و نرم افزار (دو حرف دوحرف ) و (دو کلمه پشت سر هم) رو سریع تحلیل کنه ورابطه ی ترکیبی آندو رو  پیدا کنه و این قواعد بالا وتعدادی از قواعد ادبیات فارسی رو (که ظاهرا خیلی زیادهم نیستند)استفاده کنه  تاضبط حرکه  هر حرف رو  واعراب آخر هر کلمه رو پیدا و پشت سر هم سریع تلفظ کنه و در آخر واسه فاصله بین دو حرف هم کمی مکث قرار بده یا نه فایل صوتی خالی قرار بده تا مثل متن خوانی عادی شروع به خوندن بکنه .هرجا هم که علامت تشدید رو دید حرف قبلی رو دوباره تلفظ کنه ! جایی که نقطه دید حرف آخر رو درصورت نیاز ساکن تلفظ کند

البته کلمات زیادی دو یا سه ضبط دارند مثل (کِشتن کُشتن ) که پیداکردن ضبط صحیح یه زحمت مضاعف میخواد که یا باید کلمه وضبطی که بیشتربین مردم رایجه رو در دیتابیس بدی دریک ستونی یه فرد بیکار بنشینه علامت گذاری کنه که تنها ضبطی که بیشتر مورداستفاده مردمه رو نرم افزار بگه که البته کار معیوبی است .

ویا راه حل دیگه اینه که بدی همون فرد بیکار (مثل تایپیست ها)بنشینه دریک ستون مجزا موضوع مورد استفاده کلمه رو بنویسه یا شماره گذاری کنه مثلا (کلمات مروبوط به (خوراک - پوشاک - مسکن - بدن واعضای بدن -جمادات -  گیاهان -حیوانات -))البته بسیاری از  تقسیم بندی ها در  همون لغتنامه  دهخدا هست که به ستون مجزایی در دیتابیس باید انتقال داده بشه! و بعدا مثلا با پیداکردن نقش ترکیبی کلماتی همچون مفعول ها و فاعل ها و موصوف ها و مضاف الیه ها ضبط مربوط به فعل یا مصدر یا صفت یا مضاف رو که بین چندین ضبط مردد است رو پیدا وجاگذاری کنید .مثلا برای پیدا کردن مفعول ها (کلمه « را ») که علامت  مفعول است را استفاده کنید وهر جا کلمه ای قبل از «را» بود مفعول است که فرضا اگر مفعول گیاه بود فعلی که بعداز «را» هست باید جزو فعل های مربوط به شاخه گیاهان باشد .مثلا(علی لاله را کشت) چون لاله مفعول مربوط به گیاهان است فعل ان نیز که کلمه(کشت) است مربوط به گیاهان خواهد بود !و برعکس  از خصوصیت فعل به خصوصیت مفعول وضبط حرکات مفعول پی می بریم مثلا( علی گل را کشت ) فعل (کشت) که مشترک بین (فعل مربوط به گیاهان و فعل مخصوص انعدام ونابود کردن) است و مفعولش (گل) مشترک بین (اسم مخصوص گیاهان و اسم مخصوص جمادات«خاک مخلوط به اب» ) است و وجه اشتراک را در اینجا لحاظ می کنیم که همان  اسم وفعل مربوط به گیاهان است و (گُل صحیح است ونه گِل). و الی آخر....

خلاصه اگه بخواین نرم افزار خوبی ازکار دربیاد حداقل باید بایک کسی که سالها با دستورات زبان فارسی حشر ونشر داشته وتخصص وتجربه داره مشورت بگیرین .

البته بهتره واسه راحت شدن کار ابتدا دو نرم افزار بنویسید که یکی خودکار ضبط کلمات روکه در دیتابیس لغتنامه دهخدا بعداز هرکلمه است رو خود کلمات در یک ستون سوم انتقال بده یعنی اینطور (کشتن - [کِ]  => کِشتن)

ونرم افزار دوم فرضا چهل پنجاه تا موضوعی که کلمات به اونا مربوطند رو در صفحه اصلی نرم افزار با چک باکس ( checkbox ) وامثال آن نشون بده و کل کلمات ازدیتابیس لغتنامه یکی یکی بالای چک باکس نشون داده بشن بعدش اون کاربر  یا فرد بیکار یکی یکی لغات دهخدا رو با تیک زدن چک باکس ها موضوع بندی کنه و در همان دیتابیس نتیجه با اعداد ذخیره بشن که شاید تمام وقت کار کنه به راحتی دوهفته ای همشونو بتونه موضوع بندی کنه وتمومشون کنه! 

(منظورم از ضبط همان چینش حرکات کلمه است با ضبط صوت اشتباه نشود!)

 

 

 

لینک ارسال
به اشتراک گذاری در سایت های دیگر

بایگانی شده

این موضوع بایگانی و قفل شده و دیگر امکان ارسال پاسخ نیست.

  • کاربران آنلاین در این صفحه   0 کاربر

    • هیچ کاربر عضوی،در حال مشاهده این صفحه نیست.
×
×
  • اضافه کردن...