Konuşma sentezleyicileri nelerdir? En iyi konuşma sentezleyicileri. Rus sesleriyle konuşma sentezleyicileri.

Transkripsiyonlar
e-konuş Tip
konuşma sentezleyici Yazar
Jonathan Duddington Yazıldığı tarih
C++ işletim sistemi
Linux ve diğer UNIX benzeri Windows 2006
İlk sayı En son sürüm
1.48.04 (6 Nisan) Durum
aktif değil Lisans
GNU GPL

Web sitesi

İşletim sistemleri

eSpeak'in Microsoft Windows, Mac OS X, Linux, RISC OS gibi işletim sistemleri için sürümleri mevcuttur ve C++ kaynak kodu da mevcuttur. Ek olarak sentezleyicinin resmi belgeleri, Windows Mobile için nasıl derleneceğine ilişkin talimatlar sağlar. Programın önemli bir sınırlaması var - ses üretimi yalnızca WAV dosyasında mümkündür. Ayrıca eSpeak mobilde de kullanılıyor işletim sistemleri

Android, sürüm 1.6'dan başlayarak ve Maemo, ancak bu projeler geliştirici tarafından kişisel olarak denetlenmiyor ve resmi eSpeak web sitesinde ilgili paketler yok ve Android sürümünde bazı dillerde çalışırken bir takım önemli hatalar var. özellikle Rusça.

Desteklenen diller eSpeak yaklaşık beş düzineyi destekliyorçeşitli diller

. Kurulum sırasında kullanıcının hangi lehçeleri desteklemek istediğini belirtmesi gerekir.

  • Aşağıda eSpeak sentezleyici tarafından desteklenen dillerin ve ayarlarında kullanılan sembollerin bir listesi bulunmaktadır.
  • Arnavutça - metrekare
  • İngilizce (Amerikan) - tr-tr
  • İngilizce (Kuzey aksanlı İngiliz) - en-n
  • İngilizce (West Midlands aksanıyla İngiliz dili) - tr-wm
  • İngilizce (klasik İngiliz) - tr
  • İngilizce (genel olarak konuşulur) - en-rp
  • İngilizce (İskoç) - en-sc
  • Ermenice (Batı) - hy-west
  • Ermenice (klasik) - hy
  • Afrikanca - af
  • Boşnakça - bs
  • Galce - cy
  • Macarca - hu
  • Vietnamca - vi
  • Felemenkçe - nl
  • MBROLA'nın Sesleri (ses xxx) - mb-xxx
  • Yunanca - el
  • Antik Yunanca - grc
  • Endonezce - kimlik
  • İzlandaca - öyle
  • İspanyolca (klasik) - es
  • İspanyolca (Latin Amerika) - es-la
  • İtalyanca - o
  • Katalanca - yaklaşık
  • Çince (Kantonca) - zh-yue
  • Çince (Mandarin) - zh
  • Kürtçe - ku
  • Latince - la
  • Letonca - lv
  • Lojban - jbo
  • Makedonca - mk
  • Almanca - de
  • Norveççe - hayır
  • Lehçe - pl
  • Portekizce (Brezilya) - pt
  • Portekizce (Avrupa) - pt-pt
  • Rumence - ro
  • Rusça - ru
  • Slovakça - sk
  • Slovence - sw
  • Tamilce - ta
  • Türkçe - tr
  • Fince - fi
  • Fransızca - fr
  • Hintçe - merhaba
  • Hırvatça - saat
  • Çekçe (konuşulan) - cs
  • İsveççe - sv
  • Esperanto - eo

Desteklenen dillerin listesi, eSpeak'e bağlanabilen MBROLA ses kütüphaneleri kullanılarak da genişletilebilir.

eSpeak ve MBROLA

MBROLA, metinden konuşmaya (TTS) teknolojisinin dahil edilmesiyle birçok farklı yazılım ürününün oluşturulduğu özel bir difonik konuşma sentezi algoritmasıdır. Bu proje, kullanıldığı farklı dil sayısı açısından diğer konuşma sentezi teknolojileri arasında rekoru elinde tutuyor. Her ne kadar MBROLA sesleri Rusça da dahil olmak üzere bazı yaygın diller için henüz oluşturulmamış olsa da.

eSpeak, MBROLA ile birlikte çalışabilir, bu da bu projenin ses kitaplıklarının aşağıdaki şekilde kullanılmasını mümkün kılar: bileşen eSpeak'in kendisi. Bu, metinden konuşmayı sentezlemek için desteklenen dillerin listesini daha da genişletmenize olanak tanır.

eSpeak ve MBROLA kombinasyonunu Windows, Linux ve Mac OS X gibi işletim sistemlerinde kullanabilirsiniz.

Ancak MBROLA ses kitaplıklarının tümü eSpeak ile entegrasyonu desteklemez.

Uygulama ilkeleri

Sentez için giriş metninin kelimeleri iki işlem aşamasından geçer:

  • harf temsilindeki bir kelime bir sesbirim dizisine dönüştürülür;
  • Alınan sıraya göre bir ses sinyali üretilir.

Bir dizi fonem elde etmeye yönelik kurallar "A, B, C = D" biçiminde saklanır. B söz konusu harf olduğunda, A ve C kelimedeki o harfi çevreleyen bağlamdır ve D o harfin dönüştürülebileceği ses birimidir. Çevresel bağlam, belirli harflerle veya harf gruplarını ifade eden özel karakterlerle belirtilebilir. Sentezleyici kuralları bu tür zincirlerin belirsiz tanımlanmasına izin verir. Bu belirsizliği çözmek için sentezleyici her kurala, kuralda yer alan harf sayısına ve çevresel bağlamı tanımlamadaki özgüllük derecesine göre hesaplanan bir öncelik atar. Kurallar ayrıca vurguya bağlı olarak çevirideki farklılıkları da belirtebilir.

eSpeak'te sesli harfler her zaman sentezlenir, sentezlenen seslerin önceden kaydedilmiş ses gürültüleriyle karıştırılmasıyla sesli ünsüzler oluşturulur ve diğer tüm sesler, örneğin [sh] basitçe kaydedilir.

Sessiz ünsüzler dışındaki her ses, bir dizi formantla temsil edilir. Her fonem, formantlara ilişkin bilgilerin yanı sıra genliği, ses süresi ve bir sonraki fonemden önceki gecikme hakkında da bilgi içerir. Bu parametrelere dayanarak, bir sesli harfin sesi, sentezleyicide uygulanan algoritmalar kullanılarak sentezlenir. Fonemler ve formantlar hakkındaki bilgiler ayrı dosyalarda saklanır ve bunlar daha sonra ikili formatta derlenir.

eSpeak Edit yardımcı programı sentezleyiciyle birlikte verilir. Bu, WXLib kütüphanesi kullanılarak yazılmış bir GUI uygulamasıdır. Hazır fonemleri görsel olarak düzenlemenizi sağlar. Fonem, formantların sırayla seçilebildiği ve frekans, perde ve genişlik gibi değerlerinin değiştirilebildiği bir eğri grafiği olarak temsil edilir. Hazır ses birimlerine dayanan bu yetenekler sayesinde belirli bir dil için yeni, daha doğru sesler elde edebilirsiniz. Aynı zamanda bazı ses birimleri mevcut olanları değiştirerek elde edilemez. Örneğin, eSpeak'in Rusça bölümünü geliştirirken, diğer dillerde buna layık bir analog bulunmadığından [р] sesi özel olarak kaydedildi.

eSpeak kullanan projeler

Üçüncü Taraf Eklentileri

Bazı dillerin okuryazar konuşma oluşturmaya yönelik basit ve evrensel kuralları yoktur ve eSpeak, bu dillerde yüksek kalitede sentez üretebilmek için ek bileşenler gerektirir. Ana eSpeak paketinin boyutunun artmasını önlemek için bu bileşenler ayrı ayrı dağıtılır. Özellikle Rusça'da yok genel kurallar, kelimelerde vurgulu bir hece oluşturmak. Bu durumlarda eSpeak, kelimenin vurgusunu belirlemeye çalışır ancak verilen telaffuz çoğu zaman doğru değildir. Bu sorunu çözmek için ana eSpeak paketinden ayrı olarak kurulması gereken özel bir genişletilmiş telaffuz sözlüğü bulunmaktadır.

Rusça'ya ek olarak, Çince (Putonghua ve Kantonca) için de üçüncü taraf eSpeak konuşma düzeltme bileşenleri mevcuttur.

Bu sözlükleri projenin resmi web sitesinden indirebilirsiniz.

VoiceFabric, herhangi bir metin bilgisini sentezlenmiş bir sesle seslendirmenize olanak tanıyan bir İnternet hizmetidir.
Voicefabric.ru web sitesinde çeşitli seslere sahip bir demo sentezi mevcut olup, sentezin kalitesini değerlendirebilirsiniz. Bugün 3 dili (Rusça, İngilizce, Kazakça) konuşabilen 8 ses (kadın ve erkek) bulunmaktadır.

MDG'den konuşma sentezi, giden sesli mesajların kişiselleştirilmesi gerektiğinde kullanışlıdır. Çözüm, IVR menüsünde hoparlör hizmetlerini ve ses kliplerinin ön kaydını tamamen bırakmanıza olanak tanır, yani yazılı metin anında ses kaydına dönüştürülür ve telefon hattı üzerinden müşteriye seslendirilir.

Ayrıca sentezlenmiş sesleri kullanarak "doğal" tonlamayı kaybetmeden kitapları, videoları sesli olarak seslendirebilir ve ses kartlarını kaydedebilirsiniz. Voicefabric, vurguların doğru yerleştirilmesini, kısaltmaların, sayıların ve kısaltmaların doğru okunmasını garanti eder.

Voicefabric.ru web sitesine kayıt olabilir ve ücretsiz sentez saniyelerinin yanı sıra hizmetin yazılım arayüzüne erişebilirsiniz.

Dikkat! Bu site, tarayıcınızda devre dışı bırakılan JavaScript teknolojisini kullanmaktadır. Kaynakla tam olarak çalışmak için, bu işlevi İnternet tarayıcınızın ayarlarında etkinleştirmeniz önerilir. Ancak sitenin tüm içeriği JavaScript devre dışı modunda da mevcuttur, dolayısıyla bu ayarın etkinleştirilmesi tavsiye edilse de gerekli değildir.


Konuşma sentezleyici Kaptan

"Konuşma sentezleyici Kaptan", MS SAPI4 uyumlu bir sentezleyicidir. Rusça ve Ukraynaca konuşma sentezini destekler. Ukrayna dili desteği, Ukraynaca ses birimlerinin Rus dilinin benzer sesli ses birimleriyle değiştirilmesine dayanmaktadır.

Sentezleyici, 1995 yılında Moskova Devlet Üniversitesi Bilim Parkı'ndaki Ses Teknolojileri Kulübü tarafından geliştirilen TTS yazılım kompleksi "Speaking Mouse Home" un on sesinden birinin alofon bazında oluşturuldu. Miras yoluyla, bu sentezleyici prototipinin adını “Konuşan Fare Evi” - Kaptan'dan aldı.

Rusça'nın yanı sıra Ukrayna dilleri Kaptan İngilizce, Almanca ve Fransızca ile çalışabildiği gibi çok dilli metinleri de ayrı ayrı okuyabilir: her dilin ilgili sentezleyici sesi vardır. Çok dilli belgelerin ayrı ayrı okunması ve İngilizce, Almanca ve Fransız dilleri eSpeak sentezleyiciyi temel alan ek bir modül kullanılarak gerçekleştirilir, ancak bu modülün Kaptan'ın çalışması için kullanılması gerekli değildir. Kurulum yapılmadan Rusça ve Ukraynaca dillerine destek sağlanabilmektedir. Kaptan'ın yeteneklerini genişletmeye yönelik bu modül, web sitemizden indirebileceğiniz arşive zaten dahil edilmiştir, bu nedenle, sentezleyicinin beraberindeki belgelerinde açıklandığı gibi ayrı olarak indirilmesi gerekli değildir.

Sentezleyici, konuşma anlaşılırlığı iyi ancak doğal sesi düşük olan bir erkek sesine sahiptir. Avantajları arasında yüksek çalışma hızı, küçük boyut ve düşük sistem kapasitesi kullanımı yer alır. Ancak "Kaptan"ın bir takım dezavantajları da vardır:

  • Sentezleyici pratik olarak konuşmanın perdesini ayarlama işlevini desteklemiyor.
  • Çalışma sırasında bazen sesli "yutma" olayı meydana gelebilir.
  • Zaman zaman sentezleyici çalışma sırasında sessizleşebilir veya metnin yalnızca ilk satırlarını okumaya başlayabilir. İÇİNDE bu durumda Normal çalışmaya dönmek için sentezleyicinin yeniden başlatılması önerilir.

Bu sentezleyicinin çalışması için bir sistem bileşeni gerekebilir.

Konuşmayı tanımayı öğrendik, ancak şimdilik sadece İngilizce, hareketsiz kalmayacağız, daha ileri gideceğiz, daha doğrusu ters yönde - metni sesli konuşmaya dönüştüreceğiz.

Bildiğim ve pratik deneyimim olan en popüler ve özgür konuşma sentezleyicileri: Festival, Transkripsiyonlar, OpenMary.
3'üne de sırasıyla bakalım.

Festival

İşletim Sistemi: Linux
Rus dili:
evet (erkek sesi)
Web sitesi: http://www.cstr.ed.ac.uk/projects/festival/

Oldukça gelişmiş bir sentezleyici, aşağıdaki dil paketleriyle birlikte gelir: İngilizce (İngilizce ve Amerikan telaffuzunda), Galce ve İspanyolca. Kastilya İspanyolcası, Çekçe, Fince, Hintçe, İtalyanca, Marathi, Lehçe, Rusça ve Telugu gibi başka paketler de vardır. Festival birçok Linux dağıtımına dahildir. Sentezleyici Rus dilini oldukça iyi anlıyor; kelimelerin ve noktalama işaretlerinin yazılışı ile oynarsanız oldukça mantıklı bir konuşma elde edebilirsiniz.

Kurulum

Ağda zaten festivalin kurulması ve Rusça dilinin eklenmesiyle ilgili pek çok materyal var, bu yüzden çok fazla ayrıntıya girmeyeceğim, sadece festivalin kendisini kurmanız gerekeceğini söyleyeceğim (depodan yüklenmiş) - festival) ve yine depodan (festvox-ru) yüklenen Rusça dil paketini kullanıyorsanız, yapılandırmada biraz değişiklik yapmalısınız. Bu konuyla ilgili güzel bir makale var.

Kullanım

Konsolda:

Yankı "Merhaba" | festival --tts --dil rusça

e-konuş

İşletim Sistemi: Linux, Windows, Mac OS X, RISC İşletim Sistemi
Rus dili:
evet (erkek sesi)
Web sitesi:

Basit, kompakt bir yazılım konuşma sentezleyicisi. Edinilen bilgilere göre eSpeak, 1.6 sürümünden itibaren Android mobil işletim sistemlerinde ve Maemo'da kullanılıyor. Windows ve Linux sürümleri kaynak koduyla birlikte düzenli olarak güncellenmektedir; diğer platformlarda ise durum daha da kötüdür. Rusça, İngilizce, Fransızca, İspanyolca vb. dahil olmak üzere birçok dil desteklenmektedir. Rusça konuşmayı karşılaştırırsak, eSpeak Festival'den daha düşük, İngilizce, Fransızca ve Almanca ise aynı seviyede.

Kurulum

Bazı dağıtımlarda Linux eSpeak zaten kuruludur, yoksa konsoldan da kurulabilir (espeak) veya istenen sürümü örneğin Windows'tan indirebiliriz.

Kullanım

Konsolda:

"Merhaba dünya!" -vru -s 100

Nerede:
-v dili (ru, en, de)
-s hız (80-450)

OpenMary

İşletim Sistemi: Linux, Windows, Mac OS X
Rus dili:
evet (erkek sesi)
Web sitesi:
http://mary.opendfki.de

Genç ve henüz pek popüler olmayan bir sentezleyici ama aynı zamanda çok işlevsel ve gelişmiş. Platformdan bağımsız olmasını sağlayan Java ile yazılmıştır. İstemci-sunucu prensibiyle çalışır. Her kelimenin tonlamasını, tınısını ve hızını belirleyebileceğiniz gelişmiş konuşma eklentileri vardır. Grafiksel bir arayüze sahip, aynı Java ile yazılmış bir istemciyle birlikte gelir.

Kurulum

Kurulum oldukça kolaydır ve herhangi bir çaba gerektirmez, Java yükleyiciyi indirin (Java'nın gerekli olduğunu unutmayın) . Yükleyiciyi başlatın ve talimatları izleyin. Kurulumun belli bir aşamasında kullanacağımız dil paketlerini seçmeniz istenecektir. , Kendim için Rusça ve İngilizceyi seçtim.

Kullanım

Kurulum dizinine gidin, klasöre gidin çöp kutusu ve sunucuyu başlatın - Maryserver. Sunucu başlatılır başlatılmaz istemciyi başlatın - Maryclient.

Her şey doğru yapıldıysa, “Oynat” düğmesine bastıktan sonra yazılı metnin telaffuzunu duyabilmeniz gerekir. Yukarıdaki dizin olan örnek klasörde, farklı diller için istemci uygulamalarının örnekleri bulunmaktadır.

Çözüm

Festival: ortalama ev ve kurumsal projeler için (hava durumu hakkında bilgi verme, mektup okuma, botlar için “dil” vb.).
eKonuş: küçük görevlerin uygulanması için (geçerli zamanın bildirilmesi, trafik sıkışıklığı hakkında bilgi verilmesi, posta kutusundaki harf sayısı, sabit sürücüdeki boş alan vb.).
OpenMary: büyük projeler için (akıllı ev sistemleri, programların seslendirilmesi, büyük metinlerin okunması).

Bilgisayarlara veya mobil cihazlara yüklenen konuşma sentezleyicileri artık eskisi kadar sıra dışı programlar gibi görünmüyor. Sayesinde modern teknolojiler normal bir masaüstü bilgisayar insan sesini yeniden üretebilir.

Konuşma sentezleyicileri nasıl çalışır? Nerede kullanılıyorlar? En iyi konuşma sentezleyicisi nedir? Bu ve diğer soruların cevapları bu makalede sunulmaktadır.

Genel konsept

Konuşma sentezleyicileri, yazılan metinleri insan sesiyle konuşulan cümlelere çevirme yeteneği sağlayan bir dizi modülden oluşan özel programlardır. Kelime ve deyimlerden oluşan veri tabanının tamamının profesyonel stüdyolarda gerçek kişiler tarafından kaydedildiğini düşünmemelisiniz. Böyle bir görevi tamamlamak fiziksel olarak imkansızdır. Bu kadar çok kelime öbeğinin yer aldığı bir kütüphane, bırakın cep telefonlarını, hiçbir modern bilgisayara bile kurulamaz. Bu amaçla geliştiriciler Text-to-Speech teknolojisini oluşturdular.

Uygulama kapsamı

Konuşma sentezleyicileri ders çalışırken kullanılır yabancı diller, kitap sayfalarındaki metinleri dinlemek, ses parçaları oluşturmak, sesli ifadeler şeklinde arama sorguları yayınlamak vb.

Ne tür programlar var? Uygulama kapsamına bağlı olarak yardımcı programlar 2 türe ayrılabilir: yazılan metni konuşmaya dönüştüren normal olanlar ve müzik uygulamalarında kullanılan özel ses modülleri.

Avantajları ve Dezavantajları

Şu anda bilgisayar insan konuşmasını yalnızca yaklaşık olarak sentezliyor. En basit programlarda ses ile ilgili sorunları ve çeşitli kelimelerdeki vurgunun doğru yerleştirilmesini gözlemleyebilirsiniz. Mobil cihazlara takılan konuşma sentezleyicileri çok fazla enerji tüketir. Ek modüllerin izinsiz indirildiğini not etmek çoğu zaman mümkündür.

Avantajları algılama kolaylığını içerir. Birçok kullanıcı sindirimi çok daha kolay buluyor ses bilgisi diğerlerinden daha.

Rus sesleriyle en iyi konuşma sentezleyicileri

RHVoice programı Olga Yakovleva tarafından oluşturuldu. Uygulamanın standart versiyonu 3 ses içermektedir. Ayarlar çok basit. Program hem SAPI5 ile uyumlu bağımsız bir uygulama olarak hem de ek bir ekran modülü olarak kullanılabilir.

Acapela konuşma sentezleyicisi, ideal metin telaffuzuyla benzerlerinden farklıdır. Uygulama dünyanın 30'dan fazla dilini desteklemektedir. Ücretsiz versiyonda sadece 1 kadın sesi bulunmaktadır.

Vokalizer çağrı merkezlerinde sıklıkla kullanılmaktadır. Kullanıcı vurguyu, ses seviyesini ve okuma hızını ayarlayabilir. Gerekirse yüklenir ek sözlükler. Uygulamada 1 adet kadın sesi bulunmaktadır. Konuşma motoru, elektronik formatta kitap okumak için programlara otomatik olarak entegre edilir.

eSpeak yardımcı programı 50'den fazla dili destekler. Programın dezavantajı, ses dosyalarını yalnızca WAV formatında kaydetmesidir, bu da sabit sürücünüzde çok fazla alan gerektirir.

Festival uygulaması, Fince ve Hintçe'yi bile destekleyen güçlü bir konuşma sentezi aracıdır.

Programın kurulumu

Bu tür bir uygulama nasıl kullanılır? Öncelikle programı kurmanız gerekiyor. Bilgisayar işletim sistemleri, kullanıcının yalnızca yardımcı program tarafından desteklenen dil modülünü seçmesi gereken standart bir yükleyici kullanır. Mobil cihazlara yönelik yükleyici resmi web sitesinden, Google Play'den ve App Store'dan indirilebilir. Uygulamanın kurulumu otomatik olarak gerçekleşir.

Programın ilk lansmanı

Bu aşamada kullanıcının yalnızca varsayılan dili ayarlaması yeterlidir. Bazen ses kalitesine dikkat etmeniz gerekir. Standart versiyon, 4410 Hz örnekleme frekansı, 16 bit derinlik ve 128 kbps bit hızı anlamına gelir. Mobil işletim sisteminde rakamlar daha düşük olabilir. Belirli bir ses temel olarak kullanılır.

Filtreler ve ekolayzerler istediğiniz sesi elde etmenize yardımcı olur. Kullanıcının metin çevirisi için üç seçeneği vardır. Klavyede cümleler yazabilir, mevcut bir dosyanın sesini açabilir veya web sayfalarındaki içeriği konuşmaya dönüştüren bir tarayıcı uzantısı yükleyebilir. Gerekli eylem tarzını, sesin tınısını ve metnin konuşulacağı dili not etmek yeterlidir. Oynatma işlemini başlatmak için “Başlat” düğmesine tıklayın.

Karmaşık programlarla çalışma

Müzik uygulamalarında ayarlar çok daha karmaşıktır. FL Studio programının konuşma modülünde kullanıcı çeşitli ses türlerini seçebilir, ayrıca ton ve oynatma hızını belirleyebilir. Vurgular hecelerden önce “_” sembolü kullanılarak yerleştirilir. Böyle bir konuşma sentezleyicinin yardımıyla yalnızca robotik bir ses oluşturabilirsiniz.

Vocaloid bir uygulamadır profesyonel tip. Kullanıcı, olağan parametrelere ek olarak artikülasyon ve glissando'yu da seçebilir. Yardımcı programın profesyonel vokalleri içeren bir veritabanı vardır. İstenirse tüm cümleleri notlara uyacak şekilde ayarlayabilirsiniz. Yalnızca vokallerin bulunduğu kütüphane, sıkıştırılmış biçimde 4 GB'tan fazla yer kaplıyor.

"Google Konuşma Sentezleyicisi": Bu program nedir?

Mayıs 2014'te şirket, kullanıcılara yeni bir ücretsiz ürünü deneme fırsatı sağladı. Android'de Google Konuşma Sentezleyicisi nedir? Bu, bir mobil cihazın veya tabletin ekranındaki metni okuyan bir programdır. Artık lisans gerektiren üçüncü taraf yardımcı programları yüklemenize gerek yok. E-kitap okurken, dinlerken "Google Konuşma Sentezleyicisi" kullanılır doğru telaffuz TalkBack uygulamasını başlatın.

Google Speech Synthesizer 3.1 programının yeni sürümü artık İngilizce, İtalyanca, İspanyolca, Korece, Almanca, Felemenkçe, Lehçe, Portekizce, Rusça ve Fransızca'yı destekliyor. Ses paketlerini nerede bulabilirim? Uygulamanın kendisinden indirilirler.

Google ürününün avantajları ve dezavantajları

Rusça konuşan kadın sesinin özellikleri, net, yüksek sesi ve pürüzsüz tonlamasıdır. Oynatma hızı program ayarlarından ayarlanabilir. TalkBack'i ve Android işletim sisteminin Rusça dil yerelleştirmesini kullanan kullanıcılar, uygulama daha önce varsayılan olarak farklı bir sese ayarlanmışsa, konuşma sentezleyiciye geçiş yaparken dikkatli olmalıdır. Mobil cihazınızın işitsel kontrolünü sürdürmekte sorun yaşayabilirsiniz. Rusça dışındaki hemen hemen tüm sesler Kiril alfabesindeki cümleleri işleyemez.

Dezavantajları arasında, ifadelerden oluşan metinleri okumaya gecikmiş bir tepki not edilebilir. farklı diller. Rus sesi, metalik tını notalarıyla ayırt edilir. Düşük frekanslarda tıkırtı sesi duyabilirsiniz. Avantajları arasında uygulamanın kararlılığı ve İngilizce kelimeleri okumanın kabul edilebilir kalitesi yer alır.

"Google Konuşma Sentezleyicisi": programın nasıl kullanılacağı

Yardımcı programın gerektiği gibi çalışması için onu en son sürüme güncellemeniz gerekir. Metni konuşma sürecini etkinleştirmek için ayarları açmanız gerekir. "Dil ve giriş" bölümünde "konuşma sentezi" kutusunu işaretlemeniz gerekir. “Varsayılan sistem” satırına da dikkat edilmelidir. Programın kendisindeki ses paketlerinin de güncellenmesi gerektiğini unutmayın.

Yardımcı programla çalışırken sorunlar

Gerekiyorsa kullanıcı uygulamayı devre dışı bırakabilir. En basit yardımcı programlarda durdurma düğmesi programın kendisinde bulunur. Tarayıcıya yüklenen bir uzantının devre dışı bırakılması, eklentinin devre dışı bırakılması veya eklentinin tamamen kaldırılmasıyla gerçekleştirilir. Programı cep telefonunda kullanırken de sorunlar ortaya çıkabilir. Gerçek şu ki, konuşma sentezleyici, kullanıcının ihtiyaç duymadığı dil modüllerini otomatik olarak yüklemeye başlar.

Bu işlem çok zaman alır ve trafiği önemli ölçüde tüketir. Mobil cihazımda Google Speech Synthesizer'ı nasıl devre dışı bırakıp bu sorundan nasıl kurtulabilirim? Öncelikle uygulama ayarlarını açmanız gerekir. Daha sonra “dil ve ses girişi” bölümünü seçmeniz gerekiyor. Daha sonra son satırı işaretlemeniz gerekir.

Sesli aramayı seçtikten sonra “çevrimdışı konuşma tanıma” öğesinin yanındaki çarpı işaretine tıklamalısınız. Daha sonra uygulama önbelleğini silmeniz önerilir. Daha sonra cep telefonunuzu yeniden başlatmanız gerekir. Yardımcı programı tamamen devre dışı bırakmak için ayarlardaki "uygulamalar" bölümünü açmanız, listeden bir konuşma sentezleyici seçmeniz ve "durdur" düğmesine tıklamanız gerekir.

Bir programın kaldırılması

Kullanıcı Google Konuşma Sentezleyicisini hiç kullanmıyor. Yardımcı programı bir mobil cihazdan kaldırmak mümkün mü? Bunu yapmak için Google Play'i açmanız gerekir. Daha sonra yüklü programlar listesinden konuşma sentezleyiciyi seçmeli ve “sil” butonuna tıklamalısınız.

Sonuçlar

Düzenli kullanıcılar ve kişiler için engelliler Basit arayüze sahip uygulamalar uygundur. Bu, RHVoice veya Google Konuşma Sentezleyicisi olabilir. Ekranda görüntülenen metni bir Rus sesi okuyacaktır. Ortalama kullanıcının daha fazlasına ihtiyacı yoktur.

Müzisyenlerin tercih yapmaları tavsiye edilir profesyonel program Vokaloid. Uygulamanın ek ses kütüphaneleri ve birçok farklı seçeneği vardır. Program doğal bir ses elde etmenizi sağlayacaktır. Sonuçta müzisyenler için bilgisayar sentezinin kulak tarafından algılanamaması o kadar önemli ki.

Arkadaşlarınızla paylaşın veya kendinize kaydedin:

Yükleniyor...