Vad är text-till-tal-teknik?

Text-till-tal hänvisar till omvandlingen av skrivna ord till en röstutgång med hjälp av talsyntes, ett konstgjort sätt att ge tillgång till verbal kommunikation i en alternativ form. Text-till-tal-teknik avser mjukvara och hårdvara som ger talutgång från textinmatning. Denna teknik kan skapa ord från lagrade fonem – individuella talelement – ​​och kan också lagra hela ord och fraser för bättre resultat. Text-till-tal-teknik har ett brett utbud av tillämpningar.

Åtminstone vissa datoroperativsystem har text-till-tal-teknik. Apple® Snow Leopard® har ”Text till tal”-inställningar tillgängliga i både en ”Tal”-sektion i ”Systeminställningar” och en ”Universal Access”, som tar upp användbarheten av text-till-tal-tekniken både som en bekvämlighet och som hjälp för personer med synnedsättning. Användarnas val när det gäller text-till-tal-tekniken inkluderar rösten som används, talhastigheten, om man vill meddela varningar eller applikationer som kräver uppmärksamhet och om tiden ska meddelas högt. ”Universal Access” ger tillgång till ”VoiceOver Utility”, som ger fler alternativ för att styra rösten. Detta är ett exempel på den kategori av applikationer som kallas skärmläsare eller personliga läsare.

Skärmläsare kan fylla en mängd olika funktioner förutom att hjälpa personer som är synskadade. De kan ge auditiva elever tillgång till utbildningsmaterial på det sätt som är mest användbart för dem. De kan hjälpa till med att lära sig främmande språk. Andra fördelar med dessa läsare är att de hjälper till med korrekturläsning och minskar ansträngda ögon. Kanske ännu viktigare, eftersom de kan och kommer att läsa vad som helst på skärmen, kan de tillåta människor som – av en eller annan anledning – har tappat talets förmåga att delta i en konversation, och rösten som en person kommunicerar med kan skapas från inspelat material med sin egen röst, om detta är tillgängligt. Filmkritikern Roger Ebert, som förlorade talets kraft på grund av operationen, fick efter att ha använt en av Mac OS-röster en röst gjord av band med sitt eget tal.

Det röstaktiverade programmet för åtkomst till e-post och textmeddelanden som kallas iLane® är ett exempel på en text-till-tal-teknik som är avsedd att användas i ett fordon och göra meddelandeåtkomst säkrare på vägen. Eftersom e-post och textmeddelanden återges högt och föraren kommer åt tekniken genom röstaktivering, behöver föraren inte ta blicken från vägen för att komma åt och/eller svara på dessa kommunikationer. Andra enheter är gjorda speciellt för att vokalisera GPS-data och för att läsa böcker högt: så är fallet med ett antal e-boksläsare.