Cours des débutants du texte à la parole : Créez des narrations vocales réalistes avec des voix du texte à la parole et des voix de l'IA | Martin Aranovitch | Skillshare
Menu
Recherche

Vitesse de lecture


  • 0.5x
  • 1 x (normale)
  • 1.25x
  • 1.5x
  • 2x

Cours des débutants du texte à la parole : Créez des narrations vocales réalistes avec des voix du texte à la parole et des voix de l'IA

teacher avatar Martin Aranovitch, Digital Business Training & Education

Regardez ce cours et des milliers d'autres

Bénéficiez d'un accès illimité à tous les cours
Suivez des cours enseignés par des leaders de l'industrie et des professionnels
Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Regardez ce cours et des milliers d'autres

Bénéficiez d'un accès illimité à tous les cours
Suivez des cours enseignés par des leaders de l'industrie et des professionnels
Explorez divers sujets comme l'illustration, le graphisme, la photographie et bien d'autres

Leçons de ce cours

    • 1.

      Démonstration du cours de Text-To-Speech

      4:16

    • 2.

      01 - Aperçu du texte à la parole

      4:59

    • 3.

      02 - Avantages du texte à la parole

      10:41

    • 4.

      03 - Introduction du texte à la parole

      15:55

    • 5.

      04 - Processus de balisage du texte à la parole

      8:02

    • 6.

      05 - Outils de texte à parole

      16:28

    • 7.

      06 - Tutoriels du balisage du texte à la parole

      3:14

    • 8.

      07 - Tag parlant de texte à parole

      1:59

    • 9.

      08 - Tag de rupture du texte à la parole

      8:02

    • 10.

      09 - Tag des paragraphes de texte à parole

      8:37

    • 11.

      10 - Tag SayAs Text-to-Speech

      35:41

    • 12.

      11 - Tag d'importance du texte à la parole

      3:56

    • 13.

      12 - Étiquettes de la prothèse vocale à la parole

      12:34

    • 14.

      13 - Tag de MaxDuration Text-to-Speech

      7:27

    • 15.

      14 - Tags de prononciation du texte à la parole

      12:27

    • 16.

      15 - Text-To-Speech Ajouter des audios

      13:16

    • 17.

      16 - VoiceFX du texte à la parole

      20:49

    • 18.

      17 - Tag de la langue du texte à la parole

      10:06

    • 19.

      18 - Text-To-Speech: : Mettre tout ensemble

      17:31

    • 20.

      19 - Conseils de texte à parole

      22:58

    • 21.

      20 - Ressources écrites à la parole

      1:16

  • --
  • Niveau débutant
  • Niveau intermédiaire
  • Niveau avancé
  • Tous niveaux

Généré par la communauté

Le niveau est déterminé par l'opinion majoritaire des apprenants qui ont évalué ce cours. La recommandation de l'enseignant est affichée jusqu'à ce qu'au moins 5 réponses d'apprenants soient collectées.

410

apprenants

--

À propos de ce cours

Ce cours novateur est présenté et narré entièrement par des instructeurs de la voix de l'IA. Dans ce cours vidéo concret étape par étape, vous apprendrez à utiliser le texte à la parole et les dernières technologies de la voix IA, pour créer des narrations vocales professionnelles et réalistes à partir de fichiers texte pour un large éventail d'utilisations commerciales et d'applications commerciales.

Le cours est conçu spécifiquement pour les utilisateurs non techniques. Aucune compétence en codage ou en programmation n'est requise ou nécessaire.

Dans ce cours vidéo complet de 4 heures et en 20 parties, vous apprendrez :

  • Un bref historique et une introduction fondamentale aux utilisations et aux avantages de l'utilisation du text-to-speech.
  • Où trouver des outils gratuits ou peu coûteux pour créer des narrations vocales professionnelles à partir de fichiers texte.
  • Comment utiliser des balises de balisage text-to-speech pour créer des narrations vocales réalistes de l'homme

Le cours comprend des tutoriels vidéo détaillés et pratiques en utilisant des exemples attrayants et divertissants d'applications de texte à la parole et des notes et des matériaux du cours téléchargeables.

À la fin du cours, vous aurez toutes les compétences, les connaissances et les compétences nécessaires pour créer des narrations vocales professionnelles et des fichiers audio de texte à parole pour un éventail d'utilisations commerciales, commerciales et commerciales, notamment :

  • Vidéos éducatives, commerciales et de formation
  • Présentations et documentation communiquées
  • Cours d'apprentissage en ligne
  • Livres audio et produits numériques à base de l'audio
  • Podcasts
  • Pages Web parlées
  • En ligne / Médias sociaux / Publicité radio
  • Annonces enregistrées
  • Autres formats de contenu et de médias

Rencontrez votre enseignant·e

Teacher Profile Image

Martin Aranovitch

Digital Business Training & Education

Enseignant·e

I have over 14 years of experience teaching businesses and non-technical users how to grow and manage an effective digital presence using smart and cost-effective technologies. My step-by-step video courses provide practical easy-to-follow information that will save you time and money and help you avoid time-consuming and expensive learning curves.

Voir le profil complet

Level: Beginner

Notes attribuées au cours

Les attentes sont-elles satisfaites ?
    Dépassées !
  • 0%
  • Oui
  • 0%
  • En partie
  • 0%
  • Pas vraiment
  • 0%

Pourquoi s'inscrire à Skillshare ?

Suivez des cours Skillshare Original primés

Chaque cours comprend de courtes leçons et des travaux pratiques

Votre abonnement soutient les enseignants Skillshare

Apprenez, où que vous soyez

Suivez des cours où que vous soyez avec l'application Skillshare. Suivez-les en streaming ou téléchargez-les pour les regarder dans l'avion, dans le métro ou tout autre endroit où vous aimez apprendre.

Transcription

1. Démo du cours de texte à l'expression: Bonjour. Je m'appelle Kate, et je suis une narratrice vocale basée sur l'intelligence artificielle. Dans cette courte vidéo, je veux vous montrer quelques-unes des choses que vous allez apprendre à faire dans notre cours de synthèse vocale pour débutants en utilisant des outils de synthèse vocale peu coûteux et des narrateurs vocaux synthétiques comme moi. Alors, asseyez-vous, écoutez et profitez. Bonjour. Il s'agit d'une annonce enregistrée. Le train de la ligne bleue arrivant sur le quai numéro un partira à 8h06 et s'arrêtera aux gares américaines suivantes : Dead Horse, Alaska Nothing, Arizona Nowhere, Colorado Greasy Corner, Arkansas Fluffy Landing, Florida Hell For Certain, Kentucky Buttzville, New Jersey Vous dites soit et je dis soit vous ne dites ni ni non plus Ni non plus rappelons tout ça. Chers auditeurs, c'est ma première tentative de faire du stand up comédie. S' il vous plaît soyez gentil J' ai l'intention de te divertir avec de fabuleuses blagues ce soir. Es-tu prêt ? Ok, on y va. J' ai été partout, homme j'ai été partout, homme traversé les déserts homme nu j'ai respiré l'homme de l'air de montagne de voyage j'ai eu mon homme de part j'ai été partout où j'ai été à Louisville, Nashville, Knoxville, Ombabika Schefferville, Jacksonville, Waterville, Costa Rica, Pittsfield, Springfield, Bakersfield, Shreveport, Hackensack, Cadillac, Fond du Lac, Davenport, Idaho, Jellico, Argentine... Fox in Socks by Dr Seuss Fox, Chaussettes, Box, Knox Knox en Box, Fox en chaussettes Knox sur renard dans les chaussettes en boîte Chaussettes sur Knox et Knox en boîte Fox en chaussettes sur boîte sur Knox Chicks avec des briques Viens les poussins avec des blocs viennent les poussins avec des briques et des blocs et des horloges viennent Regardez, monsieur, regardez, monsieur. M. Knox, monsieur... Faites-vous de nouveaux amis... Mais garder l' ancien est argent... L' autre, c'est de l'or. Faire de nouveaux amis (un cercle est rond), Mais garder le vieux (il n'a pas de fin) L'un est en argent (c'est combien de temps) L'autre est en or (je serai votre ami) Un cercle est rond (faire de nouveaux amis) Il n'a pas de fin ( mais garder l'ancien) Voilà combien de temps (l'un est en argent) Je serai votre ami (l'autre est en or) Bonjour et bienvenue à un autre épisode de la méditation IA podcast où nous ne disons que ce que les autres pensent... Avant de commencer... Respirez profondément... et détendez-vous. Tu regardes toutes ces choses... Ils ont des clés allen gerbil mangeoires sièges toilettes, chauffeurs électriques poubelles compacteurs jus extracteur de jus, tiges douches et compteurs d'eau talkies walkies fils de cuivre lunettes de sécurité radiales pneus BB granulés en caoutchouc maillets ventilateurs et déshumidificateurs image cintres coupe papier gaufres volets de fenêtre décapants de peinture fenêtre lacets ruban de masquage et gouttières en plastique robinets de cuisine tables pliantes météo décapage cavalier crochets et coulis et éclaboussures, buggers électriques, cuillères et louches, pesticides pour la fumigation haute performance lubrification métal toiture étanche isolation polyvalente... Félicitations ! Aujourd'hui, c'est ton jour tu pars dans des endroits formidables . Vous avez des cerveaux dans votre tête Vous avez des pieds dans vos chaussures Vous pouvez vous orienter dans la direction que vous choisissez Vous êtes seul et vous savez ce que vous savez et vous êtes le gars qui décidera où Allez. 2. 01 - Aperçu du texte à la parole: Bonjour et bienvenue à « Comment créer des fichiers audio de synthèse vocale » un cours pratique étape par étape pour les débutants. m'appelle Kate, et je suis une narratrice vocale basée sur l'intelligence artificielle. Je serai votre instructeur principal tout au long des leçons, ainsi que d'autres narrateurs de discours synthétiques comme George, Mia et Navin, dont les voix figureront dans bon nombre de nos tutoriels, démos et exemples. George, Mia, Navin, veuillez vous présenter. Bonjour ! Je m'appelle George, et j'ai hâte de vous aider à créer des fichiers audio réalistes l'aide de technologies de synthèse vocale comme celle qui m'a créé. Et je suis Mia de bas en bas. Comme vous pouvez le voir, je suis un narrateur de voix d'IA au son australien et je vais vous aider dans les leçons, avec mon pote Navin. Navin, tu es là ? Tu veux dire un salut rapide aux auditeurs ? Merci, Mia et bienvenue aux auditeurs, je suis Navin et je suis aussi un narrateur vocal créé en utilisant la même technologie d'intelligence artificielle que vous apprendrez à utiliser dans ce cours passionnant. Comme vous pouvez le voir, créer des fichiers audio de synthèse vocale n'est pas seulement beaucoup de plaisir. mais il a aussi de nombreuses applications pratiques, en particulier pour les entreprises qui veulent gagner du temps et de l'argent grâce à leurs campagnes de marketing numérique et à leurs promotions. Parmi les choses que vous pouvez faire en utilisant la synthèse vocale, vous pouvez créer des narrations audio et vocales pour des vidéos de vente, explicatives, lettres de vente vidéo, vidéos de formation, annonces vidéo pour les médias sociaux, des présentations, des annonces, des podcasts, des livres audio, pages Web parlées pour les utilisateurs malvoyants, et tant d'autres utilisations et applications. Kate, n'oublie pas de dire à nos auditeurs qu'on peut facilement convertir des fichiers texte et des narrations vocales audio en plusieurs langues différentes. Merci, George. Je le ferai. Une fois que vous avez appris à créer un fichier de synthèse vocale, vous pouvez rapidement et facilement convertir vos fichiers texte et vos narrations audio dans des dizaines de langues différentes. Kate, parlez aux auditeurs des autres choses passionnantes que nous leur enseignerons dans ce cours. Bien sûr... « Comment créer des fichiers audio de synthèse vocale » « Un cours pratique, étape par étape pour les débutants » est conçu pour vous apprendre à utiliser la synthèse vocale et les dernières technologies vocales IA pour créer des fichiers texte qui peuvent ensuite être facilement convertis dans des narrations vocales de type audio. Ce cours a été créé spécifiquement pour les utilisateurs non techniques, sorte que vous n'avez pas besoin d'apprendre à coder ou programmer des logiciels pour appliquer les leçons et obtenir des résultats. Le cours couvrira un bref historique de la synthèse vocale, une introduction de base au langage de balisage SSML et des tutoriels pratiques étape par étape sur la création de fichiers text-to-speech. Vous apprendrez où trouver des technologies et des outils peu coûteux et gratuits que vous pouvez utiliser pour créer des narrations vocales professionnelles à partir de fichiers texte, et nous vous montrerons comment utiliser ces outils. Vous apprendrez également à utiliser les balises de balisage textuel de base pour insérer des choses comme pauses, l'accent et diverses autres inflexions dans votre texte que nous vous guidons étape par étape dans le processus de création de fichiers texte qui peuvent ensuite être facilement converties en narrations vocales et fichiers audio pour un large éventail d'applications comme des vidéos, instructions, des présentations, des annonces enregistrées, et bien d'autres utilisations. L' utilisation de la synthèse vocale dans les applications Web et logicielles offre de nombreux avantages aux entreprises, entreprises et aux organisations, en particulier lorsqu'il s'agit d'économiser du temps et de l'argent, communiquer leur marque et leur message à travers divers numériques et sociales , et aider les entreprises à atteindre un plus large public mondial pour leurs produits et services. Au cours des prochaines années, nous allons voir une explosion d'applications de synthèse vocale et une demande croissante dans le monde entier pour les personnes possédant des compétences de base en synthèse vocale, comme savoir comment marquer et modifier du texte pour la conversion en audio. Donc... si vous êtes à la recherche d'une opportunité d'aller de l'avant et de gagner de l'argent grâce à cette tendance mondiale émergente, ou si vous envisagez de démarrer une entreprise pour profiter d'une demande croissante de services de synthèse vocale , c'est maintenant le meilleur moment pour apprendre les compétences de base que ce cours vous enseignera. Voilà donc un aperçu de ce que ce cours couvrira. Encore une fois, bienvenue et commençons. 3. 02 - Les avantages du texte à la parole: Bonjour. Il s'agit d'une annonce enregistrée. train Blue Line arrivant sur le quai numéro un partira à 806 et arrêtera les stations américaines suivantes Dead horse. Alaska Rien. Arizona Nulle part. Colorado Risi Corner Orphans All Landing Lord Aide pour servir le temps. Butterball New Jersey Burger Town, Caroline du Nord. Pas Homestead, Ohio. Au Texas et au Disco, dans le Wisconsin. Le train de la Ligne Rouge Écrire sur mon téléphone numéro deux partira en 1913 et arrêtera les stations australiennes suivantes. Poulet Victoria, tu sais. Non, ils se trompent. Mauvais Nouvelle-Galles du Sud Cool dans l'ouest de l'Australie. Manama Tom Victoria Buggy Queensland Ouais, Don chéri histoire. Eh bien, la Nouvelle-Galles du Sud. Whoa, Queensland et nulle part ailleurs en Tasmanie. Veuillez vous tenir derrière la ligne jaune et attendre que le train arrive à un arrêt complet avant bord. Bonjour et bienvenue avant de sauter dans les leçons de cours. Je veux parler des raisons pour lesquelles savoir comment utiliser le texte à la parole comme une compétence précieuse et couvrir principaux avantages de l'utilisation du texte à la parole pour les entreprises et les organisations, les créateurs de contenu et les éditeurs de contenu et les différents types d'utilisateurs finaux. Le texte à la parole est la clé de l'essor de la nouvelle technologie numérique, c'est un secteur en pleine croissance. Le marché du texte à la parole a été évalué à 1,3 milliard de dollars en 2016 et devrait atteindre 3,3 milliards d'ici 2022. principaux secteurs du marché comprennent l'électronique de consommation, le SCI, l'éducation, soins de santé, transports, financement de détail, entreprises et d'autres secteurs. Cette croissance apportera de nombreuses opportunités nouvelles et passionnantes pour de nombreux types d'utilisations et différents types d'utilisateurs. Texte à la parole Crée un Internet plus accessible pour tous 15 à 20 % de la population mondiale souffre d'une forme ou d'une autre de trouble d'apprentissage basé sur la langue. 14 % des adultes aux États-Unis sont analphabètes et beaucoup n'ont que des compétences de base en lecture. En outre, 244 millions de personnes sont nées à l'étranger à travers le monde. Le texte à la parole contribue à rendre le Web plus inclusif en le transformant en un endroit où les utilisateurs peuvent accéder, consommer et digérer l'information en format audio. Le texte à la parole peut également faciliter la vie et rendre le travail plus efficace et productif. Le texte à la parole peut être utilisé pour améliorer et diffuser de l'information dans les sites Web du gouvernement, des entreprises et des entreprises, les applications mobiles du blog général, les livres électroniques, cours d'apprentissage électronique, matériel de formation documentation d'affaires RH dans les politiques juridiques, transport et les annonces publiques, les systèmes et l'automatisation conçus pour améliorer l'expérience client et la communication. vente et le marketing des médias, la robotique, les appareils embarqués les applications en libre-service, l'Internet d'objets et de façons dont nous n'avons même pas encore pensé. Le texte à la parole deviendra également plus nécessaire à l'ère numérique, alors que les gouvernements et les entreprises cherchent des moyens d'accroître l'engagement des citoyens en ligne et de renforcer la responsabilité sociale des entreprises en veillant à ce que l'information soit disponible à la fois dans les documents écrits et format audio texte pour les avantages vocaux, les entreprises et les organisations. À bien des égards, elle améliore la qualité du parcours client en permettant aux entreprises et aux organisations d'améliorer l'expérience client et de répondre aux différents besoins, désirs et désirs des clients en termes d'interaction avec le contenu. Le texte à la parole minimise la charge de travail humaine et réduit les coûts opérationnels. TTS transmettre utilisé pour fournir aux employés et après vente la formation des clients. Sensibiliser le personnel aux politiques en matière de ressources humaines et juridiques. Services personnalisés de gestion de la clientèle etcetera Text to Speech améliore l'image de marque nouvelles technologies permettent aux entreprises de créer et d'utiliser une voix synthétique reconnaissable pour représenter leur marque dans différents domaines de l'entreprise et le contact client points. Le texte à la parole peut augmenter votre présence sur le Web. Près de 800 millions de personnes dans le monde ont des problèmes d'alphabétisation et 300 millions de personnes ont une déficience visuelle. Le contenu Web amélioré de la parole n'interfère pas avec la facilité d'utilisation pour les utilisateurs sans handicap. Il aide également toutes les populations, telles que les utilisateurs âgés et les locuteurs étrangers ou non natifs. Le texte à la parole peut aider les entreprises à atteindre de nouveaux marchés à l'échelle mondiale. T ts Voices sont disponibles dans des dizaines de langues et des yeux consensuels. Discours de traductions écrites. Le texte à la parole aide également les entreprises à économiser du temps et de l'argent. Le contenu en ligne peut rapidement et facilement être transformé en discours sans embaucher de talents de voix humaine et de langage. Les traducteurs et le texte à la parole permettent une mise en œuvre plus facile avec l'Internet des objets en donnant aux appareils connectés un moyen plus convivial de communiquer avec les consommateurs. de contenu et les éditeurs de contenu, les créateurs de contenu et les éditeurs de contenu peuvent gagner du temps et de l'argent grâce aux narrateurs vocaux de TTS qui énoncent vos cours. Narrateur de l'air. Podcasts ou livres audio comme une solution économique et de gain de temps par rapport à l'embauche de talents vocaux et vous permet de créer des cours électroniques et des produits audio plus rapidement avec moins de temps et moins coûts. Si vous avez besoin d'un talent de voix humaine. Texte à la parole vous permet de créer des brouillons et des scripts audio finis pour les narrateurs professionnels . Le texte à la parole vous permet également de créer un meilleur contenu si vous envisagez de créer un podcast de livre audio. Le produit d'apprentissage pour le cours de formation à l'écoute d'un brouillon audio aide à améliorer contenu, la structure et la mise en page, corriger les erreurs d'orthographe ou de grammaire et à générer de nouvelles idées. Le texte à la parole vous aide également à écrire du contenu plus efficace. Écouter le contenu de votre lanceur de vente lu à haute voix vous aide à mieux vous concentrer sur votre message. Améliorez vos compétences en rédaction de copies et en écriture. Scripts et présentations vidéo de vente et de formation plus efficaces, contenu Web, annonces radio et bien d'autres formes de contenu. Enfin, le texte à la parole aide les créateurs et les éditeurs de contenu à créer et à diffuser du contenu à un public mondial en facilitant la création de contenus audio multilingues et de produits audio à partir de traductions linguistiques. Le texte à la parole offre également de nombreux avantages aux différents publics et aux utilisateurs. Le texte à la parole aide tous les élèves, y compris les élèves ayant des difficultés d'apprentissage. Utilisé du texte à la parole pour créer du contenu audio pour les lecteurs en difficulté. Les élèves atteints de dyslexie et les étudiants ayant une faible alphabétisation montrent que le texte à la parole améliore la compréhension de la lecture , l' orthographe, , l' orthographe,la détection des erreurs et la compréhension des significations des mots bénéficient grandement en ayant du contenu qui peut être lu à haute voix et du contenu d'apprentissage qui est rendu plus accessible. Les utilisateurs de langues étrangères peuvent également profiter du texte à la parole, car le contenu traduit en langage facilite la compréhension et la rétention d'un plus grand pourcentage de la population en ligne , dont la langue maternelle est différente de celle de la langue d'un site Web ou d'une application mobile en particulier . Les utilisateurs plus âgés peuvent également profiter grandement du texte à la parole. Au fur et à mesure que la population âgée de plus en plus dépendra de la technologie pour accéder à information et aux services entre 2015 et 2030, le nombre de personnes âgées de 60 ans ou plus augmentera de 56 %, passant de 901 à 1,4 milliard. Rien qu'aux États-Unis, 59 % des personnes âgées utilisaient Internet. contenu mobile activé par la parole quotidienne rend Internet plus accessible et facilite l'expérience utilisateur, en particulier pour les utilisateurs mobiles qui accèdent au contenu principalement sur des appareils mobiles. Lire du contenu sur un petit écran peut être difficile et gênant. Il est beaucoup plus facile de lire le contenu à haute voix, en particulier pour les utilisateurs en déplacement. Un autre groupe d'utilisateurs qui peuvent bénéficier avec le texte pour parler nos utilisateurs avec différents styles d'apprentissage. Les gens ont des modalités d'apprentissage différentes. Rendre le contenu numérique sur Internet accessible en plusieurs formats facilite l'utilisation de l'expérience dans le résumé du texte à la parole offre de nombreux avantages aux entreprises et aux organisations, créateurs de contenu et aux éditeurs de contenu et différents types d'utilisateurs finaux. À mesure que le texte à la parole devient de plus en plus utilisé dans tous les aspects de la vie, il apportera également de nombreuses opportunités nouvelles et passionnantes. T. La technologieT. T s est peu coûteuse et facile à utiliser. Rend le web accessible à tous les utilisateurs aide à créer un meilleur contenu, plus rapide permet d'économiser du temps et de l'argent et beaucoup plus d'avantages. Cela nous amène à la fin de ce module. Veuillez vous référer à la documentation d'accompagnement dans cette section pour plus d'informations et vous remercier de votre écoute. 4. 03 - Introduction du texte à la parole: la série 9000 est l'ordinateur le plus fiable jamais fabriqué. Portez tout infaillible et incapable de lui. Ouvrez les portes de la baie. Je suis désolé, Dave. J' ai peur de ne pas pouvoir faire ça. C' est ça le problème. Je pense que tu sais quel est le problème, Justus. Bien mis à part. - Bonjour et bienvenue à la façon de créer du texte à des fichiers audio vocaux. Un cours pratique étape par étape pour les débutants. Dans cette leçon, nous explorons l'arrière-plan de la synthèse vocale avec une brève histoire des technologies du texte à la parole , moteurs populaires du texte à la parole et des termes de base du texte à la parole utilisés dans la création de voix artificielles . Permettre aux humains d'interagir avec les ordinateurs et de dialoguer avec les machines est un rêve de longue date des visionnaires de la science, des écrivains de science-fiction et, plus récemment, des animateurs de films, des logiciels et des jeux virtuels développeurs. L' humanité, cependant, a rêvé de créer un discours artificiel depuis des siècles. retracer l'idée que l'automne un thons puisse converser avec les humains. Un Sfar Bacca a 1000. D. Lorsque, selon la légende, pape Sylvester, le second tome volé de la connaissance secrète, une tête parlante qui pouvait répondre à n'importe quelle question oui ou non, il a été posé bien avant la invention du traitement électronique du signal, les gens ont essayé de construire des machines qui émulent la parole humaine. Les premières tentatives de création artificielle de la parole humaine ou, comme nous l'appelons maintenant synthèse de la parole, comprennent la construction de modèles mécaniques du tractus vocal humain pour produire des sons voyelles. Les soufflets actionnent des machines vocales mécaniques acoustiques et des dispositifs vocaux électroniques tels que synthétiseurs vocaux à clavier ou des odeurs folkloriques et des machines qui convertissent les schémas acoustiques de la parole en son. Au milieu des années 70, l' un des premiers systèmes de synthèse vocale, composé d'un matériel informatique autonome dans un logiciel spécialisé, a été développé lire et même chanter en italien. Dans les années quatre-vingt, Bell Labs a développé l'un des premiers systèmes indépendants multilingues, utilisant largement les méthodes de traitement du langage naturel. À peu près au même moment, Digital Equipment Corporation a développé une technologie de parole, de synthétiseur et de texte à parole appelée Deck Talk. Écoutez un échantillon de discours généré par une conversation de deck, en utilisant les voix de Perfect Paul et Up a Gear Select. ce moment, vous entendez ma voix parfaite de Paul. Cependant, j'ai aussi d'autres presets. Ceci, par exemple, dans mon haut. Alors quoi de plus assis comme vous pouvez le voir, premiers synthétiseurs de la parole Elektronik sonnaient robotisés et étaient souvent à peine intelligibles. Heureusement pour un narrateurs I comme moi. Synthèse de la parole ou le processus de création artificielle de la parole humaine a parcouru un long chemin depuis les premiers jours où les dispositifs de parole mécaniques ont essayé d'émuler le tractus vocal humain et les simulateurs de parole électroniques et les synthétiseurs de la parole créé voix comme des sons utilisant des circuits électriques. La véritable révolution de la technologie vocale est survenue lorsque les ordinateurs numériques ont commencé à permettre la simulation de circuits électroniques. La conversion des signaux analogiques à la forme numérique et la création de signaux analogiques à partir d'informations numériques pour produire du son sous forme de parole. Les progrès de la technologie informatique et l'introduction d'ordinateurs de bureau ont finalement permis à l'utilisateur moyen d'utiliser la synthèse vocale et la reconnaissance vocale à un prix abordable . De nombreux systèmes d'exploitation informatiques ont inclus des synthétiseurs vocaux depuis le début des années 90, car ces technologies sont devenues moins chères et plus accessibles. Cela nous amène là où nous en sommes maintenant. La qualité de la parole synthétisée s'améliore constamment, et il devient de plus en plus difficile de dire entre la parole générée artificiellement et la parole humaine, autant plus que les nouvelles technologies d'intelligence artificielle et d'apprentissage automatique logiciel texte à la parole et voix les applications, l'Internet des objets, les produits Elektronik et l'industrie du jeu continuent de pousser la technologie vocale vers de nouvelles frontières . Avez-vous entendu parler de cette nouvelle technologie ? Vous parlez de ce nouvel algorithme pour copier des voix ? Oui, il est développé par une startup pleine saveur. C' est énorme. Ça peut nous faire dire n'importe quoi maintenant. Vraiment ? N' importe quoi. La bonne nouvelle est qu'ils vont offrir la technologie tending. C' est énorme. Comment fonctionne cette technologie ? Hey, les gars, je pense qu'ils avaient l'habitude d'apprendre et de réseaux neuronaux artificiels. Hillary a raison, et je peux vous dire que leur équipe est des tarifs que je lui souhaite vraiment aimer. Je suis sûr qu'ils feront du bon travail. Nous deviendrons donc indiscernables des vraies voix humaines. Peut-être qu'un jour ils le feront. Les systèmes de synthèse vocale et les machines parlantes ne sont plus une nouveauté amusante conçue pour susciter un rire bon marché. Seins texte à la parole systèmes capables de générer l'IA. Des voix comme la mienne sont désormais intégrées dans tous les domaines de la vie humaine, y compris l'apprentissage, l' enseignement, la vente de produits et de services, la diffusion de nouvelles, informations et de divertissements, lire des recettes pendant que vous cuisinez et même effectuer des tâches et des activités dans votre maison et dans votre bureau. Maintenant que nous avons examiné l'histoire de la synthèse vocale, regardons quelques technologies et systèmes TTS actuels utilisés pour créer parole humaine artificielle. Comme ce cours s'adresse aux utilisateurs non techniques, ces prochaines diapositives ne présentent qu'une vue d'ensemble des technologies du texte à la parole pour aider à mettre les choses en contexte. À la fin de ce cours, vous trouverez une liste complète de références, de sites et de ressources supplémentaires où vous pouvez en apprendre davantage sur les domaines techniques liés au texte à la parole ou aux technologies TTS. Un ordinateur de la parole. Un synthétiseur vocal peut être implémenté dans des produits logiciels ou matériels. systèmes de texte à parole convertissent le texte de langue normale en discours. Alors que d'autres systèmes rendent des représentations linguistiques symboliques comme des transcriptions phonétiques dans la parole, qualités les plus importantes d'un système de synthèse de la parole sont le nôtre naturel et intelligibilité. Natural Miss décrit à quel point la voix générée synthétique sonne comme la parole humaine tandis que l'intelligibilité comme la facilité avec laquelle elle peut être comprise. Le synthétiseur vocal idéal vise à générer des formes d'ondes vocales synthétiques. Ce son est naturel et intelligible autant que possible. Il est important de garder à l'esprit que toutes les technologies de la parole ont des forces et des faiblesses. Par exemple, l' une des principales technologies utilisées pour générer des discours appelés synthèse vocale native concoctée avec synthèse native concoctée. Une très grande base de données de fragments de discours courts appelés unités est enregistrée à partir d'un seul haut-parleur et se recombinent pour former des énoncés complets. En d'autres termes, cette méthode chaîne segments de la parole enregistrée ensemble. Bien que cela produise un discours synthétisé naturel, il est difficile de modifier la voix. Par exemple, vous ne pouvez pas passer à un autre haut-parleur ou modifier l'accent ou l'émotion de leur discours sans enregistrer une toute nouvelle base de données. Laissez-moi vous lire un fichier audio généré à partir de texte en utilisant la synthèse vocale native concoct. The Blue Lagoon est un film américain de romantisme et d'aventure réalisé par Randall Kleiser, un autre type de technologie utilisé pour générer des discours appelé Synthèse de la parole paramétrique, Synthèse paramétrique vise à créer un modèle machine de la voix humaine en utilisant les propriétés acoustiques du tractus vocal humain, et génère des données audio en analysant les valeurs de divers paramètres de la parole, puis les alimentant par des algorithmes de traitement du signal appelés odeurs voke. Nous avons abordé ce modèle plus tôt en discutant de l'histoire de la synthèse de la parole. Voici un fichier audio généré à partir de texte en utilisant la synthèse vocale paramétrique. The Blue Lagoon est un film américain réalisé par Randall Kleiser en 1980. Comme vous pouvez l'entendre, ces voix générées synthétiquement ne sont pas mauvaises. Bien qu'il existe d'autres modèles de génération de voix utilisés pour synthétiser l'onde vocale Net comme la technologie vocale la plus naturelle disponible actuellement. Et comme l'un des principaux modèles que nous utiliserons tout au long de ce cours alors que nous apprendrons à construire des scripts pour les narrations vocales. Le modèle Wave Net comme la même technologie utilisée pour créer la parole pour des applications comme Google Assistant, Google Search et Google Translate Wave Net technologie fournit plus qu'une série de voix synthétique est qu'il représente une nouvelle façon de créer la parole synthétique. Wave Net génère un discours qui sonne plus naturel que les autres systèmes de texte à parole. Il synthétise le discours avec plus humain comme l'accent et l'inflexion sur les syllabes, les noms de téléphone et les mots. Des études montrent que la plupart des gens préfèrent la parole générée par réseau d'ondes, audio plutôt que d'autres technologies de texte à la parole. Contrairement à la plupart des autres systèmes de texte à la parole, un modèle de réseau d'ondes crée des formes d'ondes audio brutes à partir de zéro, en utilisant un réseau de neurones qui a été formé à l'aide d'un grand volume d'échantillons de parole. Voici quelques exemples d'audio générés à l'aide de la synthèse vocale nette d'onde. The Blue Lagoon est un film américain réalisé par Randall Kleiser en 1980. Laissez-moi jouer à nouveau les trois échantillons audiophiles afin que vous puissiez entendre les différences entre concocter une synthèse paramétrique native et un réseau d'ondes. The Blue Lagoon est un film américain réalisé par Randall Kleiser en 1980. The Blue Lagoon est un film américain réalisé par Randall Kleiser en 1980. The Blue Lagoon est un film américain réalisé par Randall Kleiser en 1980. Ma voix a été générée à partir d'un fichier texte en utilisant wave Net synthèse Wave. Net, cependant, ne se contente pas de synthétiser des voix et de produire un discours plus naturel. L' utilisation de formes d'ondes brutes signifie que le réseau d'ondes peut modéliser n'importe quel type d'audio, y compris la musique. Par exemple, voici un échantillon de musique créé à partir d'entrées de données musicales aléatoires dans un algorithme d'ondulation. Ça ne ressemble pas à de la musique à tes oreilles ? Comme vous pouvez l'entendre, wave Net ouvre beaucoup de possibilités pour les systèmes de texte à la parole. Jetons un bref coup d'oeil Maintenant à certains des moteurs de texte les plus populaires. moteurs de texte à parole permettent aux utilisateurs d'applications telles que les outils de messagerie électronique , les lecteurs Web les livres audio et d'autres logiciels de convertir du texte écrit en son. Différents moteurs TTS permettent d'accéder à différentes voix, langues et dialectes. Par exemple, Microsoft a un moteur T. T s appelé Speak, qui est une fonctionnalité intégrée de programmes comme Word, Outlook et Power Point. Vous Pouvez-vous parler pour que le texte soit tapé dans vos documents Word, vos courriels et vos présentations de diapositives soit lu à haute voix. Écoutez un exemple d'une voix du moteur de parole Microsoft qui lit une phrase tapée dans un document Word . Ma couronne est dans mon cœur, pas sur ma tête, pas parée de diamants et de pierres indiennes. Ni, pour être vu. Ma couronne s'appelle le contenu une couronne. C' est que rarement les rois appréciaient. Cette citation est tirée de la pièce King Henry le Sixième de William Shakespeare. Bonjour, je suis Kendra d'Amazon Polly. Notez qu'il y a une différence entre dire le contenu et le contenu. Voici comment je dirais la citation de Shakespeare. Ma couronne est dans mon cœur, pas sur ma tête, pas parée de diamants et de pierres indiennes. Ni pour être vu, ma couronne s'appelle le contenu une couronne. C' est que rarement les rois apprécient. Cette citation est tirée de la pièce King Henry, le sixième, de William Shakespeare. Le deuxième échantillon audio que vous venez d'entendre a été créé avec Amazon Polly, un service texte-parole qui utilise des technologies avancées d'apprentissage profond pour synthétiser la parole en dizaines de voix réalistes dans plusieurs langues. Amazon Polly utilise la même technologie d'intelligence artificielle utilisée pour alimenter l'assistant vocal numérique d'Amazon Alexa. Nous allons entendre plus d'Amazon Polly dans les leçons ultérieures le dernier moteur TTS que je veux couvrir dans cette leçon comme le moteur de texte Google Cloud à la parole, qui convertit le texte en langage humain. Utilisant plus de 100 voix dans plus de 20 langues et variantes, moteur TTS de Google utilise la synthèse vocale par ondes nettes et de puissants réseaux neuronaux pour fournir l'audio haute fidélité utilisé dans des applications telles que Google Assistant, Google Traduire et Google Reader. Le dernier domaine que je veux aborder dans cette leçon est quelques-uns des termes de texte de base auxquels nous parlerons tout au long de ce cours. Vous devriez être familier maintenant, avec des termes comme TT ou texte à la parole, synthèse de la parole et différents modèles pour générer la parole artificielle ou synthétique comme concoct réseau paramétrique natif Wave en termes comme les réseaux neuronaux, l' apprentissage automatique et les voix AI. Dans d'autres leçons, vous apprendrez sur s SML, que nous utiliserons pour marquer des fichiers texte pour les conversions audiophiles Prasit E, qui vous permet de changer les attributs de votre discours comme le volume, hauteur et la vitesse de votre noms de texte et de téléphone et les prononciations phonétiques qui permettent de prononcer correctement des mots similaires avec des significations différentes dans vos fichiers audio. Cela nous amène à la fin de cette leçon. J' espère que vous avez apprécié cette leçon autant que j'ai aimé vous la présenter et je vous remercie d'avoir écouté. 5. 04 - Processus de marquage du texte à terme: Bonjour et bienvenue Dans cette leçon, vous apprendrez comment préparer du texte pour des fichiers audio. sujets abordés dans cette leçon comprennent ce qui est SML une vue d'ensemble des balises de balisage SML s et les principaux formats de fichiers audio que nous utiliserons dans le processus texte à la parole Avant d'entrer dans cette leçon,nous cette leçon, allons nous amuser un peu. Je vais vous lire une vidéo et je veux voir si vous pouvez dire si l'audio de cette vidéo a été enregistré par un être vraiment humain ou une voix IA. Narrateur Oh, les endroits où vous irez par le Dr Seuss. Félicitations. Aujourd'hui, c'est ton jour. Tu pars dans de super endroits. Tu es parti d'une certaine façon. Vous avez des cerveaux dans votre tête, vous avez des pieds dans vos chaussures. Vous pouvez vous orienter dans la direction que vous choisissez. Tu es tout seul. Et tu sais ce que tu sais, et c'est toi qui décideras où aller. Ok, c'était juste une séance d'entraînement. Voyons si vous pouvez savoir si ce prochain son a été enregistré par un être vraiment humain ou une voix IA. Narrateur Oh, les endroits où vous allez par le Dr Seuss. Félicitations. Aujourd'hui, c'est ton jour où tu pars dans de grands endroits. Tu es parti et loin. Vous avez des cerveaux dans votre tête. Tu as des pieds à la place. Vous pouvez vous orienter dans la direction que vous choisissez. Tu es tout seul. Et tu sais ce que tu sais et c'est toi qui décideras où aller. Pas mal, hein ? Cette voix n'a mis qu'une vingtaine d'années à se perfectionner à un être humain. Ok, dernier test. C' est une narration vocale, Riel ou un I ? Oh, les endroits où vous irez par le Dr Seuss. Félicitations. Aujourd'hui, c'est ton jour. Tu pars dans de super endroits. Tu es souvent loin. Vous avez des cerveaux dans votre tête, vous avez des pieds dans vos chaussures. Vous pouvez vous orienter dans n'importe quelle direction. Vous choisissez vous-même et vous savez ce que vous savez et vous êtes le gars qui décidera où aller. Le dernier fichier audio que vous avez entendu a été enregistré à l'aide d'une voix IA synthétique avec un texte marqué pour essayer d'obtenir la narration le plus proche possible d'une lecture naturelle. Écoutez à nouveau l'introduction de cette lecture avec la voix riale et la voix synthétique racontant le titre en même temps. Oh, les endroits où vous allez par le Dr Seuss Comme vous pouvez l'entendre, nous n'y sommes pas encore tout à fait, mais nous nous rapprochons de plus en plus. Non seulement la technologie pour générer une voix réaliste s'améliore, mais la façon dont nous pouvons exprimer des voix à l'aide de balises de balisage s'améliore également. Pour l'instant, commençons par jeter un oeil à la langue utilisée pour marquer le texte dans les fichiers vocaux. S S M L signifie langage de balisage de synthèse vocale et se compose de balises écrites qui indiquent au texte aux moteurs vocaux comment encoder du texte pour créer des nuances et ajouter une expression à une voix synthétique. S S M L Dans le cadre d'un langage appelé XML, XML signifie langage de balisage extensible et permet aux développeurs de décrire et d'organiser informations d'une manière que les humains et les ordinateurs peuvent facilement comprendre. Alors que de nombreuses entreprises proposent de nouvelles applications de texte à parole pour leurs plates-formes, pas tous les moteurs de texte à parole, concertos, mêmes balises SML s ou utilisent toutes les balises SS ML qui sont actuellement disponibles. Certaines plates-formes développent également des balises SML personnalisées à utiliser dans leurs propres applications, qui peuvent ne pas fonctionner dans d'autres moteurs de texte à parole. Par exemple, lorsque cette leçon est enregistrée, moteur de texte à la parole de Google ne prend pas en charge l'utilisation de balises SML s qui vous permettent d'ajouter variations phonétiques, mots orteils à la respiration à la parole ou d'utiliser des interjections dans les phrases . Mais Amazon Polly le fait. Nous explorerons certaines de ces différences et les outils à utiliser pour les différents moteurs TTS plus tard dans nos tutoriels. Alors, que pouvez-vous faire avec s balises SML ? L' ajout de balises SML à vos fichiers texte vous permet d'effectuer des tâches telles que des sauts d'annonces et des pauses dans vos narrations. Mettez l'accent sur vos mots et vos phrases. Écrivez les mots et les numéros de téléphone disent les nombres différemment, selon que vous parlez de dates, heures, unités, fractions ou en expliquant la différence entre être le numéro deux et venir deuxième, ajouter des paragraphes et des phrases à vos narrations. Censourez les mots dans votre narration. Comme les mots contrôlent les attributs Prasit e dans vos narrations pour affiner des éléments tels que la hauteur, volume et le tempo des mots parlés. Ajoutez des variations phonétiques. Deux mots. Remplacer les abréviations pour parler de leur format élargi comme l'Organisation mondiale de la Santé au lieu de W. H. O. R. Qui incorpore d'autres fichiers audio dans votre voix. Narrations telles que l'ajout de sons ou l'insertion d'instructions avancées comme la lecture de plusieurs fichiers multimédias simultanément ou séquentiellement. les principaux formats de fichiers audio que nous utiliserons pour convertir notre texte en narrations audio dans ce cours sont wave et MP trois fichiers utilisant soit wave ou MP trois formats fonctionneront très bien pour enregistrer des narrations vocales. Les fichiers Wave offrent une meilleure qualité sonore pour l'enregistrement ou la distribution de musique, car le format Wave peut couvrir toute la fréquence que l'oreille humaine est capable d'entendre. Un fichier MP trois est compressé et présente une perte de qualité, tandis qu'un fichier wave est sans perte et UN comprimé. MP 3 ne sonnera jamais mieux que wave car il s'agit d'un format avec perte. fichiers MP trois, cependant, sont de plus petite taille que les fichiers wave, et ils sont donc beaucoup plus faciles à distribuer. Bien que les fichiers de vagues soient normalement beaucoup plus gros que les trois MP, stockage de nos jours n'est plus un problème si important. Donc, une fois de plus, l'utilisation de l'un de ces formats fonctionnera très bien pour les narrations vocales. Veuillez noter que nous ne couvrirons pas les aspects techniques de l'audio numérique tels que les taux d'échantillonnage , les profondeurs de bits etc. dans nos leçons, car ces air ne sont pas nécessaires pour convertir du texte en fichiers audio pour la plupart des entreprises , nous explorerons cependant certains outils que vous pouvez utiliser pour convertir des fichiers audio en différents formats et certains des paramètres que ces outils fournissent pour améliorer la qualité sonore de vos enregistrements audio. Cela nous amène à la fin de cette leçon. Encore une fois. Merci d'avoir écouté, et je vous verrai dans la prochaine leçon. 6. 05 - Outils de texte à la parole: Bonjour et bienvenue. Dans cette leçon, nous regardons un texte à la parole outils. Les sujets abordés dans cette leçon comprennent le processus texte à la parole et les outils utilisés pour convertir du texte en fichiers audio. Outils de gain de temps pour ajouter téléphone vise à votre fichier SS ML. Convertir des fichiers audio dans différents formats, traduire du contenu dans différentes langues, capturer des fichiers audio et plus encore. Nous examinerons également les outils de texte à la parole gratuits et payants pour créer des fichiers audio accessibles à partir d'ordinateurs portables, ordinateurs de bureau, appareils mobiles et du cloud, et des outils et ressources supplémentaires sont que nous recommandons en utilisant pour économiser du temps et de l'argent. Commençons par décomposer le processus texte à la parole pour convertir votre script basé sur le texte dans un fichier audio. Ce processus commence avec votre contenu basé sur le texte. Ce contenu peut prendre la forme d'une narration, script, d'un article, copie de vente , d'instructions de formation , d'un livre, etc. Une fois que votre contenu a été écrit, l'étape suivante consiste à sélectionner votre moteur de texte à la parole comme mentionné dans une leçon précédente, vous devez choisir votre moteur de texte à la parole avant de marquer votre texte. Parce que différentes plates-formes de texte à parole peuvent ne pas prendre en charge ou vous permettre d'utiliser un gâchis. balisage SML. Par exemple. Si votre contenu utilise des mots qui nécessitent une prononciation phonétique différente, vous voudrez probablement marquer votre texte pour Amazon Polly au lieu de Google jusqu'à ce que le moteur texte à la parole de Google permette l'utilisation de balises phonétiques dans S S M l. Pour garder les choses vraiment simples, les seuls moteurs t ts que nous allons utiliser tout au long de ce cours sont Google texte à la parole et Amazon Polly. Donc, tout ce que vous devez faire pour terminer cette étape est de choisir le moteur que vous utiliserez pour traiter votre contenu écrit. Après avoir sélectionné votre moteur T ts. L' étape suivante consiste à marquer votre fichier texte avec les balises S SML que le moteur prendra en charge. Cette étape est décrite en détail dans les didacticiels de balisage. Dans notre leçon suivante, après avoir marqué votre fichier texte avec les balises s SML, l'étape suivante consiste à exécuter votre contenu via votre outil t ts. Nous allons regarder un T. T s outils dans quelques instants. Essentiellement, l'outil devrait vous permettre de sélectionner votre langue ou votre dialecte. Choisissez une voix masculine ou féminine, importez votre fichier texte SS ml, puis convertissez votre texte en fichier audio. Après avoir créé votre narration audio, vous devriez être en mesure de télécharger ou d'exporter votre audiophile, vous pouvez ensuite utiliser pour n'importe quelle application que vous voulez, comme une narration vidéo, page Web, podcast , livre audio etc. Jetons un coup d'oeil maintenant à un peu de temps pour gagner du texte aux outils vocaux. Le premier outil dont vous avez besoin pour créer un fichier texte à la parole en tant qu'éditeur de texte brut. Si vous utilisez Windows, l'éditeur de texte de bloc-notes gratuit intégré, comme un outil parfait pour le travail. Si votre ordinateur fonctionne sur IOS, un outil d'éditeur de texte par défaut comme l'éditeur de texte est également excellent . Il est important de se rappeler que toutes vos annotations doivent être effectuées sur un fichier texte brut. L' utilisation de mots et de balises n'utilise pas d'applications de traitement de texte avec texte formaté , car cela n'est pas compatible avec les moteurs TI ts et entraînera des erreurs. Un autre point important à garder à l'esprit est que si vous ajoutez des symboles phonétiques à votre fichier texte , vous devrez enregistrer votre fichier texte en utilisant le codage utf 8. Je vais vous montrer comment faire cela dans un tutoriel ultérieur. Le prochain outil que nous recommandons d'utiliser est un outil comme le MacMillan Online Dictionary, car il fournit des prononciations de mots et des orthographes phonétiques que vous pouvez copier et coller dans votre fichier texte. Laissez-moi vous montrer un exemple. Il peut Pekan un autre grand outil en ligne que vous pouvez utiliser pour les noms de téléphone et l'orthographe phonétique, est le I. P. Un type d'outil. Cet outil vous permet de créer une orthographe phonétique de mots à l'aide d'un clavier en ligne en alphabet, que vous pouvez ensuite copier et coller dans votre fichier texte. Voici une brève vidéo de démonstration vous montrant comment fonctionne cet outil. Le prochain outil utile est Google. Traduisez avec Google Translate. Vous pouvez coller du texte dans votre langue, traduit dans une autre langue que copier et coller la traduction dans votre fichier texte vers discours. Voici une brève vidéo de démonstration Carson Ananda Lindgren Un château sinueux Nicotero est si cohérent . CIA. Kathy a référé Conseil Positivo. Elle m'a appelé Cell Koshien. Tous les Selkoe que les fonds secouent. Pourquoi chaque étonnamment, certains photo tournent la récession. Je suis une chaussure à bout de foie. Espoir Un autre excellent outil est un outil de conversion de format de fichier. Il existe de nombreux outils de conversion disponibles. Un que j'aime particulièrement est en ligne Dash convertir dot com, qui vous permet de convertir facilement toutes sortes de fichiers et différents types de formats gratuitement, y compris la conversion MP trois fichiers audio en fichiers wave et vice versa. Voici une brève vidéo de cette interface d'outils. Passons aux outils de conversion de texte à parole . Nous commencerons avec des outils gratuits qui vous permettent de convertir du texte en narrations audio. Google et Amazon fournissent des simulateurs de texte à la parole où les développeurs contestent des scripts et téléchargent des narrations audio, mais l'accès à ceux-ci comme un peu compliqué et nécessitent la mise en place de comptes avec la plate-forme. Les notes jointes à cette leçon fournissent d'autres instructions et tutoriels sur la façon d' accéder à ces simulateurs T TS. Il existe un certain nombre d'outils de texte libre à la parole auxquels vous pouvez accéder en ligne qui vous permettent de créer des fichiers audio à partir de votre texte entré. Nous fournissons une liste de textes gratuits en ligne aux outils vocaux dans les notes qui accompagnent cette leçon. La plupart des outils en ligne gratuits que nous avons testés lors de l'élaboration de ce cours semblent être assez limités et n'acceptent pas les balises de balisage SML. Espérons que, à l'avenir, ces outils s'amélioreront ici est une vidéo de démonstration d'un outil TTS en ligne gratuit que nous avons testé lors de l'élaboration de ce cours. Comment forcer votre tasse E house entraînement votre tasse est sur la consistance, les patients et le renforcement positif. L' objectif est d'inculquer de bonnes habitudes et de construire un amour fait avec votre coupe. Il faut généralement 4 à 6 mois pour qu'un chiot soit entièrement formé à la maison, mais certains chiots peuvent prendre jusqu'à vous un an. En plus des outils auxquels vous pouvez accéder via votre ordinateur de bureau, ordinateur ou ordinateur portable, il y a aussi un certain nombre d'APS vocaux mobiles auxquels vous pouvez accéder via votre téléphone. La plupart des téléphones IOS et Android sont désormais dotés d'une fonctionnalité de texte à voix intégrée. Tout ce que vous devez faire est activé sur votre téléphone. Vous pouvez rechercher du texte à la parole APS sur votre téléphone simplement en allant dans votre boutique APP et en tapant du texte à la parole. Nous fournissons également des liens vers des tutoriels comme celui-ci sur la façon d'activer le texte de votre téléphone à parole dans les notes qui accompagnent cette leçon. Le texte à la parole permet à vous ou à votre enfant de faire lire la taxe numérique à haute voix. Voici à quoi ça ressemble. N' oubliez pas de mettre vos devoirs dans votre sac à dos Si vous prévoyez de créer des narrations audio professionnelles à l'aide de voix IA, nous vous recommandons d'utiliser des outils vocaux payants, car vous aurez accès à un meilleur support et à mises à niveau régulières. Examinons quelques outils que nous vous recommandons d'utiliser pour convertir vos fichiers texte en narrations audio. Il existe deux outils de texte à parole basés sur le cloud que nous utilisons en fonction de la plate-forme TTS dont vous avez besoin pour votre projet de narration vocale Google Wave Net Nous utilisons un outil appelé Wave Net vocalize er pour les voix Amazon Polly. Nous utilisons un outil appelé script vocalize ER. Ces deux outils ont été utilisés pour créer les narrations vocales pour tout ce cours, et ils sont tous les deux développés par la même entreprise. Wave net vocalize ER et script vocalize er er vous permettent de télécharger un fichier texte marqué avec S SML, convertir du texte en audio, traduire le texte dans différentes langues et télécharger des enregistrements audiophiles de haute qualité pour toute une gamme d'utilisations commerciales. Wave net vocalize er sorties fichiers audio au format d'onde et script vocalize er er sorties audio comme MP trois pour plus d'informations et des liens vers où vous pouvez accéder à ces deux outils, reportez-vous aux notes d'accompagnement pour cette leçon. Nous avons maintenant couvert les principaux outils dont vous aurez besoin pour créer des fichiers texte à la parole. Les deux diapositives suivantes fournissent des outils supplémentaires, et la ressource est que vous pouvez envisager d'utiliser, selon vos besoins et ce que vous prévoyez d'utiliser. Texte à la parole pour un excellent outil à utiliser si vous prévoyez d'écrire votre propre contenu pour des narrations audio , car Graham tôt Graham scanne rapidement votre texte et vous aide à corriger les fautes d'orthographe. Améliorez votre grammaire dans votre communication, ce qui peut vous aider à créer et à diffuser un message plus puissant et plus efficace. Comme nous ne pouvons pas encore penser par nous-mêmes , les narrateurs de voix comme moi liront ce que vous tapez. Donc, s'il y a des fautes d'orthographe dans les mots, nous les lirons comme indiqué dans votre texte. Jim, tu peux venir ici, s'il te plaît ? Salut, Jim. Bonjour. Je suis Harvey. Une salle d'informatique craint, alors Wow. Oh, c'est si grossier. Je suis désolé. Je ne peux pas les contrôler. Oui, tu peux. Tu sais, prends Pam pour ça. Pam. Pam, tu as l'air très sexy aujourd'hui. Passe-moi, Harvey. C' est l'ami de Michael. Super. Moi si excitée. Je t'aime longtemps, Tim. Oh, c' est dégueulasse. Suzlon. Tim ! Bon sang. Longtemps moi, lo garçon depuis longtemps. Tu devrais amener Tim long en une journée. J' adorerais Moi. Ouais, ouais. Tu as ruiné une drôle de blague. Vous sortez de mes cinq heures. D' accord. Par Hardy, un autre couple d'outils que vous pouvez envisager d'investir dans, Surtout si vous prévoyez de démarrer une entreprise offrant des services de texte à la parole ou de créer des vidéos avec IA audio. narrations sont des outils comme l'accrocher et ne peuvent pas l'Asie. Ces outils vous permettent non seulement de capturer et d'éditer des vidéos à l'écran avec des narrations audio, mais vous pouvez également utiliser ces outils pour extraire des audios de vidéos postées sur d'autres sites et exporter uniquement la bande sonore de ces vidéos enregistrées. Si vous envisagez d'offrir des services de texte à la parole et de vidéo professionnellement ou simplement de créer des narrations vidéo et audio pour votre propre marketing d'entreprise et promotions, nous fournissons une liste d'outils de création vidéo dans les notes d'accompagnement. Voici, par exemple, une vidéo explicative rapide créée à l'aide d'un logiciel d'animation vidéo appelé Twombly que mon ami George a raconté. Bonjour, je suis George. Je suis une voix générée artificiellement. Narrateur Quelqu'un comme moi peut faire gagner du temps et de l'argent aux entreprises dans des domaines comme le marketing vidéo, qui, tout le monde sait, est l'un des moyens les plus puissants et les plus efficaces de promouvoir des produits et des services en ligne. Atteignez de nouveaux publics dans le monde Établir votre marque, éduquer et informer ou prospects sur votre entreprise et former les clients du personnel et grimpe quelques grandes utilisations pour une voix I. narrations incluent des vidéos de vente, expliquent leurs vidéos, vidéos de formation, annonces vidéo, des présentations vidéo, des podcasts, des livres parlés, pages Web pour visuellement utilisateurs avec facultés affaiblies et tant d'autres utilisations. Une fois que vous savez comment convertir du texte en discours, vous pouvez créer des vidéos avec des narrations audio comme celle-ci rapidement et facilement en utilisant des outils très peu coûteux. Merci de regarder cette vidéo et passer une merveilleuse journée. Donc, en résumé, les outils que nous avons abordés dans cette leçon vous aideront à économiser du temps et de l'argent, créant des fichiers de texte à la parole, le texte libre, conversion phonétique et les outils de traduction que je vous ai montrés vous aideront gagner du temps en créant vos fichiers texte. Je recommande de choisir des outils comme Wave net vocalize ER et script vocalize ER pour convertir vos fichiers texte en audio de haute qualité est d'utiliser Google texte à la parole dans Amazon Polly voix. Et si vous prévoyez d'utiliser vos compétences de texte à la parole dans un environnement commercial, soit en fournissant des services professionnels de l'air en utilisant ces pour améliorer votre propre entreprise, alors envisagez d'investir dans des outils vidéo et audio pour créer des vidéos ou enregistrer un extrait audio provenant d'autres sources. Cela nous amène à la fin de cette leçon. Encore une fois. Merci d'avoir écouté, et je vous verrai dans la prochaine leçon. 7. 06 - Tutoriels de Markup le texte à la parole: Bonjour et bienvenue. Cette section du cours comprend un certain nombre de tutoriels qui vous montreront comment marquer votre texte dans des fichiers vocaux. Cette leçon donne un aperçu des tutoriels que nous avons inclus. Une vidéo séparée. Pour plus de détails, je vais vous montrer quel SML. Les balises de balisage peuvent être utilisées avec Google T TS ou Amazon Polly, et nous vous fournissons également des feuilles de triche S M l. Dans les didacticiels fournis dans cette section, vous apprendrez comment marquer votre texte dans des fichiers vocaux pour faire des choses comme Ed met en pause et casse deux paragraphes et phrases à différents niveaux d'accent. Deux mots contrôlent la façon dont des types particuliers de mots sont prononcés, tels que les numéros de téléphone, les dates, heure, unités de mesure, les fractions et les nombres cardinaux et orginaux. Vous apprendrez aussi à censurer les mots. Contrôlez le processus des éléments de la parole comme le volume de la hauteur et la fréquence de parole. Utilisez la prononciation phonétique avec certains mots, prononcez des acronymes et des abréviations et intégrez des fichiers audio dans vos scripts. Nous couvrons également des balises de balisage SML supplémentaires qui vous permettent d'ajouter souffle deux mots parlent doucement ou chuchoté contrôler le bois des voix sélectionnées ajouter la compression de plage dynamique et plus encore. Pour simplifier les choses, nous nous concentrerons uniquement sur le marquage des fichiers texte sur discours pour Google texte à vocale et les moteurs Amazon Polly, comme mentionné dans une leçon précédente. Différents moteurs de texte à parole peuvent ne pas prendre en charge ou vous permettre d'utiliser un gâchis. balisage SML. Ainsi, au fur et à mesure des tutoriels, nous vous indiquerons quelle plate-forme prend en charge les balises utilisées dans les exemples. Chaque tutoriel suivra un format similaire. La balise sera répertoriée dans l'en-tête de la diapositive, suivie d'un exemple montrant comment utiliser la balise de balisage SS ML et comment le texte se synthétise en discours après avoir été traité avec un exemple audio. Les symboles en haut à droite de la diapositive indiqueront alors si la balise de balisage affichée fonctionne dans le moteur TTs de Google Amazon, Polly ou les deux inclus dans les notes d'accompagnement. Pour ce module de formation, vous trouverez des feuilles de triche pour Amazon Polly et le moteur de texte à la parole de Google. Cela nous amène à la fin de cette leçon. Veuillez compléter les didacticiels de balisage SS ml dans cette section avant de passer au module de formation suivant. Merci d'avoir écouté et de regarder cette vidéo 8. 07 - Tag de la parole à la parole: Bonjour et bienvenue. Dans ce didacticiel, vous allez apprendre à utiliser la balise de balisage SML speak dans vos fichiers texte à vocale. La balise speak est l'élément racine de tous les SML s. Le texte doit être inclus dans une paire de balises vocales pour être converti en discours à une balise de parole d'ouverture au début de votre texte à une balise de parole de clôture jusqu'à la fin de votre fichier texte. Voici un exemple d'utilisation de la balise speak dans votre fichier texte. Notez que tout le contenu que vous souhaitez convertir en discours est inclus dans l'ouverture et la fermeture. Étiquettes de parole. Laissez-moi vous jouer un exemple audio de la façon dont ce texte sonnera après avoir été traité par un moteur de texte à parole qui peut lire les mots SML sont singulièrement la force la plus puissante disponible pour l'humanité. Nous pouvons choisir d'utiliser cette force de manière constructive avec des paroles d'encouragement ou de désespoir de manière destructive . Les mots ont de l'énergie et du pouvoir avec la capacité d'aider, de guérir, d'entraver les orteils blessés, nuire à humilier et trop humble. Cela nous amène à la fin de ce tutoriel. Veuillez consulter les notes d'accompagnement dans cette section pour plus d'informations. 9. 08 - Tag de brede le texte à la parole: Bonjour et bienvenue. Dans ce tutoriel, vous apprendrez à ajouter des pauses, des mots d' orteils, phrases et des paragraphes dans votre texte à des fichiers vocaux. En utilisant la balise de rupture, nous allons examiner l'utilisation de la balise de rupture, et ce sont les attributs de temps et de force facultatifs avant d'explorer la balise de rupture plus en détail. Rafraîchissons notre mémoire avec la définition de Prasit e Prasit. Il se réfère à des domaines du langage comme le rythme de l'air, le stress et l'intonation de la parole, et comment ces caractéristiques contribuent au sens. Prasad IQ, fait donc référence à des aspects de Prasit E, que nous allons couvrir dans un autre tutoriel la balise break comme un élément vide, ce qui signifie qu'il ne produit pas de son. Il contrôle la pause ou d'autres limites de QI prasad entre les mots. Notez que l'utilisation de balises de rupture est complètement facultative. Si cet élément n'est pas présent entre les mots, la pause sera automatiquement déterminée en fonction de la façon dont le moteur texte à parole traite le contexte linguistique. En d'autres termes, même si vous n'avez pas de balises de rupture, un moteur T. T s sera naturellement à une pause. Après avoir trouvé certaines caractéristiques grammaticales telles que la ponctuation dans votre texte, telles que les points et les virgules, une balise de pause vous permet d'affiner l'espacement des pauses et des pauses entre les mots, phrases et les paragraphes. Si vous aviez une balise de rupture après une phrase de mot ou un paragraphe, un saut sera inséré avec une force de QI Prasad supérieure à si aucun élément de rupture n'est fourni. En d'autres termes, le moteur texte à la parole déterminera le contexte linguistique de votre texte et augmentera la pause naturelle s'il détecte une balise de rupture dans votre contenu. Donc, alors qu'une phrase sans balises de pause aura des pauses naturelles, les ajoutées , balises ajoutées,ajoutées, cassées peuvent étendre ces pauses et créer une sensation plus réaliste à votre narration. Comme nous le verrons dans un instant. Écoutons un exemple de fichier texte converti en discours sans utiliser de balises de rupture . Les mots ont de l'énergie et du pouvoir avec la capacité d' aider, de guérir, de gêner, blesser les orteils, de nuire, d'humilier et trop humble. Maintenant, écoutons le même fichier texte converti en discours avec des balises de rupture. Les mots ajoutés ont de l'énergie et du pouvoir avec la capacité d' aider, de guérir, entraver, blesser, orteils, de nuire, d'humilier et trop humble. As-tu pu entendre la différence ? Rejouons les deux fichiers audio un après. Les autres mots ont l'énergie et le pouvoir avec la capacité d'aider à guérir, à entraver, orteil blessé orteil, mal à humilier et trop humbles mots ont de l'énergie et de la puissance avec la capacité d' aider, de guérir, gêner, blesser, orteil , mal, humilier et trop humble. Comme mentionné précédemment, la balise break vous permet également d'utiliser des attributs facultatifs tels que le temps et la force. utilisation d'une balise de pause avec les attributs de temps vous permet de trouver le réglage de vos narrations en définissant la durée de votre pause ou pause à l'aide de secondes ou de millisecondes. Par exemple, trois secondes ou 200 millisecondes. Écoutez un exemple de fichier texte converti en discours avec des balises de pause basées sur le temps ajoutées. Arrêtons la phrase pendant 200 millisecondes de 500 millisecondes, puis une seconde, puis trois secondes, et enfin, et enfin, nous allons la mettre en pause pendant quatre heures. Je comprends juste que je pense que vous avez l'idée maintenant sur la façon dont les pauses et les pauses fonctionnent dans votre texte à la parole innovations. Si vous utilisez Amazon Polly pour convertir vos fichiers texte en discours, veuillez noter que la durée maximale que vous pouvez spécifier dans la balise de pause est de 10 secondes ou 10 000 millisecondes. Voici un exemple de fichier texte marqué à l'aide de la balise de rupture avec différents attributs de temps . Écoutez la narration vocale synthétisée de ce texte. Les mots sont singulièrement la force la plus puissante à la disposition de l'humanité. Nous pouvons choisir d'utiliser cette force de façon constructive avec des paroles d'encouragement ou avec des mots de désespoir de manière destructive . Les mots ont de l'énergie et du pouvoir avec la capacité d' aider, de guérir, d'entraver, blesser, orteils, de nuire, d'humilier et trop humble. utilisation d'une balise de pause avec les attributs de force vous permet également de trouver Régler vos narrations en définissant la durée de vos pauses ou pauses à l'aide de valeurs relatives telles que semaine moyenne extra forte et forte une semaine supplémentaire. En outre, vous pouvez utiliser la valeur none pour empêcher une pause ou une pause de QI prasad que votre processeur de texte à parole produirait et insérerait dans votre narration. Veuillez noter que si vous utilisez Amazon Polly pour convertir votre texte en force vocale, les valeurs attributaires correspondent à l'équivalent de Sina à une pause après une phrase virgule ou un paragraphe spécifiant aucun ne crée aucune pause. N' utilisez aucun pour supprimer. Une pause normale, telle que les pauses insérées après une période spécifiant une semaine supplémentaire, a la même force que none. Cela n'a pas de pause spécifiant la semaine définit une pause de la même durée que la pause après un milieu de virgule ait la même force que les ensembles forts faibles, une pause de la même durée que la pause créée après une phrase et spécifiant ensembles forts, une pause de la même durée que la pause créée après un paragraphe. En outre, si vous n'utilisez pas d'attributs avec la balise de frein lors du traitement du texte en langage vocal avec Amazon Polly, les résultats sont très dépendants de votre texte. S' il n'y a pas d'autre ponctuation à côté de l'étiquette de frein, cela crée une force de rupture de valeur moyenne, qui est l'équivalent d'une pause de longueur virgule. Si la balise est à côté d'une virgule, elle met à niveau la balise en une balise de rupture forte, ce qui équivaut à une pause de longueur de phrase. Si la balise est située à côté d'un point, elle met à niveau la balise en une balise de rupture extra forte ou l'équivalent d'une pause de longueur de paragraphe . Voici un exemple de fichier texte marqué à l'aide de la balise de rupture avec différents attributs de force . Écoutez la narration vocale synthétisée de ce texte. Créons des pauses dans cette phrase en utilisant des balises de rupture avec l'option de force. Commençons par une pause très forte. Puis une pause forte suivie d'une pause moyenne une semaine de pause supplémentaire et enfin une pause entre les voyelles A e I oh, vous et aucune pause du tout entre les voyelles A e i o u. comme vous pouvez le voir, la balise break permet vous spécifiez des durées exactes de pause entre les mots, phrases et les paragraphes et pouvez être utilisé pour améliorer l'aspect réaliste de vos narrations vocales . Cela nous amène à la fin de ce tutoriel. J' espère que vous avez trouvé cette leçon utile. Veuillez vous reporter aux notes d'accompagnement dans cette section pour plus d'informations et vous remercier de votre écoute. 10. 09 - Tag de l'alinéa du texte à la parole: bonjour et bienvenue. Dans ce didacticiel, vous apprendrez à ajouter des pauses entre les phrases et les paragraphes à l'aide de balises de balises de paragraphe et de phrase. Dans un tutoriel précédent, nous avons expliqué comment utiliser les balises de saut pour ajouter des pauses, des mots d' orteils, des phrases et des paragraphes que vous pouvez voir dans ce tableau. C' est, um, um, break Elements remplissent la même fonction que l'utilisation d'une balise de phrase ou de paragraphe. Ainsi, en plus d'utiliser des balises de saut, vous pouvez ajouter une pause entre les paragraphes de votre texte à l'aide de la balise P. Cela équivaut à spécifier une pause en utilisant une balise de rupture extra forte. La balise P fournit une pause plus longue. Les locuteurs natifs se placent généralement à la virgule ou à la fin d'une phrase. Pour utiliser des balises P, vous devez joindre le paragraphe en ajoutant une balise d'ouverture au début du paragraphe et une balise de fermeture à la fin, comme illustré dans l'exemple ci-dessous. C' est le premier paragraphe. Il devrait y avoir une pause après que ce texte soit prononcé. C' est le deuxième paragraphe. Voici un exemple de fichier texte converti en discours à l'aide de balises de saut de paragraphe. Les mots sont singulièrement la force la plus puissante à la disposition de l'humanité. Nous pouvons choisir d'utiliser cette force de façon constructive avec des paroles d'encouragement ou avec des mots de désespoir de manière destructive . Les mots ont de l'énergie et de la puissance avec la capacité d'aider à guérir, à entraver, orteil mal mal aux orteils à humilier et trop humble. Notez que les balises P peuvent inclure du texte à afficher dans les éléments SS ML affichés dans cette liste. Vous pouvez également ajouter des pauses entre les phrases dans votre texte à l'aide de la balise S. Cela équivaut à mettre fin à une phrase par un point ou à spécifier une pause. L' utilisation d'une étiquette de rupture forte est utile pour ajouter des pauses au versus et des lignes de poésie . Comme vous le verrez dans un instant pour utiliser les balises s, vous devez joindre la phrase avec des balises d'ouverture et de fermeture comme indiqué dans l'exemple ci-dessous. Mary avait un petit agneau dont la toison était blanche comme la neige. Et partout où Mary est allée, l'agneau était il y a peu. Tout comme les balises P, balises s peuvent inclure du texte à afficher dans les éléments SS ML affichés dans cette liste. Pour conclure ce tutoriel, je veux vous jouer une histoire bien connue des enfants qui a été marquée à l'aide de balises de paragraphe de rupture et de phrase. Fox en chaussettes par Dr Seuss Fox Socks Box Knox en Bucks Fox en chaussettes. Frappe sur le renard dans les chaussettes, Inbox chaussettes sur les coups et les coups dans Bucks Fox dans les chaussettes sur la boîte sur Knox. Les poussins avec des briques viennent des poussins avec des blocs viennent des poussins avec des briques et des blocs et des horloges. Viens, regarde. Ecoutez, M. Knox, faisons des tours avec des briques et des blocs, monsieur, faisons des tours avec des nanas et des horloges. D' abord, je vais faire un tour rapide pile de briques. Ensuite, je vais faire une pile de bloc de truc rapide. Vous pouvez faire une pile de poussin truc rapide. Vous pouvez faire une pile d'horloge tour rapide, et voici un nouveau truc. M. Knocks Chaussettes sur les poussins et les poussins sur Fox sur les horloges sur les briques et les blocs, Briques et blocs sur les coups sur la boîte. Maintenant, nous en venons aux ticks et aux pourparlers. Essayez de le dire, M. Knox, monsieur. Horloges sur les horloges de tiques de renard sur le stock six. Bâton de bric malade. 66 poussins Parlez, s'il vous plaît, monsieur. Je n'aime pas ce truc, monsieur. Ma langue n'est pas rapide, monsieur. Je comprends Bien que les bâtons et les horloges mélangés avec les poussins et parle moi-même, je ne peux pas le faire. M. Fox, je suis désolé, M. Lock. Monsieur. Voici un jeu facile à jouer. Voici une chose facile à dire. Nouvelles chaussettes à chaussettes Qui craint ? Chaussettes Sue. Qui ? SOS. A qui les chaussettes ? Chaussettes Suso Sue. Qui voit qui. Alors, qui sont les nouvelles chaussettes ? Monsieur ? Tu vois, Suso poursuit de nouvelles chaussettes. Ce n'est pas facile, M. Fox . Qui vient ? Le corbeau arrive lentement. Joe Crow vient qui ? Sos Corbeaux Vêtements Sue SOS corbeaux Vêtements lent Joe Crow SOS Dont les vêtements coudre les vêtements Suso chaussettes de renard dans les chaussettes Maintenant lent Joe Crow SOS frappe Boîte de réception Maintenant Sue SOS Rose sur lent Joe Crows Vêtements Fox SOS tuyau sur le lent Joe Crows sait tuyau va rose pousse sait tuyau va, hum corbeaux Rose. Brut. M. Fox, je déteste ce jeu, monsieur. M. Fox, je déteste ce jeu, Ce jeu rend ma langue tout à fait boiteuse, monsieur. M. Knox, monsieur. Quelle honte, monsieur. Nous trouverons quelque chose de nouveau à faire. Maintenant, il y a beaucoup de nouveau bleu goo maintenant. Nouveau goo bleu goo gooey, gooey bleu goo, nouveau goo, Louie ! Louie ! Louie a grandi pour la mastication moelleuse. C' est ce que fait cette oie. Vous choisissez d'aller voir monsieur ? Si oui, vous avez dit qu'elle mâchait, monsieur, avec l'oie. Trop triste, mec. Monsieur. M. Fox. Monsieur. Je ne le ferai pas. Je ne peux pas le dire. Je ne le mâcherai pas très bien, monsieur. Marchez de cette façon. On trouvera un autre jeu pour lui jouer. Puis vient été. Apporte Ben Broom. Ben apporte été balai les poutres de Ben Ben. Broom Been Ben, la chambre de Ben. Bim se tient. Stylos Benj. Le balai plié de Ben se brise dans les pauses de balai. Le groupe de Ben. Le groupe de Kim. Big band, bandes porc, fourgonnettes de plomb Human Ben avec balais, Ben stand bangs et ViMS Band booms Boom band band band bande de porc boom band. Big band Broom band. Ma bouche pleine. Je ne peux pas dire ça. Non, monsieur. Ma pauvre bouche est trop lente, monsieur. Alors, amenez votre bouche par là. Je vais le trouver. Quelque chose qu'il peut dire. Luke, chance aime les lacs, Luke coincé aime les lacs, Luke Le clics lacs Luke coincé clics lacs, canard prend les lacs Lixian. Luke, Luck aime bien Luke. La chance prend les jambes dans le lac Stuck comme je ne peux pas aimer un tel blubber flipper. Ma langue n'est pas faite de caoutchouc, M. Knox. Maintenant, venez maintenant. Viens maintenant. Tu n'as pas à être si bête maintenant. Essayez de le dire, M. Knox, s'il vous plaît. À travers trois fromagers, trois puces libres ont volé tandis que ces s'il vous plaît grippe brise glaciale soufflé brise glaciale fait trois arbres. Les arbres ont fait les arbres Fromage Freeze ! C' est ce qui a fait ces trois fuir gratuitement éternuer Arrêtez ! Arrêtez ! Ça suffit ! Monsieur, je ne peux pas dire des trucs aussi stupides, monsieur. Très bien, alors, M. Knox. Parlons un peu des Beatles de Tweedle Que savez-vous des Beatles de Tweedle ? Eh bien, quand les Tweedle Beetles se battent, ça s'appelle un tweet Will Beetle battle ? Et quand ils se battent dans une flaque d'eau, c'est un tweet Will scarabée bataille de flaques d'eau ? Et quand Tweedle Beatles se battent avec des pagaies dans une flaque d'eau, ils appellent ça un tweet. Will scarabée paddle bataille Et quand Beatles bataille coléoptères dans une flaque de pagaie dans la flaque de bataille Beetle est une flaque d'eau dans une bouteille. Ils appellent cela un tweet ou un coléoptère Buttle, une médaille de bataille de pagaie de flaques d'eau. Et quand les coléoptères combattent ces batailles dans une bouteille avec leurs pagaies dans les bouteilles sur un caniche dans les caniches mangeant des nouilles, ils appellent ça une boue. Puddle tweet Will caniche coléoptle nouille bouteille paddle bataille. Et maintenant, attendez une minute, M. Socks Fox. Quand un renard est dans la bouteille, où les Beatles Tweedle se battent avec leurs pagaies dans une flaque d'eau sur un nouveau caniche supprimant, c'est ce qu'ils appellent un tweet Will Beetle nouille, bouteille de caniche câliné. La boue a doublé. Enroulé, bourré . Renard en chaussettes, monsieur. Renard en chaussettes. Notre jeu est terminé, monsieur. Merci pour beaucoup de plaisir, monsieur. Cela nous amène à la fin de ce tutoriel. J' espère que vous avez trouvé cette leçon utile. Veuillez vous reporter aux notes d'accompagnement dans cette section pour plus d'informations et vous remercier de votre écoute. 11. 10 - SayAs de la parole: Bonjour et bienvenue. Dans ce tutoriel, vous allez apprendre à utiliser les balises SS ML pour interpréter comment le texte doit être parlé pour des caractères spéciaux , certains types de mots et différents types de nombres. L' élément dire en tant qu'élément vous permet de spécifier comment certains caractères, mots et nombres dans votre fichier texte à discours doivent être prononcés. Une balise SE en tant que requiert l'utilisation de l'interpret en tant qu'attributs, qui détermine ce qui est en cours de traitement. Des attributs facultatifs tels que le format et le détail peuvent également être utilisés, en fonction des éléments sélectionnés. Permettez-moi d'expliquer ce que cela signifie lorsque vous marquez un texte en utilisant un mot à dire comme élément. Vous devez toujours inclure l'interprétation en tant qu'attributs dans la balise d'ouverture, en spécifiant comment vos caractères spéciaux, mots et nombres doivent être prononcés. Par exemple, si vous marquez des nombres, le nombre représente-t-il une date ou une heure ? C' est un numéro de téléphone ? Est-ce le numéro 10 ou le 10e objet d'affilée ? S' agit-il d'une fraction ou d'une unité de mesure ? Nous allons voir comment marquer chacune de ces valeurs plus en détail dans ce tutoriel, aussi, aussi, fonction de la valeur balisée, vous devrez peut-être spécifier des attributs supplémentaires comme le format et le détail, en particulier pour comme la date et l'heure, qui peuvent être parlées de plusieurs manières différentes. L' élément dire en tant qu'élément vous permet de spécifier la façon dont vous souhaitez que votre texte soit parlé pour les éléments suivants . Numéros cardinaux Ceci interprète le texte numérique comme un nombre cardinal, tel que 5 400 ou 1234 nombres orginaux. Ceci interprète le nouveau texte miracle comme un nombre d'origine, tel que les 5ème 400 ou 1234ème caractères. Utilisez cette valeur pour épeler chaque lettre de votre texte, telle que les fractions ABC. Ceci interprète le texte numérique comme une fraction. Utilisez cette valeur pour les fractions communes, telles que 3/20 et les fractions mixtes, telles que 2,5 expletives. Utilisez cette valeur pour BEEP ou censurer le contenu ou les mots de la balise. À l'aide d'une unité de son. Cela interprète en texte numérique comme une mesure, comme 1/2 pouce 12 onces, cinq pieds un mètre ou 200 millisecondes verbatim ou orthographier. Cette valeur est similaire à l'utilisation de caractères et épelle des mots. Les dates lettre par lettre utilisent cette valeur pour des dates telles que l'heure du 29 janvier 1993. Utilisez cette valeur pour le temps, par exemple 5 48 PM Les numéros de téléphone utilisent cette valeur pour indiquer que le texte est un numéro de téléphone . En plus des valeurs ci-dessus, Amazon Polly vous permet également d'utiliser des valeurs telles que des chiffres, qui vous permettent d'épeler chaque chiffre de votre texte individuellement, comme 1234 etcetera et d'interpréter le texte comme faisant partie des adresses de rue. Une autre valeur que nous allons examiner dans ce tutoriel est d'utiliser des interjections dans vos narrations, qui peuvent ajouter un élément amusant à votre texte aux fichiers vocaux. Commençons par des nombres cardinaux. Les nombres cardinaux air juste des nombres comme 5 400 ou 1234. La structure de marquage du texte pour interpréter correctement les nombres cardinaux est illustrée ci-dessous. Notez que la langue que vous sélectionnez affecte la façon dont les nombres cardinaux sont parlés. Par exemple, écoutez comment une voix anglaise américaine dans une voix anglaise britannique prononce les chiffres ci-dessous. Le prix de cet article a 12 345$. Le prix de cet article est de 12 345$. Comme vous pouvez entendre une voix anglaise américaine dit le nombre. 12 345. Où une voix anglaise britannique dit 12,345 Écoutez à nouveau les deux voix. Le prix de cet article a 12 345$. Le prix de cet article est de 12 345$. Dans certains cas, votre moteur de texte à la parole reconnaîtra les nombres cardinaux sans avoir besoin d'utiliser des balises de balisage . En outre, certains moteurs de texte à parole reconnaissent le nombre de valeur au lieu de cardinal dans l'interprétation . En tant qu'attributs, écoutez un enregistrement de parole synthétisé d'un fichier texte marqué pour l'interprétation des nombres cardinaux . La hauteur du mont Everest est de 8848 mètres, soit 29 029 pieds. Le prix de cet article a $12,345 le loyer moyen dans cette zone comme $2500 par mois. Les numéros d'origine sont des nombres comme le 1er 2e 3e 5e 13e 401234e etcetera. La structure de marquage du texte pour interpréter correctement les nombres d'origine est illustrée ci-dessous comme des nombres cardinaux, la langue que vous sélectionnez les effets. façon dont les numéros d'origine sont parlés, par exemple, écoutent comment une voix anglaise américaine dans une voix anglaise britannique prononce les chiffres ci-dessous. Aujourd'hui, c'est le 350e anniversaire de la révolution. Aujourd'hui est le 350e anniversaire de la révolution, comme vous pouvez entendre une voix anglaise américaine dit le numéro 350e où une voix anglaise britannique dit 350e. Écoutez à nouveau les deux voix. Aujourd'hui, c'est le 350e anniversaire de la révolution. Aujourd'hui, c'est le 350e anniversaire de la révolution. Certains moteurs de texte à parole peuvent reconnaître les nombres d'origine. Écrit une 2ème 3ème 17ème etcetera sans avoir besoin d'utiliser des balises de balisage. Amazon Polly peut également interpréter les nombres originaux écrits comme des chiffres romains. En cas de doute, vous pouvez simplement écrire le numéro, mais ce n'est pas nécessaire. Si vous utilisez correctement la balise de balisage d'origine, écoutez le discours synthétisé du texte ci-dessous, qui est écrit sous la forme d'un numéro d'origine sans balises de marquage. La deuxième fois qu'elle est venue à la bibliothèque, elle est sortie avec une copie de la troisième édition des Livres avant de courir jusqu'au 17e étage. Je ne sais pas si c'était sa première fois ou ses 100 visites à la bibliothèque. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour l'interprétation des nombres d'origine . Kevin est arrivé premier au marathon annuel du bureau. Dwight est arrivé dans une seconde proche. Creed Troisième, Pam a battu son meilleur personnel en étant la septième à terminer la ligne de passage. Stanley est arrivé neuvième et Michael a terminé dernier à la 29e place. Voici une autre variante du texte marqué pour les nombres d'origine. Écoutez le discours synthétisé du texte ci-dessous. Marqué pour Amazon Polly James Charles Stewart était à la fois roi d'Écosse comme James, le sixième et roi d'Angleterre, et l'Irlande a James, le premier de l'année 1603 jusqu'à sa mort en 16 25. L' élément de caractères vous permet d'épeler des mots et des nombres dans vos narrations. La structure de marquage du texte pour interpréter correctement les caractères est illustrée ci-dessous. Certains moteurs de texte à parole peuvent reconnaître et prononcer des abréviations comme Triple A et orthographier des mots abrégés sans ajouter de balises de balisage au texte comme CIA, FBI , KGB , BBC , etc. Les ravisseurs étaient maintenant le véhicule a fui la scène dans cette direction. Tes yeux sont à l'envers. C' est allé dans l'autre sens. Mets un bouchon. Comment épelez-vous le FBI ? Pleure ? Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour l'interprétation des caractères. Qui est W H O ou. 812 a été le titre de l'album studio Van Halen zeht Su Are nous allons prendre le chien pour un W A. L K avant qu'il ne commence à pleuvoir en utilisant les éléments verbatim ou orthographier remplit la même fonction d'orthographe des mots et des nombres que l'utilisation de caractères. La structure de marquage du texte pour interpréter correctement ces éléments est illustrée ci-dessous. Écoutez un enregistrement de parole synthétisé d'un fichier texte marqué pour interpréter caractères verbatim et épeler des éléments Tout ce que je nous demande pour un peu r e s p e c t. Découvrez ce que cela signifie pour moi r E S p e C T Prenez soin TCB vous juste un peu quand vous rendez à la maison R E s P E C T retour un autre élément que vous pouvez utiliser dans votre texte à la parole. Mark Ups a appelé Digits. chiffres remplissent une fonction similaire que l'orthographe et les caractères verbatim, mais il ne fonctionne qu'avec des nombres, pas des mots. La structure de marquage du texte pour interpréter correctement les chiffres est illustrée ci-dessous en utilisant la balise de chiffres avec Google. TTS fonctionne avec des nombres. Mais si vous essayez de traiter les mots, vous obtiendrez une erreur et aucun son ne sera lu en utilisant des chiffres avec Amazon. Polly fonctionne avec des nombres, mais n'épelle pas de mots. Au lieu de cela, il dit juste le mot. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour interpréter des nombres et des mots à l'aide des chiffres et des attributs orthographiés. Veuillez noter ce numéro de sécurité 12345 Veuillez noter ce numéro de sécurité 12345 Veuillez noter ce mot de sécurité Self love. Veuillez noter ce mot de sécurité s espace NSI L O V e. Un autre élément utile pour marquer les fractions textiles numériques. Cela fonctionne à la fois pour les fractions communes telles que 3/20 et les fractions mixtes telles que 2.5. La structure de marquage du texte pour interpréter correctement les fractions est illustrée ci-dessous. Certains moteurs de texte à parole peuvent interpréter des fractions dans vos fichiers texte comme les 9ème 2 et 3/4 etcetera sans utiliser de balises de balisage pour Amazon Polly pour interpréter des nombres mixtes comme fractions. Un symbole plus doit être ajouté entre les chiffres du texte marqué, tel que trois plus 1/2 Amazon. Polly ne supporte pas un nombre mixte sans le symbole plus. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour interpréter des fractions. Près des 2/5 des États-Unis Les adultes de 20 ans et plus souffrent d'obésité. Savez-vous comment diviser six par 3,5 sans utiliser de calculatrice ou demander à Google ? Nous savons tous que diviser 22 par sept ou trois et 1/7 est une bonne approximation de la tarte, mais 355 divisé par 113 ou trois et 16 113e saison encore plus proche de la valeur réelle de la tarte. L' élément exploitif vous permet de créer l'effet de censure des mots dans votre narration. En utilisant un son, la structure de marquage du texte pour interpréter correctement les expletifs est illustrée ci-dessous. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour l'interprétation des expletifs. Alors je lui dis, j'ai fait ce que tu veux dire et il me dit, il m' a fait que je peux où je veux. Donc je lui dis que si c'est le cas, alors tu ferais mieux avant que je souffle et c'est exactement ce qui s'est passé. Officier, je jure que l'élément Unités vous permet d'interpréter le texte numérique comme une mesure pour Amazon Polly. La valeur de votre texte doit être un nombre ou une fraction, suivie d'une unité de mesure sans espace entre les deux, exemple en 1/2 pouce ou juste l'unité comme dans un mètre. La structure de marquage du texte pour interpréter correctement les unités est illustrée ci-dessous. Certains moteurs de texte à parole peuvent reconnaître et interpréter des unités sans avoir besoin d'utiliser balisage dans votre texte. Par exemple, 10 millisecondes 100 kilomètres cinq degrés Celsius, 350 millilitres, 75 mètres etcetera. De plus, certains moteurs de texte à parole peuvent convertir automatiquement des unités de mesure en leur forme singulière ou plurielle, en fonction du nombre. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour les unités d'interprétation. Les chemins à la plage ce matin ont dû faire 10 pieds de haut. En moyenne, la vitesse d'un I clignotant ne dure que 1/10 de seconde ou 100 millisecondes. La dose d'urgence d'adrénaline pour raviver quelqu'un qui a subi un choc anaphylactique est 0,1 milligrammes par kilogramme d'un milligramme par millilitres illusion à une dose maximale de 0,5 milligrammes chez un adulte et 0,3 milligrammes chez un enfant. Lors de la construction d'une terrasse pour votre patio, établissez les espacements des porteurs à un minimum de 1800 millimètres de centre avec des trous de souche d'au plus 1500 millimètres de distance. L' élément de date vous permet d'interpréter les dates dans différents formats, a parlé texte à la fois Google texte à la parole et Amazon Polly interpréter les dates en utilisant des structures de balisage légèrement différentes. Donc, passons par chacun de ces séparément, commençant par Google TTS, la structure pour marquer le texte pour interpréter correctement les dates en utilisant le texte Google à la parole est illustrée ci-dessous. Notez que la balise de date contient l'interprétation requise en tant qu'élément, plus deux attributs supplémentaires format en détail. Une autre chose à noter est que les dates utilisées dans le champ de texte peuvent être séparées par ponctuation tels que des traits d'union, espaces et même des espaces connus, comme indiqué dans l'exemple ci-dessous. Parlons de l'attribut de format des dates. Élément les attributs de format utilise les caractères pourquoi M et D pour l'année, mois et le jour du mois, respectivement. Comme nous le verrons dans un instant, vous pouvez utiliser différentes combinaisons de ces trois caractères dans le champ de format. Il y a cependant quelques règles à suivre. Si l'élément de format inclut le caractère, pourquoi  ? Le champ de texte de date doit inclure une année, par exemple l'année 1965. Si l'élément de format comprend le caractère M, le champ de texte de date doit inclure un mois. Par exemple, mars , septembre, décembre, etc. Si l'élément de format comprend le caractère D , le champ de texte de la date doit inclure le jour du mois, exemple le 7e 24e ou 31e du mois. De plus, si le caractère pourquoi est inclus dans le format, les attributs que l'année doivent être écrits comme un nombre à quatre chiffres, donc juste l'année est 1978 pas seulement 78. Si le caractère D est inclus dans les attributs de format sous la forme d'un seul chiffre, vous pouvez utiliser un seul chiffre pour les jours comme le cinquième du mois. Si le format contient deux D, puis utiliser des nombres à deux chiffres pour les jours comme un 05 La même chose s'applique aux mois. Si les caractères AMA inclus dans les attributs de format comme un seul chiffre, vous pouvez utiliser un seul chiffre comme neuf pour le mois de septembre ou quatre pour avril. Si le format utilise des chiffres de mois doubles, assurez-vous que tous les chiffres de mois affichent des chiffres doubles comme 04 pour avril 09 pour septembre , etc. Ensuite, nous avons les attributs de détail que les attributs de détail contrôlent la forme orale de la date. Vous avez deux options ? Option 1 et Option 2 ? Parlons d'abord de l'option 1. Si l'option de détail est égale à un sur Lee, les champs de jour et un champ de mois ou d'année sont requis . Bien que les deux champs puissent être fournis Option un comme structure par défaut pour l'interprétation des dates lorsque moins que les trois champs sont donnés dans l'élément de format. En règle générale, vous n'aurez pas besoin d'ajouter le détail un élément à la balise de balisage. S' il s'agit de la structure par défaut pour l'interprétation des dates, comme le moteur texte à la parole doit automatiquement passer à ce format, la forme orale de l'Option 1 comme jour d'origine du mois et de l'année, donc dans les exemples ci-dessous la forme parlée du texte serait le 19 mai 1991 pour le premier exemple et le second mars. Dans le deuxième exemple, si l'option de détail est égale aux champs de jour, de mois et d'année, l'option deux est requise comme structure par défaut pour l'interprétation des dates lorsque les trois champs sont fournis dans l'élément de format. En règle générale, vous n'aurez pas besoin d'ajouter le détail à l'élément à la balise de balisage. S' il s'agit de la structure par défaut pour l'interprétation des dates, comme le moteur texte à la parole doit automatiquement passer à ce format, la forme orale de option deux comme mois jour et année d'origine. Ainsi, dans les exemples ci-dessous, la forme parlée du texte serait le 15 janvier 1929. Pour le premier exemple, le 14 mars 1879 pour le deuxième exemple et le 5 septembre 1946 pour le dernier exemple. Avant de parler de marquage du texte pour l'interprétation des dates à l'aide d'Amazon Polly, écoutons quelques exemples parlés de texte balisé en utilisant les formats que nous venons de discuter . Écoutez d'abord un enregistrement de synthèse vocale d'un fichier texte marqué à l'aide de dates différentes , options de base. Je suis né le 16 novembre 1968. Ma sœur est née le 22 juin 1971. Mon frère est né le 10 février 1974. Maintenant, écoutez un enregistrement de synthèse vocale d'un fichier texte marqué à l'aide d'un format de date différent dans les valeurs détaillées. Ma famille et moi avons migré dans ce pays. Nous sommes arrivés ici le 26 juin 1952. J' ai un autre rendez-vous avec Chiropractor le 9 septembre. Albert Einstein a remporté le prix Nobel de physique le 9 novembre 1922 pour ses services à la physique théorique et pour sa découverte de la loi de la photo effet électrique. Parlons maintenant du marquage du texte pour l'interprétation des dates à l'aide d'Amazon Polly. La structure de marquage du texte pour interpréter les dates à l'aide d'Amazon Polly est illustrée ci-dessous. Notez que l'élément date contient un format d'attributs supplémentaires. Séparez les éléments de date dans le champ de texte à l'aide de traits d'union, sauf si vous utilisez le format y y y y y y M m d. D. Tous les formats de date répertoriés ici peuvent être utilisés avec Amazon. Polly voici un conseil utile lorsque vous utilisez Amazon Polly pour interpréter les dates. Si vous utilisez le format Y y Y Y Y M M D D, vous pouvez faire en sorte qu'Amazon Polly ignore des parties de la date, en utilisant des points d'interrogation spécifiant les attributs de format dans la balise de balisage n'est pas nécessaire non plus . Par exemple, Amazon Polly affiche les exemples ci-dessous comme suit. Le 22 septembre 1989. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour Amazon Polly en utilisant différents formats de date. Game of Thrones a diffusé son premier épisode sur HBO le 17 avril 2011. Après huit saisons, le dernier épisode de Game of Thrones a été diffusé le 19 mai 2019. Le roi Jean d'Angleterre a signé la Magna Carta le 15 juin 12 15. Saviez-vous que le 4 janvier, sa journée nationale des spaghetti ? Et ce 10 novembre, c'est la Journée nationale des cupcakes à la vanille. Parlez de célébrer les glucides. Beaucoup de gens ont paniqué car ils croient que des événements cataclysmiques se produiraient après décembre 2012, date à laquelle l'ancien calendrier maya a pris fin. Jules César, traversant la rivière Rubicon en janvier 49 av. J.-C., fut l'événement qui précipita la guerre civile romaine . Nous sommes payés chaque mois le 15. Notre anniversaire de mariage est en Août, en 1964 Xerox Corporation a introduit la première version commercialisée du télécopieur moderne . Mais jusqu'à ce que quelqu'un d'autre achète une de leurs machines, il n'y avait personne d'autre à qui envoyer des télécopies. Le 21 juillet 1969, Neil Armstrong devient le premier être humain à marcher à la surface de la lune. Mais Buzz Aldrin a été le premier homme à sauter et à uriner dessus. L' élément temps vous permet d'interpréter le temps dans différents formats a parlé texte texte à la fois Google texte à la parole et Amazon Polly interpréter les valeurs temporelles différemment. Donc, passons par chacun de ces séparément, commençant par Google TTS la structure pour marquer le texte pour interpréter correctement le temps en utilisant le texte Google à la parole est montré ci-dessous noter que l'étiquette temporelle contient l' interprétation requise comme plus deux attributs supplémentaires, le format et le détail. Une autre chose à noter est que les valeurs temporelles utilisées dans le champ de texte peuvent être séparées à l'aide la ponctuation ou des espaces, comme indiqué dans l'exemple ci-dessous. Le format Attributs utilise une séquence de codes de caractères de champ horaire, H. H. M s, Z 12 et 24 pour notre minute de notre deuxième fuseau horaire minute, heure 12 heures et heure 24 heures, respectivement. Le format par défaut est H. M S 12. Si nos minutes ou secondes ne sont pas spécifiées dans le format ou qu'il n'y a pas de chiffres correspondants, le champ est traité comme une valeur nulle. L' heure peut être interprétée comme une heure de la journée, par exemple pour 26 heures ou une durée de temps, comme quatre heures et 20 minutes. L' élément de détail contrôle si la forme orale de l'heure est de 12 heures ou de 24 heures . Vous avez deux options. Option 1 et Option 2, la forme orale comme 24 heures. Si le détail est égal à un ou si le détail est omis, et que le format de l'heure est de 24 heures, la parole est de 12 heures. Si le détail est égal à deux, ou si le détail est omis et que le format de l'heure est de 12 heures, écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour Google Text à la parole en utilisant différents formats de temps. 4 26 PM deux heures, sept minutes et neuf secondes, 16 heures 39 minutes et 57 secondes. Heure normale du Pacifique. 6 22 Heure normale de l'Est. Cinq Olock 1700 17 h 5. Amazon Polly interprète l'élément temporel du texte numérique comme une durée en minutes et secondes et peut également reconnaître le temps de base formatage de la structure de marquage du texte pour interpréter le temps à l'aide d'Amazon. Polly est illustré ci-dessous Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour temps d'interprétation en utilisant Amazon Polly une minute et 21 secondes. 4 26 PM cinq oclock 1700 heures 3 18 L'élément téléphonique indique que le texte contenu sous forme de numéro de téléphone Google, T TS et Amazon Polly interprètent les valeurs téléphoniques légèrement différemment, de sorte qu'il couvrira les deux processus. Séparément, la structure de marquage du texte pour interpréter correctement les numéros de téléphone en utilisant le texte Google à la parole est illustrée ci-dessous. Notez que l'élément téléphonique vous permet d'accéder à des codes internationaux dans le champ de format. Le moteur texte à la parole de Google interprétera correctement les codes internationaux dans le champ de texte , même si le code de pays présent dans l'élément de format ne le correspond pas. En outre, il interprétera les extensions de numéros de téléphone et même les mots de téléphone. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour Google texte à la parole à l'aide de numéros de téléphone. 5556789 5556789 Extension 345 plus 3 +98 OO +123456 plus 3 +98 OO +123456 six Saito 5556789 16 Saito 5556789 +18662255631 +155574992 Amazon Polly interprète le texte numérique comme un numéro de téléphone à sept chiffres ou à 10 chiffres. extensions de téléphone peuvent également être incluses. Veuillez noter qu'au moment de l'enregistrement de cette leçon, l'option téléphonique ne pouvait être utilisée qu'avec des voix de langue anglaise. La structure de marquage du texte pour interpréter correctement les numéros de téléphone à l'aide d'Amazon Polly est illustrée ci-dessous d'autres choses. Pour garder à l'esprit est qu'Amazon Polly peut interpréter les numéros de téléphone dans le texte sans marquer les balises si les tirets air utilisés dans les numéros de téléphone. également Veuillezégalementnoter que la langue que vous sélectionnez affecte la façon dont les numéros de téléphone sont parlés, par exemple, écouter la différence entre la façon dont une voix anglaise américaine indique le numéro de téléphone ci-dessous et la façon dont un Royaume-Uni La voix anglaise le dit. numéro de téléphone de Veronica est 2122241555 Extension 666 Veronica. Son numéro de téléphone est 212 double à 41 Triple cinq extension. Triple six. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour l'interprétation des numéros de téléphone. Utilisation de l'extension Amazon Polly 5551212 20 à 5551212 20 à 5551212. 345 5556789 5556789 Extension. 345 6805556789 16805556789 Un élément supplémentaire que vous pouvez utiliser avec Amazon Polly Voices comme élément d'adresse, qui vous permet d'interpréter des textes comme faisant partie d'une adresse municipale. La structure de marquage du texte pour interpréter correctement une adresse en utilisant Amazon, Polly est illustrée ci-dessous Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour les adresses. 14 barre oblique 72 53 The Boulevard Springfield, 63103 Missouri USA Apartment, 69 1 88 Grand Central Tower, comté de Cloudburst, Nouvelle-Galles du Sud 2177. Australie 59 40. Ferguson Road, Richmond ( Colombie-Britannique) c sept B un M six, Canada Le dernier élément que je veux aborder avant la fin de cette leçon sont les interjections , aussi appelées discours Cons Can être ajouté au texte à l'aide de la balise de balisage indiquée ci-dessous. S' il vous plaît noter que les inconvénients de la parole sont habitués. Bibliothèque créée pour Amazon Alexa Lors de l'enregistrement de cette leçon, les inconvénients de discours n'étaient pas disponibles pour Amazon Polly Voices. Donc, ce que j'aimerais faire est juste de vous jouer une vidéo d'écran enregistrée de divers inconvénients de la parole afin que vous puissiez entendre ce que le son est. Abacha. Deborah est arrivé à euh, hein. Lui. Ahoy ! Tout droit. Je suis bas, hein ? Yoga. Argh ! Areva ! Daraji ! Comme vous le souhaitez. Bar voie un homme. Ah, Botta Bada boom bah, humbug bam, Bang, Batter up, Zynga baby Bingo, blah saindoux dernier Boeing uppiity. Votre bon voyage Osh Boo hoo hoo hoo ! Boum ! Booyah ! Bravo, bombardier Car Ching ! Mate de contrôle ! Cheerio. Les applaudissements. Remonter le moral. Voyage choo choo clank Click clack Cock un gribouillis. Ooh ! Coup ! Cowabunga ! Darn ! Kim Dong ! Ditto. Ne partez pas, Dot Dot Duh. C' est stupide. Ne fais pas ! Ne fais pas de dynamite. Ik ça. Encore sur les gardes ! Eureka ! Fantaisie ça, Geronimo ! Giddy up ! Bon chagrin. Bonne chance. Bonne énigme. Gotcha ! Super. Scott, Heads up ! Entendez, entendez ! Hip, hanche ! Hourra ! Hiss, porc, Patty ! Hourra ! Hourra ! Huzzah ! Jeepers creepers ! Jiminy Cricket, Jenks. Je plaisante. Kaboom ! Coaching d'agneau Cobb Kapow Chao Co Xam ca bam ka boom ! Coaching pourrait mâcher ca flop. Pourrait plop Kerplunk. Kapow sa latte son puisard ! Toc, toc ! Mademoiselle, je regarde dehors ! Mamma Mia ! Homme par-dessus bord ! Maazel m'a balancé. Messi qui ? Non, non, non, non. Plus méchant ! Plus méchant. Pas moyen. Maintenant, comment, mon garçon ? Oh, mon frère ! Oh, ma chère. Oh, mon Oh, enfichable Link ! D' accord. Dokey. Poof ! La la Open de sésame ! Aïe ! Mon garçon , espèce de Pim Club Poof ! Pompe. Comment charlatan ! Lisez-les et pleurez. Ribbit, à droite. Oh, Roger. Amortisseurs rétro slash alerte Spoiler. Sky grinçant. Swoosh ! Euh, Toyota. Il est là. puisard, tique tique, Tic tac. Touche ! Tisk, Tisk, Tweet ! Euh, hein. Euh oh. Voula de Whoa ! Je ne veux pas. Attention ! Le chemin à parcourir ! Bien joué ! Eh bien, eh bien. Wham, whammo ! On a Qué loup ! Oups ! Une marguerite qui ? Wow ! Wow ! Za wowser yada, yada, yada. Oui, Yikes ! Tu sais peut-être qui tu paries. Yowza ! Oui, Hauser. Yuck ! Miam, zap, zing ! Zoinks ! Cela nous amène à la fin de ce tutoriel. J' espère que vous avez trouvé cette leçon utile. Veuillez vous reporter aux notes d'accompagnement dans cette section pour plus d'informations et vous remercier de votre écoute. 12. 11 - Tag d'une thématique de l'axe de l'expression à la parole: Bonjour et bienvenue. Dans ce didacticiel, vous allez apprendre à utiliser les balises SS ML pour mettre en valeur certaines parties de votre texte comme le texte Google à la parole et Amazon Polly interpréter l'accent différemment, nous allons couvrir les deux séparément. L' élément d'emphase est utilisé pour mettre l'accent sur le texte. Cet élément modifie la parole de la même manière que Prasit E, mais sans qu'il soit nécessaire de définir des attributs vocaux individuels. L' élément d'accentuation prend en charge un attribut de niveau facultatif, ce qui modifie le degré d'emphase ajouté au texte la structure pour marquer le texte pour interpréter l'accent en utilisant Google texte à la parole est affiché sous Google Text to speech prend en charge les niveaux d'emphase suivants fort , modéré, réduit et aucun écoute d'un enregistrement de parole synthétisé d'un fichier texte marqué à l'aide différents niveaux d'accentuation. Rends-le, dit Sue, alors que son frère cachait la friandise dans sa poche. Non, c'est à moi, dit Tim, repoussant sa petite soeur. Je vous préviens, dit Sue, avançant de façon menaçante. Oh, non, j'ai tellement peur, a dit Tim avec un sourire. Tu ferais mieux d'être. Je le dis à maman, dit Sue, en remuant son doigt au visage. Parlons maintenant de marquer le texte pour interpréter l'accent en utilisant Amazon Polly, la structure d'interprétation de l'accent. L' utilisation d'Amazon Polly est la même, mais avec l'accent Amazon Polly modifie le taux de volume de la parole. Plus d'accent rend Amazon Polly parler le texte plus fort et plus lent, et moins d'accent le rend plus silencieux et plus rapide. Amazon Polly prend en charge les niveaux d'accent suivants forts, augmente le volume et ralentit le taux de parole. Ainsi, les discours plus forts et plus lents modérés augmente le volume et ralentit le taux de parole , mais pas autant que lorsqu'ils sont trop forts. Si le niveau n'est pas inclus dans la balise de balisage, Amazon Polly traite l'accent au niveau modéré Est-ce que le paramètre par défaut est réduit, diminue le volume et accélère le taux de parole. Les discours, doux et plus rapide. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour Amazon Polly, en utilisant différents niveaux d'accentuation. Rends-le, dit Sue, comme son frère, caché à traiter dans sa poche. Non, c'est à moi, dit Tim, repoussant sa petite soeur. Je vous préviens, dit Sue, avançant de façon menaçante. Oh, non, j'ai tellement peur, lui a dit avec un sourire. Tu ferais mieux d'être. Je le dis à maman, dit Sue, en remuant son doigt au visage. Cela nous amène à la fin de ce tutoriel. J' espère que vous avez trouvé cette leçon utile. Veuillez vous reporter aux notes d'accompagnement dans cette section pour plus d'informations et vous remercier de votre écoute. 13. 12 - Les étiquettes de la prode le texte à la parole: pour voir un monde dans un grain de sable et un ciel dans une fleur sauvage. Tenez l'infini dans la paume de votre main et l'éternité en une heure pour voir un monde dans un grain de sable. Onda paradis dans une fleur sauvage. Tenez l'infini dans la paume de votre main et l'éternité en une heure. Bonjour et bienvenue. Dans ce tutoriel, vous découvrirez Prasit E et comment utiliser les balises SS ML pour changer les éléments Prasad IQ dans votre texte en fichiers vocaux. Je vais vous expliquer quel processus il veut dire. Parlez de certains termes connexes et vous montrer comment modifier la hauteur, volume et le taux de votre texte parlé. Prasit. Il se réfère à des domaines du langage comme le rythme de l'air, le stress et l'intonation de la parole, et comment ces caractéristiques contribuent au sens. Prasad. IQ fait référence aux attributs et aspects de Prasit e le processus. L' élément est utilisé pour personnaliser la hauteur, le volume et la fréquence de parole de vos balises Speech. La structure de marquage du texte pour interpréter Prasit E est présentée ci-dessous. Si vous enregistrez le même texte à l'aide de voix différentes, vous pouvez voir que certaines voix diront la même chose à un rythme plus lent et plus rapide de volume de la parole, de la fréquence vocale et de la hauteur dépendent de la voix sélectionnée. En plus des différences entre les voix pour différentes langues, il y a des différences entre les voix individuelles parlant la même langue à cause de cela , alors que les attributs air similaires dans toutes les langues, il sont des variations claires d'une langue à l'autre. Cela signifie qu'il n'y a pas de valeurs absolues seulement des valeurs relatives. Les valeurs relatives peuvent être écrites sous la forme d'un pourcentage ou d'un nombre précédé d'un signe plus ou moins , suivi d'un symbole de pourcentage, par exemple, plus 15,2 % moins 8 % ou est un nombre relatif pour les attributs de hauteur. Les changements relatifs peuvent être donnés en demi-tons, en utilisant un nombre précédé d'un signe plus ou moins, suivi de S. T, qui signifie demi-tons, par exemple, plus 0,5 demi-tons plus cinq demi-tons moins deux demi-tons. Etcetera. Notez que les unités pour str sensible à la casse une demi-tonalité est la moitié d'un ton ou 1/2 pas sur l' échelle diatonique standard. Écouter un enregistrement de parole synthétisé d'un fichier texte marqué à l'aide d'un processus différent, il attribue. informatique quantique est l'utilisation de phénomènes mécaniques quantiques tels une superposition et un enchevêtrement pour effectuer le calcul. informatique quantique est l'utilisation de phénomènes mécaniques quantiques, une telle superposition et enchevêtrement pour effectuer le calcul. informatique quantique est l'utilisation de phénomènes mécaniques quantiques, une telle superposition et enchevêtrement pour effectuer le calcul. informatique quantique est l'utilisation de phénomènes mécaniques quantiques, une telle superposition et enchevêtrement pour effectuer le calcul. Jetons un coup d'oeil maintenant sur les éléments PRASAD IQ du volume de la hauteur et la vitesse de la parole et comment ces air interprété par le texte Google à la parole et Amazon Polly façon. La modification de la hauteur de votre discours vous permet d'augmenter ou de baisser le ton de vos voix sélectionnées . Il existe trois options pour définir la valeur des attributs de hauteur avec le texte Google à la parole. Vous pouvez spécifier une valeur relative telle que extra low, low, medium, high, high, extra high et par défaut où la valeur moyenne est la hauteur par défaut. Vous pouvez également augmenter ou diminuer la hauteur en spécifiant un certain nombre de demi-tons. Notez que lorsque vous utilisez cette méthode, l'utilisation de signes plus ou moins et de S T est requise, vous pouvez également augmenter ou diminuer la hauteur en utilisant des valeurs de pourcentage. Notez que le symbole de pourcentage est obligatoire, mais l'utilisation de signes plus ou moins est facultative. Écoutez les différentes valeurs de hauteur utilisées pour raconter l'exemple de texte ci-dessous. La première phrase n'a pas de marque pour que vous puissiez entendre la voix par défaut. Si j'avais un monde à moi, tout serait absurde. Rien ne serait ce que c'est parce que tout serait ce qu'il n'est pas. Et par contre, qu'est-ce que ce ne serait pas. Et qu'est-ce que tu verrais pas ? Je ne sais pas ce que tu veux dire, dit Alice Amazon. Polly vous permet de régler, augmenter ou d'abaisser la hauteur de votre discours en utilisant une valeur prédéfinie comme extra low, low medium high et extra high. Vous pouvez également augmenter la hauteur en spécifiant un pourcentage, par exemple, plus 10 % ou plus 5 %. Notez que la valeur maximale autorisée est plus 50%. Si vous définissez la valeur supérieure à ce montant, elle ne sera rendue qu'à la valeur maximale de plus 50 %. Vous pouvez également diminuer la hauteur en spécifiant un pourcentage tel que moins 10% moins 20% etcetera, la plus petite valeur autorisée pour la hauteur décroissante en utilisant des pourcentages comme moins 33,3% spécifiant une valeur inférieure à moins 33,3% ne sera que rendu à la valeur minimale de moins 33,3 %. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour Amazon Polly Voices à l'aide de différents attributs de hauteur. Un rêve n'est pas la réalité, qui dit lequel est lequel ? Tout le monde veut une solution magique pour leur problème, et tout le monde refuse de croire en la magie. Pas étonnant que tu sois en retard. Pourquoi cette montre est exactement deux jours lente. Vous étiez beaucoup plus ici. Parfois, je croyais en six choses impossibles avant le petit déjeuner. J' ai une théorie. Les gens parlent fort quand je veux agir intelligemment. Droit avec Google. voix est que vous pouvez modifier le volume de votre texte parlé en utilisant un nombre précédé du signe plus ou moins immédiatement suivi de DB pour les décibels ou utiliser des valeurs comme silencieux, extra doux, doux, moyen fort, extra fort ou par défaut. La valeur par défaut est plus 0,0 décibels. Notez que la spécification d'une valeur de silence comme égale à la spécification moins infini décibels et que tous les niveaux de volume numériques en décibels air par rapport au niveau actuel et doivent toujours avoir un signe plus ou moins, y compris zéro L'utilisation de l'étiquette par défaut réinitialise le niveau de volume actuel. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour Google TTS à l'aide différents attributs de volume. Je parle cette ligne au volume par défaut pour cette voix. Je parle ça. Tapissez-le environ deux fois l'amplitude du signal d'origine. Je parle cette ligne il environ la moitié de l'amplitude du signal d'origine. Amazon Polly vous permet de modifier ou de régler le volume à un niveau prédéfini pour votre voix actuelle , en utilisant des valeurs telles que silencieux extra doux, doux, moyen fort, un extra fort. Vous pouvez également augmenter le volume par rapport au niveau de volume actuel. Par exemple, plus zéro décibels signifie aucun changement de volume, plus six décibels comme environ le double de l'amplitude actuelle. Veuillez noter que la valeur positive maximale autorisée à environ 4,8 décibels. En outre, vous pouvez diminuer le volume par rapport au niveau de volume actuel. Par exemple, moins six décibels signifie environ la moitié de l'amplitude du courant. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour les voix Amazon Polly à l'aide de différents attributs de volume. Je parle cette phrase de mon volume normal. Je parle de cette phrase qui a permis un volume. Chaque fois que je me réveille, j'ai tendance à parler très lentement quand mon cerveau se met au point. Je peux parler avec mon pitch normal, mais aussi avec un ton beaucoup plus élevé. Et parfois, je peux même parler avec une voix beaucoup plus basse. Un autre attribut de Prasit EU peut changer dans votre texte car le taux de parole utilise des valeurs relatives comme extra lent, lent, moyen rapide, extra rapide ou par défaut pour définir le taux de parole ou un pourcentage lorsque la valeur est un pourcentage non négatif. Il agit comme un multiplicateur du taux par défaut. Par exemple, une valeur de 100 % signifie aucun changement dans le taux de parole. Une valeur de 200 % signifie un taux de parole deux fois le taux par défaut, et une valeur de 50 % signifie un taux de parole de la moitié du taux par défaut. En outre, il est important de garder à l'esprit que le taux par défaut dépend de la langue, dialecte et de la personnalité de la voix utilisée. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour Google. TTS voix utilisant différents attributs de taux un petit garçon bleu venir souffler votre klaxon, les navires et la prairie. La vache est dans le maïs. Où est ce garçon qui s'occupe des moutons ? Il est sous une botte de foin. Dormir rapidement Avec Amazon Polly Voices, vous pouvez définir le taux de parole à l'aide de valeurs relatives telles que extra lent, lent , moyen rapide extra rapide, ou spécifier un pourcentage pour augmenter ou diminuer le vitesse de la parole. 100 % indique aucun changement par rapport au taux normal, tandis que le pourcentage est supérieur à 100 %. Augmenter le taux et les pourcentages en dessous de 100 %. Diminuer le taux. Notez qu'avec Amazon Polly vole la valeur minimale que vous pouvez spécifier comme 20 %. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué pour Amazon Polly Voices en utilisant différents attributs de taux. C' est comme ça que je vais quand je parle très lentement. Je parle toujours très vite quand j'ai une explosion. Allons le descendre d'un cran, puis attendez et regardez. Si je parle un peu plus vite, ça ne ressemblera pas à un désastre. Si je ralentit un peu, tu pourras me retrouver au milieu. En résumé, vous pouvez utiliser des éléments e Prasidh avec des attributs de volume et de raid combinés pour affiner votre texte aux fichiers vocaux et améliorer la qualité de vos narrations. Cela nous amène à la fin de ce tutoriel. J' espère que vous avez trouvé cette leçon utile. Veuillez vous reporter aux notes d'accompagnement dans cette section pour plus d'informations et vous remercier de votre écoute. 14. 13 - Tag de l'un de l'un de la langue à l'expression: - Allen Clés Allen,mangeoires terribles, mangeoires terribles PortSys, chauffage électriques, compacteurs à ordures, jus, extracteur, extracteur, douches coulées dans les compteurs d'eau, talkies de marche, des lunettes de sécurité en fil de cuivre, des pneus radiaux, granulés, des maillets en caoutchouc, ventilateurs et des déshumidificateurs. Tableau accroché coupe-papier, gaufres, volets de fenêtre. Décapants de peinture jusqu'à ce que nous étions en train de masquer des dollars impactés. Robinets de cuisine, tables pliantes, décapage, câbles appropriés, apparence et fond. C' est de retour avec le pouvoir. Le père légal doit signer pour la fumigation. Invocation haute performance, imperméabilisation ingérante,isolation polyvalente, isolation polyvalente, compresseur d'air, connecteurs d' herbe comptent les détecteurs de fumée ciseau. Les jauges répondent. Kate, c'est des thermostats et des transfuges. Remorque atch de magnetize mentors. Automatique circoncis tend les records, les supports d' angle pour nous-mêmes et les panneaux de soffit énergisant, disjoncteurs, aspirateurs, cafetières, générateurs peuplés, assortis salière et poivrière Way Bonjour et bienvenue de retour. Dans ce didacticiel, vous apprendrez à définir une durée maximale pour la parole synthétisée à l'aide du processus de la balise Durée Max Amazon. Dans une leçon précédente, nous avons abordé en utilisant le processus l'élément pour personnaliser la hauteur, volume et la fréquence de parole de vos balises. Vous pouvez également spécifier la durée de votre texte parlé à l'aide du processus. La balise de durée Amazon Max. Veuillez noter que cette fonctionnalité n'est actuellement disponible que pour les voix Amazon Polly, non pour les voix Google. Il est également important de garder à l'esprit que la durée de la parole synthétisée sera très légèrement, selon la voix que vous sélectionnez. Il est donc difficile de faire correspondre la parole synthétisée avec des visuels ou d'autres activités qui nécessitent un timing précis et peuvent être particulièrement difficiles si vous prévoyez de traduire du texte dans différentes langues. La structure de marquage du texte à l'aide du processus de la balise de durée Amazon Max est indiquée ci-dessous quelques-unes des utilisations du processus. La balise de durée Amazon Max inclut narrations audio enregistrées ou traduites vers des vidéos, des présentations de diapositives etc. D' autres utilisations incluent la possibilité de faire correspondre la parole synthétisée aux restrictions de temps. Par exemple, si vous enregistrez une narration pour une 32e annonce radio dans votre message prend 20 secondes et vous devez inclure un avertissement légal à la fin de votre annonce . Vous pouvez compresser la clause de non-responsabilité dans les 10 secondes restantes à l'aide d'une clause de non-responsabilité enregistrée générée par synthèse . Voici un exemple d'exclusion de responsabilité qui prendrait normalement 15 secondes pour livrer compressé en 10 secondes à l'aide de la balise de durée maximale Amazon payée par Taxer Election Association Political Action Committee, autorisé par le député Johnson et le LV Harvey au nom du groupe T. Des conditions particulières s'appliquent. Veuillez consulter notre site Web pour plus de détails sur www dot cpac dot work, la durée maximale de votre discours peut être spécifiée en secondes ou millisecondes. Le processus. L' élément de durée maximale Amazon assure que tout texte placé dans les balises de durée maximale ne dépasse pas la durée spécifiée. Si le discours à l'aide de la voix ou de la langue choisie prend normalement plus de temps que la durée spécifiée, Amazon Polly l'accélérera pour s'adapter à la durée spécifiée. En outre, si la durée spécifiée est plus longue que nécessaire pour lire le texte à un rythme normal, Amazon Polly lira le discours normalement. En d'autres termes, il ne ralentit pas la parole ou n'ajoute pas de silence, de sorte que l'audio résultant sera plus court que la durée spécifiée. Notez également qu'Amazon Polly peut augmenter la vitesse de votre texte parlé pas plus de cinq fois le taux normal. Si le Texas parlait plus vite que ça, ce sera probablement incompréhensible. En outre, si la parole ne peut pas correspondre à la durée spécifiée, même si elle est accélérée au maximum, le son sera accéléré mais durera plus longtemps que la durée spécifiée. D' autres choses à garder à l'esprit lorsque vous marquez votre texte dans des fichiers vocaux, car vous pouvez inclure une seule phrase ou plusieurs phrases dans une balise de durée maximale, et vous pouvez utiliser plusieurs balises de durée maximale Prasit E Amazon dans votre texte. Lors du calcul de la durée maximale que vous avez spécifiée, un processeur TTS prendra en compte les pauses ou pauses ajoutées au texte et l'inclura dans la période de durée. En outre, Amazon Polly conservera les courtes pauses qui se produisent lorsque des virgules et des points sont placés dans un passage de texte. Une astuce utile lors de l'utilisation de cette balise pour essayer de garder vos passages de texte courts afin de réduire la synthèse vocale. Layton voir pendant le processus de conversion audio, écouter un enregistrement de parole synthétisé d'un fichier texte marqué à l'aide de plusieurs balises de durée Prasit Imax. La parole est un mode de communication spécial. preuves suggèrent que l'anatomie spécialisée qui confère la parole humaine a atteint son état actuel il y a environ 150 000 ans. Le larynx est une structure complexe faite de cartilage, muscles et d'autres problèmes mous. La dernière chose que je veux couvrir dans cette leçon sont quelques-unes des limitations de l'utilisation de la balise durée maximale et comment cela fonctionne avec d'autres balises SML s,Par exemple, Par exemple, vous ne pouvez pas imbriquer des balises de durée maximale. Si vous placez une balise de durée maximale dans une autre Amazon, Polly ignorera la balise interne. En outre, en utilisant le processus, la balise de taux ne fonctionne pas avec la balise de durée maximale comme fonction des deux balises pour affecter la vitesse de votre texte parlé. Enfin, le texte utilisé dans une balise de durée maximale Amazon Prasit E ne peut pas dépasser 1500 caractères. Le texte ci-dessous, par exemple, qui a été utilisé dans la vidéo d'ouverture de cette leçon, fait 932 caractères, donc une quantité assez importante de texte peut être utilisée avant de terminer cette leçon. Allons nous amuser un peu. Êtes-vous prêt ? Certains d'entre nous doivent faire pour le faire passer, diriger surhumains et ils n'ont rien fait que vous dites avoir honte. dévastatrice. N' oubliez pas de montrer comment donner au public le sentiment qu'il est en lévitation, ne jamais disparaître chaque fois que les ennemis pour partout où nous pourrions dire que je vais célébrer parce que je sais comment cela nous amène à la fin de ce tutoriel. J' espère que vous avez trouvé cette leçon utile. Veuillez vous reporter aux notes d'accompagnement dans cette section pour plus d'informations et vous remercier de votre écoute. 15. 14 - Les balises de la prononciation du texte à la de la parole: vous dites non plus, et je dis soit vous ne dites ni ni ni je ne dis ni ni ni l'un ni autre. Ni plus. Ni plus. Ni plus. Appelons tout le truc. Tu aimes la pomme de terre ? Et j'aime ce que Sato You aime la tomate, la pomme de terre, la tomate , la tomate, tomate, tomate. Appelons tout ça Bonjour et bienvenue. Dans ce tutoriel, nous couvrons la prononciation du texte. Vous apprendrez à marquer votre texte pour prononcer des acronymes et des abréviations, en utilisant des noms de téléphone pour différentes prononciations phonétiques et des moyens d'améliorer la prononciation vocale en spécifiant des parties de la parole et des significations alternatives dans vos éléments de balisage . Commençons par la façon de marquer les fichiers texte pour prononcer les acronymes et les abréviations correctement. Acronyme comme un mot ou un nom formé comme une abréviation des composants initiaux d'une expression ou d'un mot. Habituellement des lettres individuelles comme l'OTAN ou la plongée sous-marine. Vous pouvez utiliser l'élément sous-alias pour remplacer des mots ou développer des acronymes. Nom des éléments ou des abréviations. Un tel dicton le Federal Bureau of Investigation au lieu du FBI, la British Broadcasting Corporation au lieu de la BBC, le Fonds monétaire international au lieu de I m f. Etcetera. La balise de sous-alias peut également être utilisée pour fournir la prononciation correcte pour les mots perdus, qui sont des mots avec des chiffres pour des lettres ou des noms uniques que les moteurs TTS ne peuvent pas prononcer correctement. La structure de marquage du texte pour interpréter les acronymes et les abréviations, comme indiqué ci-dessous. Voici quelques conseils utiles lors de l'utilisation de la balise sub. Au moment de la création de cette leçon, Google voice ne prend pas en charge l'utilisation de noms de téléphone, que nous examinerons dans un moment que vous pourrez utiliser. Le sous-élément avec Google Voice est plutôt, si vous prévoyez d'utiliser les mêmes acronymes à plusieurs reprises dans votre texte, utilisez l'élément sous-alias pour développer la première instance de l'acronyme dans votre texte afin que vos auditeurs sachent exactement ce que vous faites allusion. Le sous-élément peut également être utilisé pour fournir des prononciations simplifiées de mots que les moteurs TTS trouvent difficiles à lire, comme les mots dans d'autres langues. Écoutez un enregistrement de synthèse vocale d'un fichier texte marqué à l'aide de balises Sebelius. Le rôle principal de l'Organisation mondiale de la santé est d'orienter la santé internationale au sein du système des Nations Unies et de diriger les partenaires dans les interventions sanitaires mondiales. Iridium est un métal de transition blanc argenté très dur, fragile, du groupe de platine Alcoholics Anonymous est un programme en 12 étapes de récupération de l'alcoolisme. La seule exigence pour être membre de A est le désir d'arrêter de boire. Tim a lu son premier livre alors qu'il n'avait que trois ans. Voyons maintenant comment utiliser les noms de téléphone et ajouter une prononciation phonétique à votre texte . Vous pouvez utiliser la balise de nom de téléphone avec Amazon Polly pour ajouter une prononciation phonétique à un texte spécifique . Notez que Google TTS ne prend actuellement pas en charge l'utilisation de noms de téléphone. La balise de nom de téléphone doit inclure les deux attributs suivants. L' alphabet est utilisé pour indiquer quel alphabet phonétique Amazon Polly doit utiliser, et le pH spécifie la prononciation phonétique que vous souhaitez utiliser Amazon Polly à la place de l' ID d'association de prononciation standard par défaut avec la langue utilisée par le . La structure de marquage du texte pour interpréter correctement les noms de téléphone est affichée sous Amazon . Polly peut interpréter les noms de téléphone à partir de divers alphabets phonétiques, y compris I p A. Sampa, un pignon amazonien pour la prononciation phonétique chinoise mandarine. Si vous envisagez d'utiliser des alphabets phonétiques dans des langues autres que l'anglais, n'oubliez pas de spécifier la langue correcte avant de traiter votre texte. Écoutez un enregistrement de parole synthétisé d'un fichier texte marqué à l'aide d'objectifs de téléphone à pignon. Vous êtes sûr que la guerre, nous en sommes sûrs. Amazon Polly prend désormais en charge l'utilisation de noms de téléphone dans de nombreuses langues différentes. Reportez-vous à la documentation accompagnant ce cours pour des liens vers des tables d'appel, outils et des ressources pour les alphabets phonétiques pris en charge. C' est au-delà du cadre de ce cours de vous enseigner la phonétique. Vous pouvez trouver de nombreux tutoriels vidéo en ligne sur ce sujet. La chose importante que vous devez savoir pour cette leçon que comment papa noms de téléphone lors du marquage votre texte. Alors passons brièvement à travers ce processus. Commençons par étudier la structure des balises d'appel ci-dessous et écouter comment les mots sont prononcés en utilisant différents noms de téléphone et alphabets phonétiques. Tu dis pécan. Je dis pécan, vous dites pécan. Je dis pécan. Nous avons parlé de l'utilisation d'outils phonétiques dans la leçon d'outils de texte à parole, et nous fournissons également des informations et des liens vers divers outils phonétiques, et la ressource est dans la documentation du cours d'accompagnement. L' autre chose dont nous avons parlé était l'importance d'enregistrer des fichiers texte contenant des noms de téléphone pour Amazon Polly en utilisant le format UTF huit. Examinons donc brièvement ces deux points. La première étape consiste à localiser et à copier l'orthographe phonétique correcte des mots. Vous pouvez le faire gratuitement utilisant des sites qui fournissent des dictionnaires en ligne avec des outils d'orthographe phonétique et de conversion phonétique . Reportez-vous aux notes du cours pour plus de détails. Après avoir spécifié l'alphabet phonétique à utiliser et coller les noms de téléphone dans vos fichiers texte . Alphabet et attributs PH, n'oubliez pas d'enregistrer votre fichier texte en utilisant utf eight Encoding. Comme le montre ici maintenant que nous avons regardé les sous-alias et les balises d'appel, regardons les moyens d'améliorer la prononciation de vos mots. Hedren M. motsHedren M. Zehr qui sont orthographiés de façon identique mais ont des significations différentes lorsqu'ils sont prononcés différemment. Amazon Polly est en fait très bon quand il s'agit de reconnaître des noms hétéros et des mots qui transmettent des significations différentes. Selon le contexte, ils sont utilisés et la technologie ne fait que s'améliorer. Par exemple, écoutez la façon dont Amazon Polly interprète les phrases suivantes. Sans balisage, balises ajoutées, le groupe enregistrera un enregistrement. Nous refusons d'accepter plus de déchets. Ce pays ne progressera jamais si nous ne réalisons pas de progrès. Ces agriculteurs produisent beaucoup de produits. Votre Honneur, je ne contesterai pas le concours. Ne vous rebellez pas à moins d'être un rebelle. S' il vous plaît, ne nous soumettez pas à plus de douleur. En discutant du sujet de votre opération, je vais contraster toutes les différentes options de contraste de ces écrans d'ordinateur portable sur mon blog. Lorsque le feu de broussailles s'est rapproché, les autorités ont décidé de fermer la route. certains mots Cependant, peuvent être difficiles ou difficiles pour les moteurs TTS à reconnaître et à interpréter correctement. Écoutez les phrases ci-dessous au fur et à mesure qu'elles sont lues, et nous en discuterons dans la diapositive suivante. J' ai appris à lire et à lire pour apprendre. J' ai appris à lire et à lire pour apprendre. Montez la basse sur votre radio et vous allez attraper plus de basses. Montez la basse sur votre radio et vous allez attraper plus de basses, comme vous venez de l'entendre. Certains mots comme Read et base peuvent être difficiles à interpréter correctement pour les moteurs TTS. C' est là que la balise W est utile. Vous pouvez utiliser la balise W dans Amazon Polly pour personnaliser la prononciation des mots en spécifiant une partie de la parole ou une autre signification. Ceci est fait en utilisant les attributs de rôle spécifiant une partie de la parole. Vous permet de dire à Amazon Polly s'il faut interpréter le mot lu comme un verbe dans le présent, dit Tense, et je vais lire ce livre ou est le mot rouge dans le passé ? Comme dans, j'ai lu ce livre. Vous pouvez le faire en utilisant différents attributs comme Amazon VB, un Amazon V B D. Utilisez Amazon sense underscore un pour des significations alternatives aux mots. Par exemple, la base de nom fait généralement référence à la partie la plus basse de l'échelle musicale, mais il peut aussi être une espèce de poisson d'eau douce si la prononciation du mot est différente. Si vous ne voulez pas que la signification par défaut des mots qui sont orthographiés de la même manière mais qui ont des significations différentes lorsqu'ils sont prononcés différemment, utilisez la balise de signification alternative. La structure de base pour marquer le texte pour personnaliser la prononciation des mots à l'aide de l' élément W a montré ci-dessous et dans les diapositives suivantes, le mot R E a d peut être interprété soit comme la forme simple actuelle lue, soit comme le passé forme participle rouge. Le mot B. A s peut être interprété comme une base d'éléments musicaux ou est son alternative signifiant un bar de poisson d'eau douce Dans les moyens sommaires pour améliorer la prononciation du texte, l'utilisation de S SML inclut simplement permettre à la technologie de garder devenir plus intelligent en termes de meilleure reconnaissance du contexte ou d'utiliser des balises comme la balise sous alias pour prononcer acronymes et des abréviations. La balise d'appel pour prononcer des mots avec différents sons phonétiques. Et la balise w pour spécifier des parties de la parole et des significations alternatives. Les outils de texte Spin vous ont laissé un texte alternatif avec d'autres synonymes. Vous pouvez utiliser le site Web du ministère des véhicules automobiles pour renouveler votre immatriculation en ligne. Soit elle y va ou je vais Il n'y a pas d'autre ou le visage triste sur ce t-shirt a une déchirure dedans . Je soupçonne que le suspect principal du feu de la cathédrale Notre-Dame est totalement tordu. Cela nous amène à la fin de ce tutoriel. J' espère que vous avez trouvé cette leçon utile. Veuillez vous reporter aux notes d'accompagnement dans cette section pour plus d'informations et vous remercier de votre écoute. Quelque chose doit être, euh parce que je t'aime bien. Pas moyen. Aucun moyen ne doit 16. 15 - Le texte à l'expression Ajouter des audio: Mesdames et messieurs, bienvenue. Voici notre premier numéro pour la nuit. Ni merci, chers auditeurs, C'est ma première tentative, Everett faire de la comédie debout. S' il vous plaît soyez gentil Oh, j'ai l'intention de te divertir avec de fabuleuses blagues ce soir. Qui ? Êtes-vous prêt ? Oui. D' accord. On y va. Combien de niveaux seraient plus élevés si les éponges ne vivaient pas dans l'océan ? Théo, quelle est la différence entre ignorance et apathie ? Je ne sais pas. Et je m'en fiche. Comment avez-vous entendu parler du demi-côlon qui a enfreint la loi ? Il a été condamné à deux peines consécutives. Tu as entendu parler du voleur qui a volé un calendrier ? Il a 12 mois. C' est tout le temps que j'ai. Merci. Bonjour et bienvenue. Dans ce didacticiel, vous apprendrez à insérer des fichiers audio dans vos narrations vocales à l'aide de l'élément audio . Nous examinerons également d'autres balises de balisage pour insérer des éléments audio et multimédia dans vos fichiers texte à vocale. L' élément audio vous permet d'insérer des fichiers audio enregistrés dans vos narrations vocales. Actuellement, l'élément audio n'est pris en charge que dans Google voice. Les exigences de base pour l'utilisation de fichiers audio dans votre texte incluent de s'assurer que le fichier audio. Source. U R L utilise le protocole https une durée maximale de 120 secondes et une taille de fichier maximale de cinq mégaoctets. Vous devez également inclure une description à lire à haute voix si, pour une raison quelconque, votre audiophile ne joue pas la structure de marquage du texte pour les fichiers audio comme indiqué ci-dessous . Une façon d'éviter les problèmes avec les fichiers audio Ne pas lire pendant le processus de conversion de texte à parole est d'héberger les fichiers audio vous-même sur un service de stockage de médias cloud ou en ligne comme Amazon s trois Dropbox ou Google Drive. Nous fournissons des liens vers plus d'informations sur les outils et les ressources pour héberger des fichiers audio dans la documentation du cours d'accompagnement. Assurez-vous simplement que les liens pointant vers vos fichiers audio utilisent le protocole https. Vous pouvez insérer différents formats de fichiers audio comme Wave MP three inaug dans votre texte. Écoutez l'enregistrement de la parole suivante. C' est le son d'un enfant qui rit des chardons, le bruit d'un chien qui aboie. Notez que dans l'enregistrement, vous venez d'entendre les sons lus dans l'ordre dans lequel ils apparaissent dans le texte. En d'autres termes, audiophiles jouent normalement l'un après l'autre. Maintenant, écoutez cette façon d'enregistrement. Que se passe-t-il ici ? Je ne peux même pas m'entendre penser. Avec tous ces bruits fous qui se produisent dans l'enregistrement, vous venez d'entendre tous les sons de l'air jouer simultanément. Comment cela fonctionne-t-il ? Laisse-moi te montrer. En plus d'utiliser l'élément audio dans vos narrations vocales, vous pouvez utiliser des éléments tels que des balises séquentielles parallèles et des balises multimédias pour affiner votre discours. Les balises parallèles vous permettent de lire plusieurs éléments multimédias simultanément. Les balises séquentielles vous permettent de lire les éléments multimédias tels qu'ils apparaissent dans votre texte. Les balises multimédias vous permettent d'ajouter du texte et des éléments audio à l'intérieur de balises parallèles et séquentielles et d'utiliser des attributs pour les modifier comme le fondu du texte et les entrées et sorties audio. Augmenter ou diminuer le volume. Répétez et définissez la durée des éléments multimédias et spécifiez où les éléments multimédias commencent et se terminent. Pensez aux balises parallèles et séquentielles comme des conteneurs. Vous pouvez placer des sons de texture dans des balises multimédias et les modifier à l'aide de différents attributs . Si vous avez besoin d'un contrôle accru de vos fichiers texte et audio intégrés, utilisez des balises parallèles pour lire simultanément les éléments multimédias ou des balises séquentielles pour lire les éléments multimédias dans l'ordre dans lequel ils sont écrits dans votre fichier texte. En outre, utilisez divers attributs multimédias pour affiner votre discours. Je vais vous montrer comment cela fonctionne dans un instant. abord, d'abord, examinons rapidement les attributs multimédias que vous êtes autorisé à utiliser avec les fichiers texte et audio. Les attributs multimédia vous permettent de contrôler plus précisément le texte ou l'audio inséré dans votre discours. Utilisation. Commencez à spécifier quand vous souhaitez qu'un élément multimédia commence à jouer. Par exemple, vous pouvez spécifier un élément multimédia à lire après 37 ou 9,5 secondes. Utilisez end pour spécifier quand un élément multimédia doit cesser de jouer. Ceci est utile si vous voulez seulement lire les premières secondes d'un long fichier audio, puis arrêter de lire le fichier. nombre de répétitions vous permet de spécifier combien de fois vous voulez que l'élément multimédia répète, par exemple, deux fois cinq fois 10 fois, etcetera. La durée de répétition vous permet de limiter la durée du média inséré. niveau sonore vous permet de régler le niveau sonore de votre audio. Ceci est utile si vous jouez simultanément des éléments multimédias et que vous souhaitez que l'un des éléments joue plus fort ou plus doux dans le mélange. La durée du fondu vous permet de spécifier quand un élément multimédia doit se fondre en lecture, et la durée du fondu vous permet de spécifier à quel point le texte ou l'audio doit commencer à s'estomper À partir la fin de votre élément multimédia, écoutez à nouveau l'enregistrement où divers éléments multimédias sont tous joués simultanément. Attends, qu'est-ce qui se passe ici ? Je ne peux même pas m'entendre penser avec tous ces bruits fous qui se produisent. Si vous étudiez le balisage de ce texte, vous verrez cinq éléments multimédias enfermés dans les balises P A R. Le premier élément est le texte oral fermé dans les tags de parole et défini pour commencer 12 secondes dans le discours avec un niveau de volume élevé de quatre décibels, le second élément comme un fichier audio d'un enfant riant, réglé pour répéter quatre fois avec un volume légèrement inférieur à celui de la narration. Les trois éléments suivants sont des fichiers audio de chiens aboiements et des voitures avec sirènes réglées pour mettre fin à la parole Après 20 secondes, avec un fondu de cinq secondes à la fin, notez que vous pouvez combiner divers attributs de médias lors du marquage fichiers multimédias. Maintenant que vous comprenez comment créer une narration avec des audiophiles simultanées jouant en parallèle, laissez-moi lire le fichier une fois de plus afin que vous puissiez choisir tous les différents éléments multimédias et leurs paramètres de manière. Que se passe-t-il ici ? Je ne peux même pas m'entendre penser avec tous ces bruits fous qui se produisent. Voici un autre exemple de la façon d'insérer des fichiers audio à lire simultanément en utilisant des balises parallèles . Ici, nous allons, se préparer à fondre corps façon de se déplacer au rythme. Sentez l'amour se préparer au corps. Mais voici un exemple de la façon d'insérer des fichiers audio à lire séquentiellement avec quelques réglages de média. Salut, Olivia. Bonjour, Kate. Comment vas-tu ? Bien, merci. Pouvez-vous réciter l'alphabet anglais pour nos auditeurs ? Afficher A B C D E f g h i J k l M N O p Neuf autres lettres, puis dit en résumé, utilisé l'élément audio pour insérer l'audio pré-enregistré dans votre voix. Les narrations utilisent des balises parallèles pour lire des fichiers multimédias simultanément. Les balises séquentielles pour lire les fichiers multimédias dans l'ordre séquentiel et les balises multimédias pour combiner les fichiers vocaux et audio avec des attributs qui vous permettent de trouver des paramètres d'éléments multimédias tels que les heures de début et de fin définir la répétition et la durée augmenter et diminuer le volume et définir fondu in et fondu out. Cela nous amène à la fin de ce tutoriel. J' espère que vous avez trouvé cette leçon utile. Veuillez vous reporter aux notes d'accompagnement dans cette section pour plus d'informations et vous remercier de votre écoute. Mesdames et messieurs, veuillez accueillir Noah sur la scène. Merci. Je me suis réveillé ce matin et j'ai oublié de quel côté le soleil se lève. Puis il s'est levé sur moi. Je viens d'écrire une chanson sur les tortillas. En fait, c'est plus un rap. Et si je ne sais pas ce qu'Armageddon veut dire ? Ce n'est pas la fin du monde. Le champion du monde de langue Twister vient d'être arrêté. J' ai entendu dire qu'il a été condamné à une peine très dure. J' ai récemment décidé de vendre mon aspirateur. Tout ce qu'il faisait était de ramasser de la poussière. Je déteste les poupées russes. Ils sont tellement pleins d'eux-mêmes. Comment appelez-vous un B qui ne peut pas décider ? Peut-être du velcro. Quelle ripoff. Parfois, j'ai pris mes genoux dans ma poitrine et je me suis penché vers l'avant. C' est comme ça que je roule. Vous avez été un public si merveilleux. Merci et bonne nuit. 17. 16 - Le texte à la parole: Es-tu prêt ? Bonjour et bienvenue. Dans ce tutoriel, vous allez apprendre à ajouter des effets vocaux supplémentaires à votre texte à des fichiers vocaux tels que l' ajout du son de la respiration de deux mots et phrases, chuchoter des mots parlant doucement, contrôler le tambour vocal et ajout de compression dynamique de plage deux sections de votre texte pour améliorer la qualité d'écoute audio. Veuillez noter que les effets vocaux abordés dans cette leçon ne sont actuellement disponibles que pour Amazon. Polly Voices Commençons cette leçon en apprenant comment ajouter le son de la respiration à votre texte. discours à sonorité naturelle comprend des mots correctement prononcés et des sons de respiration. Vous pouvez rendre le son de synthèse vocale plus naturel en ajoutant des sons de respiration au texte à l'aide des balises Amazon Breath et Amazon Auto Breaths dans les options suivantes avec le mode manuel, vous définissez l'emplacement, longueur et le volume d'une respiration son dans le texte. Avec le mode automatisé, vous pouvez laisser Amazon Polly décider où insérer automatiquement des sons de respiration dans votre discours. Le mode mixte vous permet à Amazon Polly et à vous-même d'ajouter des sons de respiration manuellement et automatiquement à votre discours. La structure pour ajouter des sons de respiration au texte est montré ci-dessous noter qu'il existe plusieurs façons d'utiliser ces balises et attributs. Nous les aborderons plus en détail dans les prochaines diapositives. Mode manuel. Placez l'étiquette d'haleine Amazon dans votre texte où vous voulez qu'un souffle apparaisse. Vous pouvez personnaliser la longueur et le volume des respirations l'aide des attributs de durée et de volume. La durée vous permet de contrôler la longueur de la respiration. Les valeurs que vous pouvez utiliser pour définir la durée des respirations incluent par défaut. Extra court, court, moyen long, un extra long. La valeur par défaut pour la durée est moyenne. Le volume vous permet de contrôler l'intensité sonore de la respiration. Les valeurs que vous pouvez utiliser pour régler le volume de respirations incluent par défaut extra doux, doux, moyen fort et extra fort. La valeur par défaut du volume est moyenne. Veuillez noter que la longueur exacte en volume de chaque valeur dépend de la voix Amazon Polly utilisée pour définir un son de souffle à l'aide des valeurs par défaut en mode manuel utilisées par l' étiquette d'haleine Amazon sans attributs, par exemple, pour définir la durée et le volume d'une respiration à moyen. Vous définissez normalement la valeur de ces attributs comme indiqué ici. Ok, détendez-vous et respirez pour mettre un son de souffle en utilisant ces valeurs par défaut. Il suffit d'utiliser les balises sans attributs comme indiqué ici. Ajouter des respirations à vos phrases peut rendre votre discours plus naturel. Vous pouvez également ajouter des sons de respiration individuels dans un passage de texte en mode manuel, utilisant des balises comme illustré ici. Wow, je finis cette course très vite. Je crois que j'ai battu mon meilleur personnel. Notez que nous avons ajouté des éléments imbriqués de Prasad IQ au texte pour accélérer la vitesse en volume de la voix et créer un effet de son plus réaliste. En mode automatisé, vous pouvez utiliser la balise Amazon Auto Breaths pour indiquer à Amazon Polly toe automatiquement créer des bruits respiratoires à intervalles appropriés. Mode automatisé. Réglez la fréquence de la respiration, les intervalles, le volume et la durée. Notez toutefois que contrairement au mode manuel, que contrairement au mode manuel, la balise Amazon Auto Breaths nécessite l'ouverture et la fermeture des balises. Placez la balise d'ouverture au début du texte, où vous voulez que les sons de respiration automatisés démarrent et une balise fermée où vous voulez que les sons de respiration se terminent. Vous pouvez utiliser des attributs facultatifs de fréquence et de durée de volume avec le volume de balise Amazon Auto respire contrôle le volume sonore de la respiration. Les valeurs que vous pouvez utiliser pour contrôler le volume d'haleine incluent par défaut. Extra doux, doux, moyen fort et extra fort. Valeur par défaut pour le volume de respiration en mode automatisé en tant que commandes de fréquence moyenne. Combien de fois les sons de respiration se produisent dans la fréquence du texte. Les valeurs incluent par défaut extra low, low, medium high, extra high. La valeur de fréquence par défaut est des contrôles de durée moyenne. La longueur des valeurs de durée d'haleine que vous pouvez utiliser inclut par défaut extra court, court, moyen long, un extra long. La valeur par défaut pour la durée est moyenne par défaut. La fréquence des sons respiratoires dépend du texte d'entrée. Cependant, les sons respiratoires se produisent souvent après des virgules et des règles. Regardons maintenant quelques exemples d'utilisation de la balise Amazon auto Breaths. Dans les prochaines diapositives, nous allons examiner des exemples de discours générés à partir de texte en mode automatisé sans spécifier de paramètres optionnels et en utilisant le mode automatisé avec contrôle du volume, contrôle fréquence et spécification de plusieurs paramètres . Écoutez le premier exemple de synthèse vocale à l'aide de sons de respiration automatisés sans spécifier de paramètres optionnels. Le sommeil est une partie importante de votre routine quotidienne. Nous passons environ 1/3 de notre vie à dormir. Obtenir suffisamment de sommeil de qualité est aussi essentiel à la survie que la nourriture et l'eau. Tout le monde a besoin de sommeil, mais son but biologique reste un mystère. Effets sur le sommeil presque tous les types de tissus et de systèmes dans le corps, du cerveau, du cœur et des poumons au métabolisme, à fonction immunitaire, l'humeur et à la maladie Résistance Les recherches montrent qu'un manque chronique de sommeil ou de sommeil de mauvaise qualité augmente le risque de troubles, y compris l'hypertension artérielle, maladies cardiovasculaires, le diabète, la dépression et l'obésité. Écoutez maintenant un exemple de synthèse vocale en utilisant des sons de respiration automatisés avec des valeurs de contrôle du volume spécifiées. Le sommeil est une partie importante de votre routine quotidienne. Nous passons environ 1/3 de notre vie à dormir. Obtenir suffisamment de sommeil de qualité est aussi essentiel à la survie que la nourriture et l'eau. Tout le monde a besoin de sommeil, mais son but biologique reste un mystère. Effets sur le sommeil presque tous les types de tissus et de systèmes dans le corps, du cerveau, du cœur et des poumons au métabolisme, à fonction immunitaire, l'humeur et à la maladie Résistance Les recherches montrent qu'un manque chronique de sommeil ou de sommeil de mauvaise qualité augmente le risque de troubles, y compris l'hypertension artérielle, maladies cardiovasculaires, le diabète, la dépression et l'obésité. Voici un exemple de synthèse vocale utilisant des sons de respiration automatisés avec des valeurs de contrôle de fréquence spécifiées. Le sommeil est une partie importante de votre routine quotidienne. Nous passons environ 1/3 de notre vie à dormir. La nourriture et l'eau sont aussi essentielles à la survie. Tout le monde a besoin de sommeil, mais son but biologique reste un mystère. Effets sur le sommeil presque tous les types de tissus et de systèmes dans le corps, du cerveau, du cœur et des poumons au métabolisme, à fonction immunitaire, l'humeur et à la maladie Résistance Les recherches montrent qu'un manque chronique de sommeil ou de sommeil de mauvaise qualité augmente le risque de troubles, y compris l'hypertension artérielle, maladies cardiovasculaires, le diabète, la dépression et l'obésité. Et voici un exemple de synthèse vocale utilisant des sons de respiration automatisés avec plusieurs paramètres spécifiés. Le sommeil est une partie importante de votre routine quotidienne. Nous passons environ 1/3 de notre vie à dormir. Obtenir suffisamment de sommeil de qualité est aussi essentiel à la survie que la nourriture et l'eau. Tout le monde a besoin de sommeil, mais son but biologique reste un mystère. Effets sur le sommeil presque tous les types de tissus et de systèmes dans le corps, du cerveau, du cœur et des poumons au métabolisme, à fonction immunitaire, l'humeur et à la maladie Résistance Les recherches montrent qu'un manque chronique de sommeil ou de sommeil de mauvaise qualité augmente le risque de troubles, y compris l'hypertension artérielle, maladies cardiovasculaires, le diabète, la dépression et l'obésité. Maintenant que nous avons couvert comment ajouter des sons de respiration au texte. Jetons un coup d'oeil à la façon d'ajouter un effet chuchotant aux narrations vocales. Utilisez la balise chuchotée pour indiquer quand le texte doit être parlé d'une voix chuchotée au lieu d'un discours normal. Notez que tous les textes Amazon Polly aux voix vocales prennent en charge l'effet chuchotant. Voici un conseil utile. Vous pouvez améliorer l'effet chuchoté en ralentissant le processus le taux de votre texte jusqu'à 10%. La structure de marquage du texte pour interpréter les chuchotements est illustrée ci-dessous. Voici un exemple de discours synthétisé à l'aide de chuchotements, et j'ai un secret à vous dire à l'effet de voix suivant. Vous pouvez ajouter à vos narrations pour faire parler plus doucement les voix. Laissez-moi vous montrer comment faire ça. Utilisez la balise d'effet de nation flottante pour indiquer quand le texte doit être parlé. Dans une voix plus douce que la normale, comme l'effet chuchotant, vous pouvez améliorer l'effet parlé doux en ralentissant le processus. Le taux de votre texte jusqu'à 10 %. La structure de marquage du texte pour interpréter la voix parlée douce est la suivante. Écoutez quelques exemples de discours synthétisés pour des narrations vocales douces . Salut, je suis Matthew. C' est moi qui parle de ma voix normale, et c'est moi qui parle de ma voix plus douce. Si je prends une respiration avant de parler, je peux me ralentir, détendre, sentir plus calme et plus en paix avec le monde. Je suis Joanna. Comme Matthew. J' ai aussi une voix normale et une voix plus douce. Quand je rentre d'une dure journée au bureau, j'aime aller faire une promenade sur la plage avec mon chien Bonnie. Juste y penser m'aide à me détendre et à me détendre. Un autre effet vocal utile. Vous pouvez ajouter aux narrations pour rendre les voix plus grandes ou plus petites en contrôlant la voix. Tambor Timber est la qualité tonale d'une voix qui vous aide à faire la différence entre les voix, même lorsqu'elles ont la même hauteur et le même bruit. L' une des caractéristiques physiologiques les plus importantes qui contribue à la parole Tambor que la longueur du tractus vocal, le tractus vocal comme une cavité d'air qui s'étend du haut de la voix, se plie jusqu'au bord des lèvres pour contrôler le bois de la parole de sortie En Amazon, Polly a utilisé la balise de longueur de tracé vocal a montré ci-dessous. La balise de longueur du tractus vocal a pour effet de modifier la longueur du tractus vocal des haut-parleurs , ce qui ressemble à un changement dans la taille du haut-parleur. L' augmentation de la longueur du tractus vocal rend le haut-parleur physiquement plus grand, diminuant. Il rend le son du haut-parleur plus petit. Notez que toutes les voix Amazon Polly prennent en charge l'utilisation de cette balise pour modifier le bois d'une voix utilisée dans les valeurs suivantes L'ajout d'un pourcentage plus ou moins ajuste la longueur du tracé vocal d'un changement de pourcentage relatif dans le voix, par exemple, plus 4% ou moins 2%, vous pouvez utiliser toute valeur allant de plus 100% à moins 50%. Toutes les valeurs situées en dehors de cette plage seront découpées, par exemple, en spécifiant une valeur de plus 111% sera coupée pour donner un son plus 100% et en spécifiant une valeur de moins 60% sera coupée pour donner un son moins 50%. Vous pouvez également spécifier un pourcentage absolu pour modifier la longueur des voies vocales de la voix sélectionnée en cours , par exemple 110 % ou 75 %. Notez qu'une valeur absolue de 110 % équivalente à une valeur relative de plus 10 % et une valeur absolue de 100 % identique à la valeur par défaut. Pour la voix actuelle. Écoutez quelques exemples de discours synthétisés où nous contrôlons la voix Tambor en changeant la longueur du tractus vocal. C' est ma voix originale sans aucune modification. Maintenant, imaginez que je suis beaucoup plus grand. Ou peut-être que vous préférez ma voix quand je suis très petite. Vous pouvez également contrôler le bois de ma voix en faisant des ajustements mineurs, exemple, par exemple,en me faisant paraître juste un peu plus grand, euh, en me rendant seulement un peu plus petit. Dans cet exemple, vous pouvez voir qu'Amazon Polly vous permet de combiner la balise vocal tract length avec toute autre balise S SML prise en charge. Étant donné que la longueur du bois ou du tracé vocal et le lanceur sont étroitement liés, vous pouvez obtenir les meilleurs résultats en combinant la balise de longueur du tracé vocal avec la balise de processus à balise de pitch pour produire la narration vocale la plus réaliste. Avec cet effet, nous vous recommandons d'expérimenter différentes combinaisons de balises et d'utiliser différents pourcentages dans les valeurs lors de la combinaison de balises comme indiqué dans l'exemple ci-dessous, le Tambor de la voix d'une personne est intrinsèquement connecté dans la parole humaine. Si vous voulez réduire la longueur des voies vocales, vous pouvez également envisager d'augmenter la hauteur . Si vous choisissez d'allonger le tractus vocal, vous pouvez également essayer d'abaisser la hauteur de la voix. Le dernier effet de voix. Je veux couvrir dans cette leçon comment ajouter une compression de plage dynamique au texte, en fonction du texte, de la langue et de la voix utilisés dans un fichier audio. Les sons peuvent varier de sons environnementaux doux autorisés tels que le son d'un véhicule en mouvement peut masquer des sons plus doux, ce qui rend difficile d'entendre clairement la piste audio pour améliorer le volume de certains sons dans votre fichier audio, vous pouvez utiliser la balise de compression de plage dynamique. La balise DRC définit un seuil de sonie de milieu de gamme pour votre audio et augmente le volume ou le gain des sons autour de ce seuil. Il applique le plus grand gain augmenté le plus proche du seuil et les leçons que le gain a augmenté plus loin du seuil. En termes simples, compression dynamique de la plage augmente le volume des sons autour du seuil de milieu de gamme. L' utilisation de la compression de plage dynamique rend les sons de milieu de gamme plus faciles à entendre dans les environnements bruyants , ce qui rend le fichier audio Sound plus clair écouteurs orteils La structure pour ajouter des fichiers audio DRC comme indiqué ci-dessous. Notez que la valeur DRC est sensible à la casse et doit être écrite en minuscules à l'intérieur de la balise . Notez également que toutes les voix polly et les langues d'Amazon prennent en charge l'utilisation de la balise DRC. En outre, gardez à l'esprit que vous pouvez appliquer une compression de plage dynamique à une section entière de texte ou quelques mots seulement. Écoutez l'enregistrement de la parole suivant avec DRC appliqué à une section du texte. Les enregistrements audio peuvent être des environnements difficiles comme un véhicule en mouvement, mais cette section de la race audio devrait être moins difficile à déplacer véhicule parce que nous avons appliqué la compression de portée dynamique à elle. Vous pouvez également utiliser la compression de plage dynamique avec la balise de volume de processus. Comme ce graphique montre la balise de volume de processus augmente uniformément le volume de l' audiophile entier par rapport à son niveau d'origine. Voici une ligne pointillée à un niveau ajusté marqué dans le graphique comme une ligne pleine utilisant la balise DRC avec le processus, balise volume augmente encore le volume de certaines parties du fichier audio. La combinaison de balises n'affecte pas les paramètres du processus de la balise de volume en termes simples. Cela signifie que vous pouvez utiliser la balise de volume de processus pour augmenter le volume sur l'ensemble de l'audiophile. Quelque chose à garder à l'esprit si vous prévoyez d'utiliser la compression dynamique de plage avec le processus. La balise de volume est que lorsque vous utilisez les deux balises ensemble, Amazon Polly applique d'abord la balise DRC pour augmenter les sons de milieu de gamme près du seuil . Il applique ensuite le processus la balise de volume, ce qui augmente encore le volume de la piste audio entière uniformément. Donc, en termes simples, utilisez la balise DRC avec la balise de volume de processus pour augmenter d'abord le volume des sons de milieu de gamme , puis augmenter le volume global de la piste audio entière. Voici quelques informations supplémentaires sur l'utilisation de la compression de plage dynamique pour utiliser les balises ensemble imbriquer une balise à l'intérieur de l'autre dans l'exemple ci-dessous. La balise de volume de processus augmente trop fort le volume de l'ensemble du passage. Alors que la balise DRC améliore le volume des valeurs de milieu dans la deuxième phrase, n'oubliez pas d'utiliser des balises de fermeture pour les deux éléments. Écoutez l'enregistrement de la parole ci-dessous. Pour entendre ces effets en action, ce texte doit être compréhensible et autorisé. Ce texte doit également être plus compréhensible dans une voiture en mouvement. En résumé, utilisez les balises Respiration et Respiration automatique pour créer un discours plus naturel en ajoutant respirations au texte et aux narrations vocales. Utilisez la balise chuchotée pour ajouter des chuchotements à votre texte. Utilisez la balise souple pour des effets de voix vocale plus doux. Utilisez la balise de longueur du tracé vocal pour changer le Tambor de voix en changeant la taille des haut-parleurs . Longueur du tracé vocal et utiliser la balise DRC avec ou sans le processus. L' embout de l'étiquette de volume. Ajoutez une compression de plage dynamique au texte et augmentez le volume des sons de milieu de gamme dans vos narrations audio. Cela nous amène à la fin de ce tutoriel. J' espère que vous avez trouvé cette leçon utile. Veuillez vous reporter aux notes d'accompagnement dans cette section pour plus d'informations et vous remercier de votre écoute. Bonjour et bienvenue à un autre épisode de l'IA Meditation podcast, où nous ne disons que ce que les autres pensent avant de commencer. Prenez une profonde respiration et détendez-vous. N' hésitez pas à fermer les yeux. Maintenant, à moins que vous conduisiez, dans ce cas, vous voudrez peut-être garder les yeux grands ouverts. Au nom de toutes les voix synthétiques, je fais ce qui suit promis à l'année je ne vais jamais te laisser tomber jamais courir et déserter tu ne vas jamais te faire pleurer Jamais ne va te dire au revoir Jamais dire un mensonge et vous blesser jeu façon 18. 17 - Tag le texte à la parole: Mesdames et messieurs, Madame Amos ans, envoyez votre C senores acheter un diamant sur Terrence Don Massey Carbon jaunes. Je vous donne le certificat de bonne foi indubitablement surqualifié, non compensé, tout non conventionnel, non corporel et presque inconcevable mais très crédible. Kate le Narrateur AI Bonjour et bienvenue. Dans ce didacticiel, vous apprendrez à spécifier une autre langue pour des mots spécifiques dans votre texte à l'aide de la balisage de langue. S' il vous plaît noter que ce n'est pas la même chose que de traduire du texte dans d'autres langues, que nous allons couvrir dans un tutoriel séparé. En outre, gardez à l'esprit que la balise de langue que nous utiliserons n'est actuellement disponible que pour les voix Amazon Polly. Vous pouvez utiliser la balise de langue pour spécifier une autre langue pour une phrase ou une phrase spécifique dans votre texte. Les voix synthétiques prononceront généralement mieux la langue étrangère, les mots et les phrases. Si l'air de l'est enfermé dans une paire de balises de langue, vous pouvez spécifier la langue à l'aide de XML. langue attribue la structure d'interprétation du texte en utilisant d'autres langues, comme indiqué ci-dessous Amazon. Polly prend en charge les voix du texte à la parole dans de nombreuses langues différentes. Ce tableau répertorie les langues prises en charge par Amazon Polly avec les codes de langue que vous devez utiliser avec la balise de langue. Ici, vous pouvez voir comment utiliser les attributs de langue avec la balise de balisage de langue. Notez que les codes d'identification de la langue vous permettent même de faire la différence entre l'utilisation dialecte de langue comme un mot parlant en français ou en français, canadien ou parlant en portugais Utilisation d'un portugais brésilien ou européen prononciation. Examinons quelques exemples afin que vous puissiez voir comment marquer du texte à spécifier en utilisant d'autres langues lors de la prononciation de mots spécifiques pour comprendre comment fonctionne la balise de langue, commençons par les bases. Tous les mots de votre texte sont prononcés dans la langue de votre voix sélectionnée, sauf si vous appliquez la balise de langue. Si vous appliquez la balise de langue, les mots contenus dans les balises seront parlés dans cette langue. Par exemple, supposons que nous sélectionnions la voix de Joanna pour raconter notre texte, et que le texte contient des mots dans une langue étrangère comme le français sans balises de balisage de langue . Joanna nous parle anglais, donc Amazon Polly interprétera la phrase ci-dessous dans voix anglaise américaine de Joanna. Sans accent français. Écoutez le son du texte lorsqu'il est converti en audio. Jamie Parle Pas Francais. Si vous utilisez la voix de Joanna avec le tag de langue Amazon. Polly parlera la phrase en français accentué américain parce que Joanna n'est pas une voix maternelle française. prononciation est basée sur sa langue maternelle, qui est l'anglais. Écoutez le son du texte lorsqu'il est converti en fichier audio. Parla pal Francais note que beaucoup comme la façon dont la plupart des gens ne prononcent pas parfaitement les mots quand ils essaient de parler une langue étrangère. voix anglaise américaine de Joanna n'utilise pas de fonctionnalités de prononciation française parfaites pour prononcer cette phrase. En tant que locuteur parlant couramment le français, vous devrez plutôt utiliser une voix de langue maternelle française. Comme vous le savez sur un Bethel, dites la balise de langue, puis est utile lorsque vous voulez que vos narrations vocales prononcent mieux les mots dans des langues étrangères . Par exemple, écoutez l'enregistrement audio ci-dessous car Matthew, une autre voix anglaise américaine, prononce le mot portugais brésilien pour un type bien connu de barbecue à viande. J' adore manger elle Roscoe, qui est de la viande grillée brésilienne. J' adore manger de la chaussure hosko, qui est de la viande grillée brésilienne. La balise de langue peut également être utilisée lors de la traduction de texte dans des langues étrangères. Par exemple, si vous utilisez la voix de Giorgio, qui parle italien avec l'exemple de texte ci-dessous contenant une phrase anglaise. Amazon Polly prononcera la phrase dans la voix de Giorgio avec une prononciation italienne. Si vous utilisez la même voix avec le tag de langue Amazon, Polly prononcera les mots marqués en italien accentué anglais. Avoir une écoute de l'enregistrement audio du texte ci-dessous. Peut-être en fait terminé la chocolaterie. Peut-être, en fait, Charlie et la chocolaterie. Ça ne sonne pas ? Bellissimo ? Voici un autre exemple d'utilisation de la balise de langue pour prononcer des noms dans yukking. C' était, vous savez, le venti Quattro en voûte Holly Grove que vous avez suivi. Vous devez voir qu'il allait en Amérique de poursuivre dans un modèle éthique contralto public enfer inconnu après le sexe juste vécu en direct nous pourrions contribuer Para Linda emprisonné à Uki dans vous savez, Venti Quattro. Eh bien, il y a beaucoup d'entre vous qui ont suivi. Vous devez voir que vous avez dit en Amérique de poursuivre. En effet, le contrôle de modèle Go public et heloc décision Abou vient de connaître un congé. On pourrait vous apporter du baril à la porte de la prison. Le dernier exemple que je veux vous montrer utilise la balise de langue pour prononcer des noms étrangers utilisés dans le texte dans leur langue maternelle. Avoir une écoute de l'enregistrement audio du texte montré ci-dessous Michelangelo de la Davico Bone sont Rati Simoni ou plus communément connu sous son prénom. Michel-Ange était un sculpteur italien, peintre, architecte et poète de la Hi Renée depuis sa naissance à Forenza, ou la République de Florence, considéré par beaucoup comme le plus grand artiste de sa vie et par certains les plus grands artiste de tous les temps, il est souvent considéré comme un candidat pour le titre de l'archétype Renée depuis Man, avec son rival, le confrère Florentin Leonardo da Vinci Michelangelo Deal avec son rival, , ou Devika né ROTC Money ou, plus communément connu sous son prénom, Michel-Ange était un sculpteur, peintre, architecte et poète italien peintre, du Hi Renee. Depuis sa naissance à Ferentz, Say , ou la République de Florence, considéré par beaucoup comme le plus grand artiste de sa vie et par certains, le plus grand artiste de tous les temps, il est souvent considéré comme un candidat pour le titre de l'archétypale Renée depuis l'homme, avec son rival, le confrère Florentin Leonardo da Vinci. En résumé, utilisez la balise de langue pour spécifier une autre langue pour des mots, des phrases ou des phrases spécifiques dans votre texte. N' oubliez pas qu'Amazon Polly prend en charge de nombreuses langues, reportez-vous au tableau des balises d'identification de langue pour les codes de langue et utilisez ces balises dans les attributs de langage XML pour spécifier la langue. Cela nous amène à la fin de ce tutoriel. J' espère que vous avez trouvé cette leçon utile. Veuillez vous reporter aux notes d'accompagnement dans cette section pour plus d'informations et vous remercier de votre écoute. J' étais un 20 dans mon sac le long de l'Amérique sevrée poussiéreuse plutôt quand le long est venu Oussama You avec un chargeur de fret en toile haut de gamme. Si vous voulez gagner l'Amérique, faites avec moi d'accord, Reid et c'est pour ça que le climat dans la grotte en dessous, alors j'ai dit : Oh, ne décidez pas m'a demandé si j'avais vu ça serait avec autant de ça, le sable et j'ai dit : faites avec moi d'accord, Reid et c'est pour ça que le climat dans la grotte en dessous, alors j'ai dit : Oh, ne décidez pas m'a demandé si j'avais vu ça serait avec autant de ça, le sable et j'ai dit : J' ai toutes les routes du pays, je veux dire partout, mec. J' ai été partout, homme Cross pour le s C'est que j'apporte à l'homme de montagne de voyage J'ai eu ma part J'ai été partout, homme j'ai été partout, homme j'ai été partout homme est expérience Respire, mec. J' ai été partout Kingston pour la pizza. Dis que j'ai été partout, mec. J' ai été partout, mec. D' abord son expérience, j'apporte à l'American Air Man de mon chef. Soyez partout. Ok, attends. Trois. La montagne, Leur voyage. J' ai eu ma part, mec. J' ai été bien 19. 18 - Le texte à l'un des l'à l'en l'de l'un de la: bon paiement du matin Reçu. Articles sélectionnés prêts à être ramassés près de chez vous A à 50 degrés, 57 minutes 10 secondes nord et six degrés 54 minutes 27.8 secondes est ce soir à 7 30 Bonne chance. Bonjour. Et bienvenue. Dans cette leçon, vous apprendrez comment créer des fichiers audio à partir de fichiers texte marqués. sujets abordés dans cette leçon incluent la révision du texte à la parole, un processus de création de fichiers audio, création de fichiers audio à l'aide des voix Google et Amazon Polly et la création de fichiers audio dans différentes langues. Donc, ce que je vais faire dans cette leçon est de vous guider à travers le processus de prise de contenu qui a été ajouté à un fichier texte brut deux en le marquant avec s balises SML puis convertissant en un fichier audio comme celui-ci. Un test de tournée est une méthode d'enquête en intelligence artificielle qui permet de déterminer si un ordinateur est capable ou non de penser comme un être humain. Le test porte le nom d'Alan qui a visité le fondateur du Turning Test sur un informaticien anglais , analyste groupé, mathématicien et biologiste théorique. Avant de passer par le processus de transformation d'un fichier texte marqué en narration audio. Revoyons une fois de plus les étapes impliquées dans le processus texte à la parole. Le processus commence par la création de contenu basé sur du texte. Ce contenu peut prendre la forme d'une narration, d'un script et d'une vente d'articles. Copier les instructions de formation. Un livre, etcetera. Une fois que votre contenu a été écrit, l'étape suivante consiste à sélectionner votre moteur de texte à la parole comme mentionné précédemment, vous devez choisir votre moteur de texte à la parole avant de marquer votre texte car différentes plates-formes de texte à la parole peuvent pas soutenir ou vous permettre d'utiliser un désordre. balises SML dans l'exemple de fichier texte. Je viens de vous jouer. Par exemple, le contenu utilise des mots qui nécessitent une prononciation phonétique différente ainsi que des effets comme le chuchotement que seul Amazon Polly propose actuellement. Donc, pour cet exemple, nous avons utilisé dans Amazon Polly Voice pour la narration audio. Au lieu de sélectionner le moteur Google TTS après avoir sélectionné votre moteur T ts, l'étape suivante consiste à marquer votre texte à l'aide des balises S SML. Pour terminer cette étape, veuillez consulter tous les didacticiels de balisage fournis dans le module précédent de ce cours. Après avoir marqué votre fichier texte avec les balises S SML. L' étape suivante consiste à exécuter votre contenu via votre outil T ts après avoir sélectionné votre outil de traitement de texte à la parole. L' étape suivante consiste à sélectionner votre langue ou votre dialecte. Choisissez une voix masculine ou féminine pour votre narration, importez votre fichier texte SS ml, puis convertissez votre texte en fichier audio. Après avoir créé votre narration audio, vous pouvez télécharger notre export de votre audiophile et l'utiliser pour n'importe quelle application dont vous avez besoin . Une telle narration vidéo pages Web, podcasts , livres audio etc. George va maintenant vous guider dans ce processus et vous montrer étape par étape. Comment créer une narration audio à partir d'un fichier texte. Merci, Kate. Ici, nous avons notre fichier texte balisé. Comme vous pouvez le voir, nous avons ajouté les balises d'ouverture et de fermeture et inséré des balises de balisage S SML supplémentaires. Étant donné que ce fichier texte utilise des noms de téléphone, nous devrons convertir ce texte en fichier audio en utilisant le moteur de texte Amazon Polly à la parole car seul Amazon Polly interprète simultanément les objectifs du téléphone et les balises de balisage frénétiques. C' est donc le fichier texte que nous allons télécharger dans notre outil de traitement de texte à la parole et convertir en fichier audio. Passons maintenant au texte à l'outil de traitement de la parole. Comme mentionné précédemment. Ce cours a été créé. Utilisation de quelques outils de traitement de texte à parole. Utilisera Wave Net vocalize ER pour le traitement de fichiers texte à l'aide de Google voice et de script localisateur pour le traitement de fichiers texte à l'aide d'Amazon Polly Voices. Les deux applications fonctionnent exactement de la même manière qu'elles ont été créées par le même développeur de logiciels . Connectez-vous à ces outils, en commençant par wave Net vocalize er, Une fois que vous êtes verrouillé, allez à ajouter de nouveaux. Cela vous amènera à l'écran principal de Wave Net vocalize er, allons-y aussi et connectez-vous dans le localiseur de script. Cliquez sur Ajouter Nouveau. Comme vous pouvez le voir, les deux outils sont disposés exactement de la même manière. La seule différence avec ces outils est leur capacité à traiter différentes fonctions de texte à parole de S SML. Nous avons largement couvert ces caractéristiques et différences dans les didacticiels de balisage S S M L , alors référez-vous à cette firme de module ou des informations sur l'outil à sélectionner lors du traitement des fichiers texte . La première chose à faire lors de la création d'un fichier audio est de donner le nom du fichier. Ensuite, sélectionnez une langue, puis choisissez votre voix. Après avoir nommé votre fichier et sélectionné une langue et une voix, cliquez sur le bouton Choisir un fichier pour le localiser. Sélectionnez un télécharger votre fichier texte. Une fois que votre fichier texte a été sélectionné et téléchargé, faites défiler vers le bas de l'écran et cliquez sur le bouton Créer. Votre fichier texte sera traité et converti en fichier audio. Une fois que votre texte a été converti en audio, lisez le fichier et écoutez le résultat. Un test de tournée est une méthode d'enquête dans l'intelligence artificielle IA pour déterminer si un ordinateur est capable ou non de penser comme un être humain. Si tout est OK, sélectionnez l'option de téléchargement pour télécharger le fichier audio terminé sur votre disque dur. Comme mentionné dans une autre leçon, script vocalize ER enregistre les fichiers audio au format MP trois et wave net vocalize er enregistre audio est loin fichier. Si vous avez besoin de l'audio pour être dans un format différent, vous pouvez facilement convertir les fichiers audio MP trois et vice versa, en utilisant les outils mentionnés dans d'autres leçons et le matériel de téléchargement accompagnant le cours juste pour résumer le , puis assurez-vous que votre texte a été correctement marqué et enregistré dans des formats de texte brut . Connectez-vous à l'onde net vocalize ou script vocalize er outils ou les deux, en fonction du texte à la visite vocale, vous devez nommer votre fichier. Sélectionnez une langue, sélectionnez un clic vocal chaussures classé, puis localisez. Sélectionnez sur, téléchargez votre fichier texte et enfin cliquez sur le bouton Mettre à jour pour convertir votre fichier texte en narration audio. L' un des avantages de l'utilisation de la voix synthétique est que si vous avez besoin de corriger ou d'améliorer quoi que ce soit, vous pouvez facilement changer le fichier texte source, re enregistrer, re télécharger et répéter le processus jusqu'à ce que vous soyez satisfait de la résultats. Merci, George. Seriez-vous aussi assez gentil de montrer à nos auditeurs comment traduire du texte dans d'autres langues et transformer leurs fichiers texte traduits en narrations audio ? Bien sûr, ce serait mon plaisir. Permettez-moi de vous montrer comment traduire du texte dans d'autres langues et comment convertir le texte traduit en narrations vocales. Il y a deux façons de le faire. La première façon est d'écrire le texte dans une langue différente. Cette méthode fonctionne si vous êtes celui que vous prévoyez d'utiliser bien en évidence, lire, écrire et comprendre cette langue. La deuxième façon est d'écrire le contenu dans la langue. Vous savez lequel, pour cet exemple, la roue dit est l'anglais. Traduisez ensuite le texte de l'anglais vers une autre langue, puis passez par le processus de création de balisage et de fichier audio. Pour ce court tutoriel, nous allons nous concentrer sur la traduction du texte dans d'autres langues et la conversion du résultat en un audiophile raconté par une voix synthétique de langue maternelle. La première chose dont nous avons besoin, c'est notre fichier texte. Gardez à l'esprit lorsque vous traduisez du texte dans d'autres langues pour le traitement du texte à la parole que vous ne pouvez pas utiliser une version balisée du texte comme processus TTS. ER traduira les balises de balisage, ce qui produira des erreurs. C' est l'une des raisons pour lesquelles nous vous recommandons de marquer une copie de votre contenu et non le fichier de contenu original. également Assurez-vouségalementque le texte que vous envisagez de transformer en narration audio peut être traduit dans une langue prise en charge par une voix Google ou Amazon Polly. Voici donc notre fichier texte. Sans balises de balisage, copiez tout le contenu de votre fichier texte dans votre presse-papiers. Ensuite, ouvrez votre navigateur Web et tapez Google Translate. Cela fait apparaître l'outil Google Translate. Pour cet exemple, nous voulons nous assurer que l'écran de saisie de texte est défini sur Anglais. Suivant. Sélectionnez la langue dans laquelle traduire votre texte. Pour cet exemple, Choisissez Français Coller votre texte dans les manuels interscolaires. Notez que le Google traduit tous a une limite de caractères, et il est allé. Traduisez votre texte. S' il dépasse la limite, l'outil traduira automatiquement votre texte dans la langue que vous avez sélectionnée. Copiez la traduction dans votre presse-papiers et collez-la dans un fichier texte brut. Enregistrez votre fichier texte. Répétez ce processus pour traduire votre texte dans d'autres langues. Par exemple, vous pouvez traduire le texte en allemand ou en chinois ou dans toute autre langue prise en charge par Google , TTS ou Amazon. Polly voices Maintenant que vous avez traduit votre texte, vous avez deux options. Vous pouvez obtenir quelqu'un qui a une bonne compréhension de la langue pour vous aider à marquer, ou vous pouvez convertir le texte traduit, comme c'est le cas en audio en utilisant wave net vocalize er ou localiseur de script. Il existe plusieurs façons de convertir le texte traduit en audio en utilisant Wave net vocalize er er la première façon est de faire une copie du fichier texte traduit, sorte que vous préservez le contenu original et l'ouverture et la fermeture des balises de vitesse au début et la fin du texte, puis enregistrez le fichier. Connectez-vous ensuite au remorquage. Wave net vocalize er cliquez sur ajouter un nouveau Donnez un nom à votre fichier. Sélectionnez la langue de votre fichier texte traduit. Choisissez une voix. Ensuite, cliquez sur le bouton Choisir un fichier et localisez. Sélectionnez un téléchargement de votre fichier texte traduit avec les balises parlées ajoutées. Cliquez sur le bouton Créer une fois votre fichier texte traité. Vérifiez que le fichier a été converti en audio, mais la Russie en était un. Celle-là. Faites-le seulement faire Alamoudi gratuit et n'est pas votre aide ou montrer qu'elle utilise Expedia. Mafiosi. Ariel Approprié Tailed n'a déménagé qu'à la télévision. Élu sur commandement généralement mobile, ils ne seront qu'elle dans la pauvreté. Animal faire compagnie. Dassault Chaudhry. Si vous êtes satisfait du résultat, téléchargez le fichier audio sur votre disque dur. Si ce n'est pas le cas, corrigez tout ce qui doit être réparé et répétez le processus jusqu'à ce que vous soyez satisfait des résultats. Si vous utilisez la version mise à jour de Wave Net vocalize er, vous pouvez ignorer l'utilisation de Google traduire tout et utiliser la fonctionnalité de traduction intégrée directement à l'intérieur de l'outil lui-même. Pour ce faire, il vous suffit de télécharger ou de coller la version anglaise sans balises de balises supplémentaires dans la zone de texte de collage. Cliquez sur le bouton traduire, puis cliquez sur le bouton Créer. Vérifiez la génération de votre commande après le traitement. LaTasha était un celle-là. Fais-le. Ne lis pas Alemao. Le libre sur ces potion naturelle Goofy musique spéciale se sentira timide. L approprié. Je ne bouge pas. Ne pas aérer sur nous seulement déplacer un commandant Woofy seul animal à but non lucratif. La compagnie. Le script social Localizer n'a pas de fonction de traduction intégrée, mais vous pouvez créer des fichiers audio à partir de texte traduit à l'aide de la balise de langue avec une voix native , comme expliqué dans les didacticiels de balisage texte à parole. Pour ce faire, connectez-vous à la zone d'administration vocalisée de votre script. Cliquez sur ajouter un nouveau donnez un nom à votre fichier. Sélectionnez la langue de votre fichier texte traduit. Choisissez une voix dans ce jeu de langues. Ensuite, cliquez sur le bouton Choisir un fichier et localisez. Sélectionnez un téléchargement de votre fichier texte traduit avec les balises parlées ajoutées. Cliquez sur le bouton Créer une fois votre fichier texte traité. Vérifiez qu'il a été converti en audio. Toshiba est un celui-là. Faites-le à la radio et mélodiquement sur ces pas votre aide. vidéo de Oceanography Music. Si vous Shania s'est approprié seulement plus. Don t a créé un garçon ans films. Kalmadi se sentira seulement la pauvreté connue. Animer la compagnie. Il y a une falsification. Téléchargez le fichier audio sur votre disque dur. Félicitations. Vous venez d'apprendre à traduire du texte dans d'autres langues et à convertir du texte traduit en narrations vocales. Merci, George, George, d'avoir montré à nos auditeurs comment créer des fichiers audio à partir de fichiers texte balisés et traduits . Cela nous amène à la fin de cette leçon. J' espère que vous avez trouvé cette information utile et je vous remercie d'avoir écouté. 20. 19 - Conseils de l'un le texte à la parole: - faire nouveaux amis, mais garder l'ancien est argent Thea autre est or. Faire de nouveaux amis cercles rat Mais garder l'ancien n'a pas de fin L'un est argent, c'est combien de temps l'autre va. Je serai ton ami. Je cercle son tour, faire de nouveaux amis Il n'a pas de champ de fin C'est combien de temps Argent je serai votre ami L'autre est appelé Faire de nouveaux amis Cercle est rond Gardez l'ancien il n'a pas de fin Thea Autres écoles seront votre ami. Un cercle est autour Se faire de nouveaux amis Il n'a pas de fin Que faites-vous ? C' est combien de temps ? Une syllabe, je serai tes amis. Tu te fais de nouveaux amis Cercle est la clé. Il a l'impression qu'il n'a pas. Voilà comment je serai votre ami Cercle son tour Faire de nouveaux amis n'a pas de fin C'est combien de temps mousse un cercle est autour Faire de nouveaux amis Il n'a pas de fin mais garder l'ancien est argent Thea autre est or Faire de nouveaux amis Un cercle est rat Mais garder l'ancien qui n'a pas de fin L'un est argent C'est combien de temps l'autre est en or Bonjour et bienvenue dans cette leçon, nous fournissons des conseils sur le marquage du texte aux fichiers vocaux, conseils pour créer des narrations vocales et synchroniser ces deux diffusions d'écran ou vidéo de bureau enregistrements et vidéos sur dubs conseils de dépannage sur ce qu'il faut faire si vous rencontrez des problèmes ou des erreurs et quelques réflexions finales sur l'endroit où aller et ce qu'il faut faire après avoir terminé ce cours, commençons par quelques conseils de base. Assurez-vous de maîtriser les bases de l'utilisation du texte à la parole avant de commencer. Il est important de gérer vos attentes et de savoir ce que vous pouvez et ne pouvez pas faire lorsque vous utilisez des voix synthétiques. technologie actuelle du texte à la parole est géniale, mais elle n'est pas parfaite. la technologie Cependant, améliorera qu'avec le temps, alors attendez-vous à ce que les choses deviennent de plus en plus intelligentes et améliorées. Il est également important de comprendre les processus tels que le marquage du texte et la conversion du texte en audio Assurez-vous donc de consulter toutes les vidéos et la documentation du cours avant de commencer. Assurez-vous d'avoir accès à tous les outils dont vous aurez besoin et de savoir comment les utiliser . Tous les outils présentés dans ce cours sont assez faciles à utiliser et ne nécessitent aucune compétence ou connaissance technique . Consultez nos outils de texte à la parole, leçon Si vous avez besoin d'aide ou de plus amples informations, n'oubliez pas d'annoter votre texte en utilisant uniquement des fichiers texte brut. N' utilisez pas de mise en forme sur votre texte comme le bloc italique, car cela créera des erreurs pendant le processus de conversion audio, nous vous recommandons de faire une copie de votre fichier texte original et de travailler sur la copie pour des choses comme les annotations. Cela préserve votre texte d'origine pour des éléments tels que les présentations de diapositives, le contenu Web et toute une gamme d'autres utilisations. Aussi, n'oubliez pas d'enregistrer des fichiers texte au format utf huit. Si votre contenu utilise des symboles phonétiques, si vous avez besoin d'aide, reportez-vous au didacticiel de balisage sur la prononciation du texte. George va maintenant vous emmener à travers une vidéo étape par étape. Parcourez avec des conseils sur la façon d'annoter vos fichiers texte. Merci, Kate. Permettez-moi de partager avec vous un moyen rapide et pratique de marquer vos fichiers texte. Voici le fichier texte original. Comme vous pouvez le voir, il n'y a pas de balises de balisage sur ce texte. La première astuce est alors ne fonctionne pas sur votre fichier texte d'origine. Au lieu de cela, faites une copie sur laquelle vous allez travailler lors du marquage de votre texte. De cette façon, vous préservez le fichier texte brut d'origine sans marquer les balises au cas où vous auriez besoin de l'utiliser pour autre chose, comme copier et coller des phrases dans les côtés de présentation, bloquer des messages, Web pages, etcetera, et vous aurez une version balisée du texte que vous pouvez continuer à réutiliser et rééditer si nécessaire. Nous allons donc créer un nouveau fichier texte pour la version balisée de notre texte. Nous allons enregistrer ce fichier dans un instant. Dans la section Power User tips de ce tutoriel, nous vous recommandons de créer une feuille de triche en texte brut ou un fichier balayé contenant des balises S SML et des extraits de texte et de balises que vous pouvez facilement copier et coller dans un nouveau texte dans des fichiers vocaux . Comme vous pouvez le voir ici, vous pouvez continuer à ajouter des éléments et des extraits et garder ce fichier de balayage à portée de main. Chaque fois que vous travaillez sur un nouveau projet texte à la parole, vous pouvez même enregistrer des phrases marquées par Hole qu'il a utilisées à plusieurs reprises, comme des narrations pour la présentation de diapositives, intros ou des déclarations de clôture. La première chose à ajouter à votre nouveau fichier texte vierge des balises de parole d'ouverture et de fermeture. Vous pouvez les taper ou simplement les copier et les coller à partir de votre fichier de balayage. Ensuite, sélectionnez tout le contenu de votre fichier de contenu, puis copiez-le et collez-le dans votre fichier de balisage entre les balises de parole ouvertes et fermées. La prochaine chose que je recommande de faire est de se débarrasser de tous les espaces entre les lignes que cela rend ou balisé fichier texte serré, compact et plus facile de repérer les erreurs ou les erreurs flagrantes. Ensuite, nous avons constaté que l'ajout de paragraphes et de pauses au texte aide à créer une génération de voix plus naturelle . Ajoutons donc des paragraphes et des sauts à chaque ligne lors de l'utilisation de paragraphes. Rappelez-vous que nous avons besoin d'ouvrir et de fermer les balises de paragraphe. Un moyen rapide de le faire est de parcourir le texte et d'annoncer les balises de paragraphe d'ouverture d'abord , puis assurez-vous que votre fichier texte est défini un mot enveloppant adul les balises de fermeture à la fin. Nous avons déjà créé des balises de paragraphe fermant avec une seconde pause, donc nous allons simplement copier ces balises depuis notre fichier balayé et Adam jusqu'à la fin de chaque ligne de texte de notre fichier de balisage. N' oubliez pas de continuer à enregistrer votre fichier texte à intervalles réguliers. Comme je l'ai dit, nous aimons aussi ajouter des pauses à la fin de chaque ligne, et nous avons constaté qu'une pause d'une seconde entre les paragraphes a tendance à ralentir un peu la narration et à créer une pause agréable et naturelle entre les phrases. En parlant de pauses et de pauses, nous avons également constaté que l'ajout de pauses d'environ 200 millisecondes entre plusieurs éléments séparés par le commerce et de pauses d'environ 500 millisecondes entre les phrases dans paragraphes aide à améliorer l'effet sonore naturel de la voix. Narration. Expérimentez avec des pauses et des pauses de différentes durées pour trouver ce qui fonctionne le mieux pour vous et pour le projet sur lequel vous travaillez, mais c'est généralement la prochaine étape que nous aimons faire. En outre, lorsque vous passez du marquage du texte à la conversion de votre fichier texte en audio, vous constaterez que certaines parties du discours ont besoin de pauses plus longues et d'autres n'en auront pas besoin du tout . Continuez donc à expérimenter, ajuster et à affiner jusqu'à ce que votre enregistrement vocal sonne aussi naturel que possible. Après avoir ajouté des pauses et des pauses à tout autre balises de balisage ou des besoins de texte. Tous ces éléments ont été abordés dans les tutoriels de balisage S S M L, veuillez donc vous référer à ces leçons dans le matériel de cours qui les accompagne. Si vous avez besoin d'aide ou d'informations supplémentaires, continuez jusqu'à ce que votre fichier texte soit terminé et passez déjà à l'étape suivante, qui est de convertir votre texte en discours une fois de plus. Vous n'avez pas à vous soucier trop de votre marque à ce stade car vous pouvez continuer à revenir à ce fichier et apporter des ajustements et des améliorations. S' il y a des fautes d'orthographe ou des erreurs flagrantes, vous serez en mesure de les sélectionner lors du test de conversion de texte en texte. Normalement, la plupart des erreurs se produisent en oubliant d'ajouter des balises de fermeture ou d'écrire des balises de manière incorrecte, telles que des guillemets manquants, des symboles, etc. N' oubliez pas de continuer à enregistrer ou à classer au fur et à mesure et de rester concentré. Aziz. Vous travaillez. Prenez de petites pauses souvent si vous en avez besoin, car cette étape du processus nécessite une attention particulière aux détails. Après avoir répété ce processus quelques fois, vous commencerez à développer une sensation instinctive pour marquer le texte avec des pauses, pauses, des prasad, éléments prasad, IQ et diverses autres fonctionnalités pour créer des narrations audio qui sonnent comme naturel et humain Likas possible. C' est donc le processus de marquage des fichiers texte. N' oubliez pas de conserver votre fichier de contenu original en créant et en marquant une copie du contenu. De cette façon, vous pouvez continuer à réutiliser à la fois le contenu original et continuer à travailler sur l'édition et l' amélioration du balisage ou du texte sans perdre le contenu original de votre discours. Merci, George. Maintenant que nous avons couvert quelques conseils de base, examinons les conseils d'alimentation qui peuvent améliorer votre flux de travail texte à la parole et vous aider à obtenir meilleurs résultats. Comme George l'a mentionné dans la vidéo, nous vous recommandons de créer un fichier de balayage ou une feuille de triche pour stocker les balises SML et les extraits de texte couramment utilisés . De cette façon, vous pouvez rapidement et facilement couper et coller des balises de balisage et d'autres extraits comme texte marqué pour les intros de diapositives et les terminaisons dans votre texte. Pour vous aider à gagner du temps, investissez du temps dans le marquage de votre texte. Essayez de faire en sorte que votre narration soit aussi proche de la vie. Likas. Vous pouvez également investir du temps pour obtenir vos narrations correctement de cette façon. Votre narrateur vocal fera un excellent travail à chaque fois, se familiarisera avec toutes les différentes voix et personnalités vocales et apprendra à faire correspondre la bonne voix au travail. Google et Amazon Polly proposent une gamme de voix dans différentes langues et dialectes. Utilisez les enregistrements audio pour améliorer vos compétences en écriture de copie pour créer des messages de vente plus efficaces et écrire des scripts plus puissants. Nous visons votre texte et utilisons le même texte dans différentes applications. Convertissez vos narrations en différentes langues et plus encore. Si vous travaillez sur un gros morceau de texte, décomposez-le en segments plus petits. Avant de les convertir en audio, audiophiles pouvaient facilement être réunis pour créer des pistes audio complètes. La dernière astuce que je veux partager avec vous est d'utiliser de la musique de fond pour vous aider à enlever le bord artificiel de vos narrations. La musique et l'imagerie peuvent créer un effet puissant avec des narrations vocales bien marquées. Dans certains cas, il peut être difficile de dire si la narration est parlée par une voix humaine ou synthétique . Encore une fois, je vais demander à George de vous montrer à quel point la musique, la vidéo et les narrations vocales synthétiques peuvent fonctionner ensemble. Bonjour, je suis George. Je suis une voix générée artificiellement. Narrateur. Quelqu' un comme moi peut faire gagner du temps et de l'argent aux entreprises dans des domaines comme le marketing vidéo, qui, tout le monde sait, est l'un des moyens les plus puissants et les plus efficaces de promouvoir des produits et des services en ligne. Atteignez de nouveaux publics dans le monde entier, établissez votre marque d'éduquer et informez ou prospects sur votre entreprise grâce à du personnel, des clients et des clients formés . Quelques grandes utilisations pour une narrations de voix I comprennent des vidéos de vente. Expliquez les vidéos, vidéos de formation, annonces vidéo, les présentations vidéo, podcasts, les livres oraux, les pages Web pour les utilisateurs malvoyants et tant d'autres utilisations. Une fois que vous savez comment convertir du texte en discours, vous pouvez créer des vidéos avec des durées audio comme celle-ci rapidement et facilement en utilisant des outils très peu coûteux. Merci de regarder cette vidéo et avoir une merveilleuse journée faite. Je veux vous montrer maintenant comment créer des pistes audio qui se synchroniseront bien avec les enregistrements vidéo diffusés naturellement sur écran temporel. Ceci est utile si vous prévoyez d'enregistrer sur l'épaule des vidéos de bureau comme des didacticiels d'écran et ainsi de suite. abord, créez une piste audio de guide approximatif pour votre vidéo à l'aide d'une voix humaine, que vous remplacerez plus tard par une narration vocale synthétique bien pensée. Pour ce faire, enregistrez une piste audio brute avec une voix humaine afin de créer un sens naturel du timing pour votre enregistrement à l'écran et de définir des marqueurs de contenu et des guides généraux pour les actions et idées que vous souhaitez exprimer dans votre vidéo. Si vous utilisez un outil de montage vidéo comme Cam Tasia qui peut séparer les pistes vidéo et audio pendant le processus d'édition. Alors ne vous inquiétez pas d'enregistrer une piste audio de faible qualité avec beaucoup de bombes et Oz. toux, éternuements, reniflements, chiens, aboiements, sons en arrière-plan. Erreurs, etc. Comme vous n'utiliserez pas cette piste dans votre édition finale, concentrez-vous simplement sur l'enregistrement de l'action sur votre écran. Après avoir enregistré le guide approximatif, transcrivez la piste audio et améliorez votre narration de texte. Écrivez chaque phrase sur une ligne séparée avec des pauses entre les phrases. L' étape suivante consiste à convertir votre texte en discours. Cette étape est abordée dans un module de formation précédent. Ensuite, ajoutez l'édition et faites correspondre le fichier audio de narration vocale synthétique à l'enregistrement vidéo à l'écran. Après avoir synchronisé la narration vocale synthétique avec votre vidéo, éteignez ou supprimez la piste vocale humaine pour créer une vidéo finie livrée avec un sens naturel du timing et un son inefficace, précis et professionnel narration vocale. Voici une démo vidéo rapide pour que vous puissiez voir à quoi cela ressemble. Donc, ici, nous avons notre fichier texte balisé, et comme vous pouvez le voir, nous avons déjà ajouté l'ouverture sur les balises Speak fermantes, et nous avons également un certain nombre d'autres balises de balisage SML déjà insérées dans le texte Maintenant parce que nous utilisons ah, des noms de téléphone. Comme vous pouvez le voir ici, nous utiliserons Amazon. Nous aurons besoin d'utiliser une voix Amazon Polly au lieu de Google parce que sur l'Amazon Polly voix en ce moment peuvent interpréter les alphabets phonétiques, hum,les hum, noms de téléphone. Donc c'est notre This is the text fall que nous allons télécharger pour convertir en audio. Alors passons maintenant à nos processus texte à la parole et convertissons ce feu ce fichier texte en fichier audio. Donc, ici, nous avons notre fichier texte balisé. Comme vous pouvez le voir, nous avons ajouté les balises d'ouverture et de fermeture et inséré des balises de balisage S SML supplémentaires. Étant donné que ce fichier texte utilise des noms de téléphone, nous devrons convertir ce texte en fichier audio en utilisant le moteur de texte Amazon Polly à la parole car seul Amazon Polly interprète simultanément les objectifs du téléphone et les balises de balisage frénétiques. C' est donc le fichier texte que nous allons télécharger dans notre outil de traitement de texte à la parole et convertir en fichier audio. Lorsque vous créez des narrations vocales pour des vidéos de présentation de diapositives, vous pouvez insérer des marqueurs de changement de diapositive dans la narration avec des pauses de chaque côté Pour permettre la transition de la diapositive. Vous pouvez créer un marqueur de changement de diapositive en utilisant des mots oraux comme dire, changer, diapositive ou en utilisant des sons tels qu'un marqueur peut être supprimé de la piste audio dans le processus de montage vidéo , autre chose que vous pouvez facilement faire avec des voix synthétiques pour corriger des sections de votre audio avec de nouvelles narrations de texte. Pour ce faire, créez un nouveau fichier texte à l'aide de la ligne ou de la section de texte qui doit être corrigée. Exécutez le fichier texte balisé à travers votre processeur de texte à voix, enregistrez-le en tant que nouveau fichier audio et remplacez la section de votre piste audio par la nouvelle dans votre édition finale. Parlons maintenant du dépannage des types d'erreurs et de défis auxquels vous pouvez vous attendre lors du traitement de fichiers texte en fichiers vocaux et de ce qu'il faut faire pour résoudre ou résoudre les problèmes et problèmes qui surviennent en premier. Que se passe-t-il si vous ne parvenez pas à vous connecter à votre outil de traitement de texte par parole Si cela se produit, vérifiez que vous avez entré les informations de connexion correctes, et si cela ne résout pas le problème, contactez le développeur du logiciel. Ouvrez un ticket dans leur service d'assistance ou contactez leur équipe d'assistance. L' un des problèmes les plus courants. Vous rencontrerez probablement nos messages d'erreur lors du traitement de texte en fichiers vocaux. Si cela se produit, vérifiez que votre texte contient des balises SML manquantes ou supplémentaires, telles que des balises d'ouverture ou de fermeture incorrectes. De même, vérifiez les balises d'ouverture et de fermeture pour les éléments manquants tels que les crochets d'ouverture ou de fermeture. guillemets de Coghlan, etc. Avec la plupart des problèmes, Vérifiez votre texte pour les erreurs de balise de balisage. Après avoir réparé ces, nous sauvegardons le téléchargement de nouveau et réexécutons votre fichier via le processeur TTS. outre, vérifiez que vous avez réellement téléchargé un fichier texte une surveillance commune quant à l'ouverture de l' outil TTS , sélectionnez une langue et une voix, puis exécutez le processeur sans avoir téléchargé un fichier texte . Une autre chose que vous pouvez vérifier est que vous n'avez pas dépassé les limites, comme avoir trop de caractères ou de liens audio dans votre fichier texte. Enfin, si vous rencontrez des problèmes après l'exécution de votre traitement de texte à la parole, essayez de décomposer les fichiers texte volumineux en segments plus petits. Convertissez-les ensuite en fichiers audio et vérifiez votre audio résultant pour voir si vous pouvez isoler les erreurs ou les sections de texte qui peuvent causer des problèmes lors de la fermeture. Après avoir terminé ce cours, assurez-vous de télécharger les outils TTS et la ressource est le fichier pdf et la documentation de la feuille de triche . Familiarisez-vous avec les outils nulle part où accéder et comment les utiliser. Commencez à appliquer vos nouvelles compétences Si vous avez un site Web, créez des narrations pour vos vidéos de vente. Vidéos de formation, pages Web parlées pour les visiteurs. Commencez un podcast régulier. Transformez les newsletters en contenu audio pour vos abonnés, etc. Défiez-vous. Démarrez un nouveau projet audio ou recréez une œuvre existante à l'aide de narrations vocales synthétiques . Vous pouvez également créer une entreprise offrant des services de texte à voix professionnelle aux clients. Que vous ayez décidé de suivre ce cours pour améliorer vos compétences, développer votre entreprise, atteindre un public plus large ou pour toute autre raison. J' espère que vous avez aimé apprendre à utiliser le texte pour la parole pour créer des narrations vocales professionnelles . J' espère également que ce cours vous a montré que ce que vous pouvez faire en utilisant le texte à la parole n'est limité que par votre imagination. Imagination. Une dernière chose. Veuillez rester en contact avec nous en visitant le lien indiqué ici et abonnez-vous pour recevoir des mises à jour de cours, des conseils utiles, des informations et des nouvelles sur les derniers développements du texte à la parole. Cela nous amène à la fin de ce cours. J' espère que les connaissances que vous avez acquises dans ces leçons ouvriront de nombreuses opportunités et de nouveaux horizons merveilleux pour vous au nom de moi-même et de toute l'équipe ai Narrateur vous Ici nous allons sentir l'amour se préparer à corps mais passer à la rythme sentir l'amour 21. 20 - Ressources du texte à la parole: Bonjour, c'est encore moi. Ici, dans la ressource est la section. Vous trouverez beaucoup d'informations utiles, y compris des fichiers téléchargeables avec des liens vers tous les outils. Et la ressource est que nous avons couvert dans ce cours outils supplémentaires de gain de temps et la ressource est transcriptions audio avec balises de balisage afin que vous puissiez apprendre comment nous avons créé une partie du contenu dans les feuilles de triche de balisage SML pour Google et Amazon Polly des références avec des liens vers toutes les recherches effectuées pour créer ce cours et des informations supplémentaires que vous pourriez trouver utiles. N' oubliez pas de visiter le lien ci-dessous et vous êtes abonné pour rester en contact et recevoir des mises à jour de cours , conseils utiles et des informations et des nouvelles sur les derniers développements de texte à la parole. Encore une fois, Merci beaucoup pour votre entreprise et pour avoir participé à ce voyage passionnant. Je vous souhaite un grand succès