chrome.tts

Description

Utilisez l'API chrome.tts pour lire du texte synthétisé par synthèse vocale. Consultez également l'API ttsEngine associée, qui permet à une extension d'implémenter un moteur vocal.

Chrome offre cette fonctionnalité sur Windows (avec SAPI 5), Mac OS X et ChromeOS, en utilisant les fonctionnalités de synthèse vocale fournies par le système d'exploitation. Sur toutes les plates-formes, l'utilisateur peut installer des extensions qui s'enregistrent en tant que moteurs vocaux alternatifs.

Autorisations

tts

Concepts et utilisation

Générer une voix

Appelez speak() depuis votre extension pour parler. Exemple :

chrome.tts.speak('Hello, world.');

Pour que j'arrête immédiatement de parler, dites simplement stop() :

chrome.tts.stop();

Vous pouvez fournir des options qui contrôlent diverses propriétés de la parole, telles que son débit, sa hauteur et plus encore. Exemple :

chrome.tts.speak('Hello, world.', {'rate': 2.0});

Il est également judicieux de spécifier la langue afin qu'un synthétiseur compatible avec cette langue (et le dialecte régional, le cas échéant) soit choisi.

chrome.tts.speak('Hello, world.', {'lang': 'en-US', 'rate': 2.0});

Par défaut, chaque appel à speak() interrompt toute parole en cours et parle immédiatement. Pour déterminer si un appel interromprait une activité, vous pouvez appeler isSpeaking(). Vous pouvez également utiliser l'option enqueue pour ajouter cette expression à une file d'attente d'expressions qui seront prononcées une fois l'expression actuelle terminée.

chrome.tts.speak('Speak this first.');
chrome.tts.speak(
    'Speak this next, when the first sentence is done.', {'enqueue': true});

Vous trouverez une description complète de toutes les options sous tts.speak(). Tous les moteurs vocaux ne sont pas compatibles avec toutes les options.

Pour détecter les erreurs et vous assurer d'appeler speak() correctement, transmettez une fonction de rappel qui ne prend aucun argument. Dans le rappel, vérifiez runtime.lastError pour voir s'il y a eu des erreurs.

chrome.tts.speak(
  utterance,
  options,
  function() {
    if (chrome.runtime.lastError) {
      console.log('Error: ' + chrome.runtime.lastError.message);
    }
  }
);

Le rappel est renvoyé immédiatement, avant que le moteur n'ait commencé à générer la parole. L'objectif du rappel est de vous alerter sur les erreurs de syntaxe dans votre utilisation de l'API TTS, et non de détecter toutes les erreurs possibles qui peuvent survenir lors de la synthèse et de la sortie vocales. Pour détecter également ces erreurs, vous devez utiliser un écouteur d'événements, décrit dans la section suivante.

Écouter les événements

Pour obtenir plus d'informations en temps réel sur l'état de la synthèse vocale, transmettez un écouteur d'événement dans les options de speak(), comme ceci :

chrome.tts.speak(
  utterance,
  {
    onEvent: function(event) {
      console.log('Event ' + event.type + ' at position ' + event.charIndex);
      if (event.type == 'error') {
        console.log('Error: ' + event.errorMessage);
      }
    }
  },
  callback
);

Chaque événement inclut un type d'événement, l'index de caractères de la parole actuelle par rapport à l'énoncé et, pour les événements d'erreur, un message d'erreur facultatif. Voici les types d'événements :

'start' : le moteur a commencé à prononcer l'énoncé.
'word' : une limite de mot a été atteinte. Utilisez event.charIndex pour déterminer la position actuelle de la parole.
'sentence' : une limite de phrase a été atteinte. Utilisez event.charIndex pour déterminer la position actuelle de la parole.
'marker' : un repère SSML a été atteint. Utilisez event.charIndex pour déterminer la position actuelle de la parole.
'end' : le moteur a fini de prononcer l'énoncé.
'interrupted' : cette expression a été interrompue par un autre appel à speak() ou stop() et n'a pas été terminée.
'cancelled' : cette expression a été mise en file d'attente, puis annulée par un autre appel à speak() ou stop(), et n'a jamais été prononcée.
'error' : une erreur spécifique au moteur s'est produite et cette expression ne peut pas être prononcée. Pour en savoir plus, consultez event.errorMessage.

Quatre types d'événements sont définitifs : 'end', 'interrupted', 'cancelled' et 'error'. Une fois l'un de ces événements reçu, cette expression ne sera plus prononcée et aucun nouvel événement de cette expression ne sera reçu.

Il est possible que certaines voix ne soient pas compatibles avec tous les types d'événements, voire qu'elles n'en envoient aucun. Si vous ne souhaitez pas utiliser de voix, sauf si elle envoie certains événements, transmettez les événements dont vous avez besoin dans le membre requiredEventTypes de l'objet options ou utilisez getVoices() pour choisir une voix qui répond à vos besoins. Les deux sont décrits ci-dessous.

Balisage SSML

Les énoncés utilisés dans cette API peuvent inclure un balisage à l'aide du langage de balisage de synthèse vocale (SSML). Si vous utilisez SSML, le premier argument de speak() doit être un document SSML complet avec un en-tête XML et un tag <speak> de premier niveau, et non un fragment de document.

Exemple :

chrome.tts.speak(
  '<?xml version="1.0"?>' +
  '<speak>' +
  '  The <emphasis>second</emphasis> ' +
  '  word of this sentence was emphasized.' +
  '</speak>'
);

Tous les moteurs vocaux ne sont pas compatibles avec toutes les balises SSML, et certains ne le sont pas du tout. Toutefois, tous les moteurs sont tenus d'ignorer les balises SSML qu'ils ne prennent pas en charge et de lire le texte sous-jacent.

Choisir une voix

Par défaut, Chrome choisit la voix la plus appropriée pour chaque énoncé que vous souhaitez prononcer, en fonction de la langue. Sur la plupart des systèmes Windows, Mac OS X et ChromeOS, la synthèse vocale fournie par le système d'exploitation devrait pouvoir lire n'importe quel texte dans au moins une langue. Certains utilisateurs peuvent avoir accès à différentes voix depuis leur système d'exploitation et depuis les moteurs vocaux implémentés par d'autres extensions Chrome. Dans ce cas, vous pouvez implémenter un code personnalisé pour choisir la voix appropriée ou présenter à l'utilisateur une liste de choix.

Pour obtenir la liste de toutes les voix, appelez getVoices() et transmettez-lui une fonction qui reçoit un tableau d'objets TtsVoice comme argument :

chrome.tts.getVoices(
  function(voices) {
    for (var i = 0; i < voices.length; i++) {
      console.log('Voice ' + i + ':');
      console.log('  name: ' + voices[i].voiceName);
      console.log('  lang: ' + voices[i].lang);
      console.log('  extension id: ' + voices[i].extensionId);
      console.log('  event types: ' + voices[i].eventTypes);
    }
  }
);

Types

EventType

Chrome 54 et versions ultérieures

Énumération

"start"

"end"

"word"

"sentence"

"marker"

"interrupted"

"cancelled"

"error"

"pause"

"resume"

TtsEvent

Événement du moteur TTS permettant de communiquer l'état d'un énoncé.

Propriétés

charIndex

number facultatif

Index du caractère actuel dans l'énoncé. Pour les événements de mots, l'événement se déclenche à la fin d'un mot et avant le début du suivant. charIndex représente un point dans le texte au début du prochain mot à prononcer.
errorMessage

chaîne facultatif

Description de l'erreur, si le type d'événement est error.
longueur

number facultatif

Chrome 74 et versions ultérieures

Longueur de la prochaine partie de l'énoncé. Par exemple, dans un événement word, il s'agit de la longueur du mot qui sera prononcé ensuite. Si le moteur vocal ne le définit pas, il sera défini sur -1.
type

EventType

Le type peut être start dès que la parole a commencé, word lorsqu'une limite de mot est atteinte, sentence lorsqu'une limite de phrase est atteinte, marker lorsqu'un élément de repère SSML est atteint, end lorsque la fin de l'énoncé est atteinte, interrupted lorsque l'énoncé est arrêté ou interrompu avant la fin, cancelled lorsqu'il est supprimé de la file d'attente avant d'être synthétisé ou error lorsqu'une autre erreur se produit. Lorsqu'une activité vocale est mise en pause, un événement pause est déclenché si une expression particulière est mise en pause au milieu, et resume si une expression reprend l'activité vocale. Notez que les événements de pause et de reprise peuvent ne pas se déclencher si la parole est mise en pause entre les énoncés.

TtsOptions

Chrome 77 et versions ultérieures

Options vocales du moteur de synthèse vocale.

Propriétés

desiredEventTypes

string[] facultatif

Types d'événements TTS que vous souhaitez écouter. Si cette valeur est manquante, tous les types d'événements peuvent être envoyés.
mettre en file d'attente

booléen facultatif

Si la valeur est "true", met en file d'attente cette énonciation si la synthèse vocale est déjà en cours. Si la valeur est "false" (par défaut), toute parole en cours est interrompue et la file d'attente de parole est vidée avant de prononcer cette nouvelle expression.
extensionId

chaîne facultatif

ID d'extension du moteur vocal à utiliser, le cas échéant.
gender (genre)

VoiceGender facultatif

Obsolète depuis Chrome 77

Le genre est obsolète et sera ignoré.
Genre de la voix pour la synthèse vocale.
lang

chaîne facultatif

Langue à utiliser pour la synthèse, au format langue-région. Exemples : "en", "en-US", "en-GB", "zh-CN".
suggestion

number facultatif

Hauteur de la voix comprise entre 0 et 2 (0 étant la plus basse et 2 la plus haute). La valeur 1,0 correspond à la hauteur par défaut d'une voix.
vitesse de réaction

number facultatif

Débit vocal par rapport au débit par défaut de cette voix. 1.0 est le débit par défaut, qui se situe généralement entre 180 et 220 mots par minute. La valeur 2,0 est deux fois plus rapide et la valeur 0,5 est deux fois moins rapide. Les valeurs inférieures à 0,1 ou supérieures à 10,0 sont strictement interdites, mais de nombreuses voix limiteront davantage les débits minimum et maximum. Par exemple, une voix spécifique peut ne pas parler plus de trois fois plus vite que la normale, même si vous spécifiez une valeur supérieure à 3,0.
requiredEventTypes

string[] facultatif

Types d'événements TTS que la voix doit prendre en charge.
voiceName

chaîne facultatif

Nom de la voix à utiliser pour la synthèse. Si ce champ est vide, n'importe quelle voix disponible est utilisée.
volume

number facultatif

Volume de la voix compris entre 0 et 1 (inclus), où 0 correspond au volume le plus faible et 1 au volume le plus élevé (la valeur par défaut est 1, 0).
onEvent

void optional

Cette fonction est appelée avec les événements qui se produisent lors de l'énonciation.

La fonction onEvent se présente comme suit :
```
(event: TtsEvent) => {...}
```
- événement
  
  TtsEvent
  
  Événement de mise à jour du moteur de synthèse vocale indiquant l'état de cette énonciation.

TtsVoice

Description d'une voix disponible pour la synthèse vocale.

Propriétés

eventTypes

EventType[] facultatif

Tous les types d'événements de rappel que cette voix peut envoyer.
extensionId

chaîne facultatif

ID de l'extension fournissant cette voix.
gender (genre)

VoiceGender (facultatif)

Obsolète depuis Chrome 70

Le genre est obsolète et sera ignoré.
Genre de cette voix.
lang

chaîne facultatif

Langue prise en charge par cette voix, au format langue-région. Exemples : "en", "en-US", "en-GB", "zh-CN".
télécommande

booléen facultatif

Si la valeur est "true", le moteur de synthèse est une ressource réseau distante. La latence peut être plus élevée et des frais de bande passante peuvent s'appliquer.
voiceName

chaîne facultatif

Nom de la voix.

VoiceGender

Chrome 54 et versions ultérieures Obsolète depuis Chrome 70

Le genre est obsolète et ignoré.

Énumération

"male"

"female"

Méthodes

getVoices()

chrome.tts.getVoices(): Promise<TtsVoice[]>

Récupère un tableau de toutes les voix disponibles.

Renvoie

Promise<TtsVoice[]>

Chrome 101 et versions ultérieures

isSpeaking()

chrome.tts.isSpeaking(): Promise<boolean>

Vérifie si le moteur est en train de parler. Sur Mac OS X, le résultat est "true" chaque fois que le moteur de synthèse vocale du système parle, même si la synthèse vocale n'a pas été lancée par Chrome.

Renvoie

Promise<boolean>

Chrome 101 et versions ultérieures

pause()

chrome.tts.pause(): void

Met en pause la synthèse vocale, potentiellement au milieu d'un énoncé. Un appel pour reprendre ou arrêter la lecture à voix haute la réactivera.

resume()

chrome.tts.resume(): void

Si la synthèse vocale a été mise en pause, elle reprend là où elle s'était arrêtée.

speak()

chrome.tts.speak(
  utterance: string,
  options?: TtsOptions,
): Promise<void>

Énonce le texte à l'aide d'un moteur de synthèse vocale.

Paramètres

énoncé

chaîne

Texte à lire, qu'il s'agisse de texte brut ou d'un document SSML complet et bien formé. Les moteurs vocaux qui ne sont pas compatibles avec SSML suppriment les balises et lisent le texte. La longueur maximale du texte est de 32 768 caractères.
options

TtsOptions facultatif

Options vocales.

Renvoie

Promise<void>

Chrome 101 et versions ultérieures

Résolution immédiate, avant la fin de la parole. Si une erreur se produit, la promesse sera rejetée. Utilisez options.onEvent pour obtenir des commentaires plus détaillés.

stop()

chrome.tts.stop(): void

Arrête toute diffusion vocale en cours et vide la file d'attente des énoncés en attente. De plus, si la synthèse vocale avait été mise en pause, elle sera réactivée pour le prochain appel à la synthèse vocale.

Événements

onVoicesChanged

Chrome 124 et versions ultérieures

chrome.tts.onVoicesChanged.addListener(
  callback: function,
)

Appelé lorsque la liste des tts.TtsVoice qui seraient renvoyés par getVoices a changé.

Paramètres

callback

fonction

Le paramètre callback se présente comme suit :
```
() => void
```

chrome.tts Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Description

Autorisations

Concepts et utilisation

Générer une voix

Écouter les événements

Balisage SSML

Choisir une voix

Types

EventType

Énumération

TtsEvent

Propriétés

TtsOptions

Propriétés

TtsVoice

Propriétés

VoiceGender

Énumération

Méthodes

getVoices()

Renvoie

isSpeaking()

Renvoie

pause()

resume()

speak()

Paramètres

Renvoie

stop()

Événements

onVoicesChanged

Paramètres

chrome.tts