Actualmente, el uso de los comandos de voz o reconocimiento de voz se hacen cada vez más recurrentes. Estamos llegando al punto en que se está volviendo una herramienta más en nuestros hogares.
¿Qué es el reconocimiento de voz?
El reconocimiento de voz es la capacidad de respuesta que tiene una máquina o programa para identificar palabras y frases. ¿De qué manera? el lenguaje hablado lo convierte a un formato legible por máquina.
El software de reconocimiento de voz básico (por así decirlo) tiene un vocabulario limitado de palabras y frases. Y solo puede identificarlas si se hablan con mucha claridad.
Un software más avanzado tiene la capacidad de aceptar el habla natural, es decir, lo que diga una persona, el dispositivo lo reconocerá inmediatamente.
Funcionamiento del convertidor automático de voz.
Este tipo de sistema de reconocimiento de voz se compone de 4 principales partes fundamentales, en la cual una no funciona si la otra no está.
Modelo acústico
Permite a la tecnología identificar si el sonido proviene de una llamada del celular, de un teléfono convencional o cualquier otro medio.
Así mismo, determinar el canal de comunicación, esto es muy importante para establecer el grado de distorsión que puede experimentar el mensaje.
Modelo lingüístico
Este modelo trata del idioma, sin embargo, no es tan sencillo como indicarle al sistema que reconozca cierto español, francés o mandarín.
Es cierto que un sistema de reconocimiento de voz, puede detectar lo que se le diga, y en el idioma que sea. Sin embargo, para ello se debe hacer ajustes a su configuración para que reconozca varios idiomas
Y ¿a qué nos referimos con esto? El idioma para que lo reconozca, se debe hablar en la lengua más originaria, es decir, los distintos acentos con que se habla. E incluso entender las formas de expresarse, que pueden ser diferentes en cada persona.
Modelo semántico.
Con éste modelo, se consigue que un sistema de reconocimiento de voz entienda 3 aspectos importantes:
- La forma de hablar de la gente
- Cómo se construyen las frases
- Y cómo puede variar esta construcción.
Todo esto va dependiendo de la región, de la cultura y de todas las influencias personales de cada cual.
Motor estadístico
En el reconocimiento de voz, esta parte recoge la frase una vez transcrita a texto y realiza una búsqueda en la base de datos con estos términos. Este motor consulta:
- Que el nivel de distorsión sea el correspondiente
- Si se habla desde un móvil
- El acento
- La forma de decirlo.
La precisión del software al final se reduce a aumentar la base de datos para alcanzar todas las combinaciones posibles en un idioma. Es más, en cada nuevo entorno que se implementa hay que construir un nuevo modelo semántico.
Los sistemas con reconocimiento automático de voz más populares.
Alexa
El Servicio de voz de Alexa (AVS) es el servicio inteligente de reconocimiento de voz y lenguaje natural de Amazon. Te permite habilitar la voz en cualquier dispositivo conectado que tenga un micrófono y un altavoz.
Alcance de Alexa.
La lista de comandos que Alexa puede entender crece continuamente. Amazon las llama “habilidades”. La cantidad de tareas que Alexa puede realizar son inmensas, pero aquí te dejamos algunas aquí:
- Ordenar casi cualquier cosa en línea.
- Hacer un seguimiento de tus paquetes de Amazon.
- Encontrar recetas e instrucciones audibles paso a paso.
- Controlar los dispositivos en tu casa inteligente.
- Leer libros de Kindle.
- Obtener horarios de películas, conciertos, o eventos deportivos.
- Puedes hacer que tu casa sea más segura con Alexa Guard y Away Mode.
- Ordenar pizza o encontrar restaurantes cercanos.
- Pagar tus facturas con la app Capital One.
- Recibir consejos sobre el embarazo.
- Puedes pedirle a Alexa que lea tus emails.
- Rastrear tus paquetes de Amazon.
- Recibir actualizaciones de noticias.
- Puedes hacer recordatorios.
Siri.
Es un asistente personal integrado, controlado por reconocimiento de voz disponible para los usuarios de Apple.
La idea es que hables con Siri como si hablaras con un amigo. ¿Su objetivo principal? ayudarte a hacer las cosas, ya sea haciendo una reserva para la cena o enviando un mensaje.
Siri está diseñado para ofrecerle una forma perfecta de interactuar con el reconocimiento de voz con:
- iPhone
- iPad
- iPod Touch
- Apple Watch
- HomePod
- Mac
Al interactuar con ella por medio de el reconocimiento de voz, responde para encontrar o hacer lo que necesita. Puedes hacerle preguntas, decirle que te muestre algo o darle órdenes para que las ejecute en tu nombre, sin usar las manos.
Siri tiene acceso a todas las demás aplicaciones integradas en su dispositivo Apple (correo, contactos, mensajes, mapas, Safari, etc.). Y recurrirá a esas aplicaciones para presentar datos o buscar en sus bases de datos siempre que lo necesite. En última instancia, Siri hace todo el trabajo preliminar por ti.
Cortana.
El Asistente por reconocimiento de voz de productividad personal de Microsoft que te ayuda a ahorrar tiempo y centrarte en lo más importante.
Cortana es muchas cosas a la vez: un motor de búsqueda, una secretaria, un conserje y mucho más. Con Cortana, puedes realizar:
- Búsquedas en línea
- Programar citas
- Redactar correos electrónicos
- Y crear eventos de calendario entre otras cosas, todo desde su pantalla de inicio.
Ya no es necesario abrir aplicaciones individuales para realizar tareas elementales, con Cortana, todas estas tareas se simplifican.
Para utilizarla, selecciona el icono Cortana en la barra de tareas. Si no estás seguro de qué decir, pregunta, «¿qué puedes hacer?»
Estas son algunas de las cosas que Cortana puede hacer por ti:
- Administrar el calendario y mantenerte tu programación al día.
- Únete a una reunión en Microsoft Teams o averigua con quién es la próxima reunión.
- Crear y administrar listas.
- Configura avisos y alarmas.
- Buscar hechos, definiciones e información.
- Abre aplicaciones en tu equipo.
Assistant Google.
Es el asistente por reconocimiento de voz de Google. Cuando se lanzó, el Asistente de Google era una extensión de Google Now. Este fue diseñado para ser personal y expandir los controles de voz «OK Google» existentes de Google.
Google ha matado a Google Now desde hace mucho tiempo. Sin embargo, Assistant vive en el mismo espacio, fusionando estos elementos personalizados con una amplia gama de controles por voz.
El Asistente de Google admite la entrada de texto o de voz y seguirá la conversación independientemente del método de entrada que esté utilizando.
¿Qué puede hacer el Assistant Google?
El Asistente de Google ofrece comandos de voz, búsqueda por voz y control de dispositivo activado por voz.
Esto le permite completar una serie de tareas después de haber dicho las palabras «OK Google» o «Hey Google», una vez dicho esto, la interacción por reconocimiento de voz está activada. Está diseñado para brindarle interacciones conversacionales.
- Controla tus dispositivos y tu hogar inteligente
- Accede a la información de tus calendarios y otra información personal
- Encuentra información en línea, desde reservas en restaurantes hasta direcciones, clima y noticias
- Controla tu música
- Reproduce contenido en tu Chromecast u otros dispositivos compatibles
- Ejecuta temporizadores y recordatorios
- Agenda citas y envíe mensajes
- Abre aplicaciones en tu teléfono
- Lee tus notificaciones
- Traduce lo que se habla en tiempo real
- Jugar juegos.
Sin duda, estos sistemas de reconocimiento de voz son una maravilla. A uno como usuario, le facilita muchas cosas, varias actividades se pueden ejecutar con solo decirlo.
Hoy en día, es lo que muchos usuarios gozan con tener. Además de la facilidad de usarlos, es la experiencia de usuario que se puede crear.
Si te interesa saber más de temas como éste, software, marketing digital, en muchos temas más que te serán de mucha utilidad. Te invitamos a que visites nuestro blog personal.