Amazon Web Services (AWS) ha anunciado un avance significativo en el mundo de la transcripción automática: la evolución de su plataforma Amazon Transcribe. Este servicio, que ahora reconoce 100 idiomas, se ha convertido en un referente gracias a su integración de la inteligencia artificial (IA) generativa.
Durante el evento ‘AWS re:Invent’, la compañía anunció una expansión notable en las capacidades lingüísticas de Amazon Transcribe. El servicio, que antes manejaba 79 idiomas, ahora puede entender y transcribir en 100 idiomas diferentes. Según detallan en una publicación en su blog, la base de este logro radica en un entrenamiento exhaustivo con millones de horas de audio en estos idiomas, usando algoritmos de autoaprendizaje, lo que ha permitido una mayor precisión en la transcripción. En este punto, AWS explica que se han asegurado de que algunos idiomas no estuvieran sobrerrepresentados en los datos de entrenamiento para garantizar que los idiomas menos utilizados pudieran ser tan precisos como los que se hablan con más frecuencia.
Además, destacan que Amazon Transcribe mejora la precisión entre un 20 y 50% con respecto a su versión anterior en la mayoría de los idiomas. En el habla de telefonía, la mejora de la precisión oscila entre un 30 y 70%. También ofrece puntuación automática, vocabulario personalizado, identificación automática de idiomas y filtros de vocabulario personalizados, y puede reconocer el habla en formatos de audio y video y en entornos ruidosos.
Con la llegada de la IA generativa, miles de empresas utilizan Amazon Transcribe para obtener información valiosa de su contenido de audio. Con una precisión significativamente mejorada y compatibilidad con más de 100 idiomas, Amazon Transcribe tendrá un impacto positivo en todos estos casos de uso. «Todos los clientes nuevos y existentes que utilizan Amazon Transcribe en modo por lotes pueden acceder al reconocimiento de voz basado en modelos de base de voz sin necesidad de realizar ningún cambio en el punto de enlace de la API ni en los parámetros de entrada«, subrayan desde AWS.
De igual forma, AWS manifiesta que los avances con Amazon Transcribe también se traducen en una mayor precisión con su plataforma Call Analytics, que sus clientes de centros de contacto utilizan a menudo. Amazon Transcribe Call Analytics, que ahora también cuenta con modelos de IA generativa, resume las interacciones entre un agente y un cliente. «Los centros de contacto transcriben y analizan las llamadas de los clientes para identificar información y, posteriormente, mejorar la experiencia del cliente y la productividad de los agentes. Los productores de contenido y los distribuidores de medios generan subtítulos automáticamente con Amazon Transcribe para mejorar la accesibilidad del contenido«, explican desde la empresa.
En definitiva, aseveran, «en AWS innovamos constantemente en nombre de nuestros clientes. Al ampliar la compatibilidad de idiomas en Amazon Transcribe a más de 100 idiomas, permitimos a nuestros clientes atender a usuarios de diversos orígenes lingüísticos. Esto no solo mejora la accesibilidad, sino que también abre nuevas vías para la comunicación y el intercambio de información a escala mundial«.