.
TECNOLOGÍA

Meta lanza un modelo de inteligencia artificial para traducir el habla en varios idiomas

martes, 22 de agosto de 2023

Michael Nagle/Bloomberg

La empresa afirma en un blog que su modelo SeamlessM4T puede traducir texto y voz en casi 100 idiomas

Reuters

La empresa matriz de Facebook, Meta Platforms, presentó el martes un modelo de inteligencia artificial capaz de traducir y transcribir el habla de docenas de idiomas, lo que podría constituir una pieza clave para las herramientas que permiten la comunicación en tiempo real, pese a las barreras lingüísticas.

La empresa afirma en un blog que su modelo SeamlessM4T puede traducir texto y voz en casi 100 idiomas, así como de voz a voz en 35 idiomas, combinando tecnologías que antes solo estaban disponibles en modelos separados.

Su presidente ejecutivo, Mark Zuckerberg, ha dicho que imagina este tipo de herramientas facilitando las interacciones entre usuarios de todo el mundo en el metaverso,el conjunto de mundos virtuales interconectados por el que apuesta el futuro de la empresa.

Meta pondrá el modelo a disposición del público para uso no comercial, según el blog.

Este año, la mayor empresa de redes sociales del mundo ha lanzado una avalancha de modelos de inteligencia artificial, en su mayoría gratuitos, entre los que se incluye un gran modelo lingüístico denominado Llama, que supone un serio reto a los modelos patentados que venden OpenAI, respaldada por Microsoft , y Google, de Alphabet.

Zuckerberg dice que un ecosistema de IA abierto favorece a Meta, ya que la empresa tiene más que ganar con la externalización colectiva de la creación de herramientas orientadas al consumidor para sus plataformas sociales que cobrando por el acceso a los modelos.

No obstante, Meta se enfrenta a cuestiones legales similares a las del resto del sector en torno a los datos de entrenamiento empleados para crear sus modelos.

En julio, la cómica Sarah Silverman y otros dos autores presentaron demandas por infracción de derechos de autor contra Meta y OpenAI, acusándolas de utilizar sus libros como datos de entrenamiento sin permiso.

Para el modelo SeamlessM4T, los investigadores de Meta afirman en un documento de investigación que recopilaron datos de entrenamiento de audio a partir de 4 millones de horas de "audio sin procesar procedente de un repositorio de datos web rastreados de acceso público", sin especificar de qué repositorio se trataba.

Un portavoz de Meta no respondió a las preguntas sobre la procedencia de los datos de audio.

Los datos de texto procedían de conjuntos de datos creados el año pasado que extraían contenidos de Wikipedia y sitios web asociados, según el documento de investigación.

Conozca los beneficios exclusivos para
nuestros suscriptores

ACCEDA YA SUSCRÍBASE YA

MÁS DE GLOBOECONOMÍA

Rusia 29/06/2024 Rusia dice que las perspectivas de los lazos con la Unión Europea no son favorables

La UE se ha movilizado para intentar ayudar financiera y militarmente a Kiev frente a Rusia desde que el presidente Vladimir Putin envió decenas de miles de tropas a Ucrania en 2022

Panamá 01/07/2024 José R. Mulino asume la presidencia de Panamá abogando por recuperar la economía

Aprovechó para reiterar que no permitirá que Panamá sea "un camino abierto para personas que ingresan ilegalmente a nuestro país"

EE.UU. 01/07/2024 Juicio de Donald Trump se retrasaría para después de elecciones por cierta inmunidad

El juicio en Washington ha estado en suspenso mientras que el expresidente y candidato presiona para que se le conceda inmunidad