.
Analistas 25/05/2024

Innovación vs. propiedad de datos

Javier Villamizar
Managing Director

En el vertiginoso mundo de la inteligencia artificial, las empresas detrás de modelos fundacionales como GPT-4 de OpenAI y Claude de Anthropic están inmersas en una carrera frenética por cosechar datos, los cuales resultan esenciales para alimentar y entrenar sus sofisticados modelos, capaces de generar contenido a velocidades nunca pensadas.

El corazón de estos modelos es una estructura monumental de datos donde cada interacción, búsqueda y contenido generado en texto, imagen, sonido o video, por usuarios de internet contribuye a este vasto repositorio. Sin embargo, la recolección de datos no es una tarea sencilla ni exenta de controversias. Las empresas deben navegar un campo minado de consideraciones éticas y legales, asegurándose de que la información que utilizan respeta la privacidad, la propiedad y los derechos de los usuarios.

Una de las estrategias predominantes es la colaboración con plataformas tecnológicas que han acumulado datos por muchos años como es el caso de Wikipedia o las casas editoriales detrás de medios de comunicación muy importantes. Compañías como OpenAI han establecido alianzas con gigantes tecnológicos para acceder a cantidades masivas de datos. Microsoft, por ejemplo, ha invertido en OpenAI, permitiendo el uso de su infraestructura y datos para el entrenamiento de modelos.

La competencia no se limita a la cantidad de datos, sino también a su calidad. Datos diversos y representativos son cruciales para crear modelos que puedan comprender y generar texto de manera precisa y contextual. Sin embargo, obtener datos de alta calidad implica una inversión considerable en términos de tiempo y recursos.

Un reciente incidente destaca los desafíos en este campo: la controversia entre OpenAI y la actriz Scarlett Johansson, quien alega que su voz fue replicada sin su consentimiento por una versión de ChatGPT, lo que desató una tormenta mediática y una posible batalla legal. Este caso subraya las complejidades éticas y legales de la inteligencia artificial y la necesidad de regulaciones más estrictas sobre el uso de datos personales, identidad e imagen.

El impacto de esta carrera por los datos es profundo y multifacético. Por un lado, la disponibilidad de modelos avanzados puede transformar industrias enteras, ofreciendo soluciones más eficientes y personalizadas. Por otro lado, surge el temor de que el monopolio de datos por parte de unas pocas empresas tecnológicas concentre el poder y limite la innovación.

En este contexto, las empresas tecnológicas están adoptando medidas proactivas para mejorar la transparencia y la confianza del usuario. Algunas están implementando políticas de “datos abiertos” que permiten a los usuarios ver y controlar qué información se recopila. Otras están invirtiendo en tecnologías de privacidad diferencial, que permiten el análisis de grandes conjuntos de datos sin comprometer la privacidad individual.

El futuro de los modelos fundacionales y su capacidad para transformar el mundo depende en gran medida de cómo se maneje esta carrera por los datos. Las empresas deben equilibrar la necesidad de datos con el respeto por la privacidad y los derechos de los usuarios. Aquellas que logren navegar este delicado equilibrio no solo liderarán en innovación tecnológica, sino que también establecerán nuevos estándares éticos en el uso de datos.

A medida que las empresas tecnológicas continúan buscando maneras de mejorar sus modelos, la ética y la regulación jugarán un papel cada vez más importante en garantizar que el progreso tecnológico no se logre a expensas de la privacidad y los derechos individuales.

Conozca los beneficios exclusivos para
nuestros suscriptores

ACCEDA YA SUSCRÍBASE YA