Escucha este artículo
Audio generado con IA de Google
0:00
/
0:00
Ya han pasado más de dos años desde que se estrenó Chat GPT, la inteligencia artificial generativa que revolucionó la forma en que nos relacionamos con la tecnología.
Sus casos de uso han sido múltiples (por no decir transversales a toda la sociedad) gracias a la generación de textos, imágenes y sonidos. La clave ha estado en la capacidad que ha demostrado para emular la capacidad creativa que tenemos los humanos, siendo ya considerada como uno de los más importantes saltos tecnológicos de la historia.
Hoy, la inteligencia artificial generativa se ha convertido en una industria de amplio crecimiento, con los pesos pesados invirtiendo en ella (Microsoft, X, Apple y Google, solo por mencionar un puñado). Según un reporte de la consultora Grand View Research, el mercado global de esta tecnología en 2023 se estimó en US$16,63 mil millones, habiendo cerrado 2024 en US$279,22 mil millones (un crecimiento del 42 %). Lo que veríamos en los próximos años sería una bola de nieve que no parará de crecer, pues se proyecta un incremento promedio del 36,6 % cada año de aquí al 2030.
Lea también: Microsoft invertirá millones de dólares en IA en 2025: ¿cuánto será?
Sin embargo, y a pesar de lo relativamente reciente que es, la IA generativa se estaría quedando sin combustible, pues múltiples expertos señalan que esta ya consumió gran parte de los datos que pueden aportar los humanos. Entre estos está Elon Musk, el magnate propietario de X y una de las personas que más ha mostrado interés en esta tecnología, quién recientemente dijo en una conversación transmitida por X, y recopilada por el medio Xataka, que “básicamente, hemos agotado la suma acumulada de conocimientos humanos… en el entrenamiento de la IA”. “Eso sucedió básicamente el año pasado”, añadió.
Este anuncio es importante, pues lo que alimenta a las inteligencias artificiales son los datos. Decir que estos ya se están agotando es lo mismo que decir que la IA estaría próxima alcanzar un techo en su potencial de desarrollo.
Musk no es el primero en alertar esto, pues diversos expertos y autoridades en la materia ya lo han hecho. Un estudio adelantado por el Data Provenance Initiative (colectivo de voluntarios investigadores de la IA por todo el mundo) concluyeron que la escasez de datos que alimenta a esta tecnología es un tema que se ha agravado en los últimos años.
Le puede interesar: Inteligencia artificial para todos: la importancia de ahondar en esta tecnología
Gran parte de esta limitación, explican, obedece a las restricciones que se le han puesto a los datos. En la Unión Europea, por ejemplo, han surgido regulaciones (como la GDPR) que brindan mayores garantías a la protección de datos, así como limitaciones para que no cualquiera pueda ser empleado para entrenar a las inteligencias artificiales.
Viéndolo desde un punto de vista ético, moral y defensor de la privacidad, estas limitaciones son positivas, pues levantan barreras para que no cualquier cosa que se pretenda hacer con la inteligencia artificial sea posible. Hemos visto casos de usos malintencionados de estas tecnologías. Incluso, estas restricciones proveen un blindaje ante sesgos que se puedan aplicar en la cotidianidad de las personas por razones de género, raza, nacionalidad y de creencias políticas o religiosas.
¿Qué sigue?
Aún si la data generada por humanos fuera abierta en todo el mundo, de todas formas se llegaría a un punto en el que la IA generativa terminaría consumiéndola para su entrenamiento, pues la misma seguiría siendo limitada.
Es por lo anterior que muchos expertos coinciden en que un próximo capítulo en el desarrollo de las IA´s será protagonizado por los denominados datos sintéticos.
Esto no es más que la información que se genera artificialmente mediante algoritmos, en lugar de ser recolectados directamente del mundo real. En suma, datos generados por máquinas que también podrían ser usados (y esto no es algo novedoso) para entrenar, probar o validar los modelos de inteligencia artificial.
“La única forma de complementar -los datos del mundo real- es con datos sintéticos, donde la IA los crea”, dijo Musk, al añadir que “con los datos sintéticos… la IA se calificará a sí misma y pasará por un proceso de autoaprendizaje”.
En conclusión, la IA ya ha alcanzado un punto en el que los datos necesarios para su entrenamiento se están agotando, sin que esto necesariamente implique un gran problema.
Es decir, ya se descubrió y probó lo que la IA generativa puede hacer. A su alcance modelos de lenguaje como Chat GPT tiene miles de millones de datos. Incluso muchos de los que le siguen llegando resultan siendo redundantes. A estas alturas, más que la cantidad lo que tiene un mayor valor es la calidad del dato.
Lo que veríamos en el futuro sería una mejor selección de los datos para entrenar estas tecnologías, así como un aprendizaje de las mismas, gracias a los datos sintéticos que serán generados. Un modelo de datos híbridos, donde los aportes vendrán del mundo real, pero también del virtual que se ha creado.
💰📈💱 ¿Ya te enteraste de las últimas noticias económicas? Te invitamos a verlas en El Espectador.