#NoticiasDelMes: Junio 2023
Bienvenidos a un nueva entrega de #NoticiasDelMes, el espacio donde repasamos la actualidad sobre Datos e Inteligencia Artificial. ¡Vamos a repasar el mes de Junio!
¡Comencemos!🔥
OpenAI AI Text Classifier
En los últimos meses hemos sido testigos del creciente uso de herramientas de generación de texto por inteligencia artificial (IA), como ChatGPT o Bard, en diversas áreas de la sociedad.
Su uso también ha aumentado para la redacción de documentos oficiales, trabajos de investigación y tareas del colegio. Su gran capacidad para generar contenido de elevada calidad, hace cada más complicado el distinguir cuando el texto ha sido generado por una IA o bien por un humano. Esto ha abierto el debate en colegios, universidades y otros centros.
Es aquí donde entra en juego esta nueva herramienta de OpenAI.
AI Text Classifier es un detector de textos creados por inteligencia artificial basado en GPT, por lo que por dentro es muy parecido a ChatGPT. La diferencia es que este modelo ha sido entrenado para detectar textos escritos por IA, y distinguirlos de los creados por personas.
Para su entrenamiento, se han utilizado tanto textos creados por humanos como creados por inteligencia artificial sobre un mismo tema. Además de esto, ha sido entrenado para poder detectar distintos modelos de lenguaje por IA, tanto los creados por la propia OpenAI como otros desarrollados por otras empresas y organizaciones.
En esta herramienta, se ha ajustado el umbral de confianza para mantener baja la tasa de falsos positivos. Esto quiere decir que sólo se marca un texto como probablemente escrito por IA si el clasificador tiene mucha confianza en ello.
Music Gen
Meta (Facebook) ha presentado MusicGen, un nuevo modelo de inteligencia artificial generativa que se enfoca en la creación musical. Basado en la arquitectura Transformer de Google (misma arquitectura en la que se apoya ChatGPT), MusicGen descompone datos de audio en componentes más pequeños utilizando el "tokenizador" de audio de Meta, llamado Encodec.
El modelo funciona a partir de un prompt de texto, el cual también puede ser combinado con fragmentos musicales. Esto dará como resultado una melodía músical de entorno 13 segundos de duración.
Para el siguiente prompt:
A song based on Lola Flores style (una canción basada en el estilo de Lola Flores)
Se ha obtenido la siguiente melodía
El modelo fue entrenado con diferentes número de parámetros (300 millones, 1.500 millones y 3.3 millones de parámetros), y aunque el último fue el que ofreció audio de mejor calidad, el intermedio fue el mejor calificado por los oyentes humanos. Además, se han utilizado 20000 horas de contenido músical para su entrenamiento
Sin embargo, este avance plantea desafíos para la industria musical, ya que estas herramientas creativas podrían cambiar el proceso creativo y amenazar los ingresos de los artistas. Grimes, por ejemplo, ha permitido el uso de su música para entrenar sistemas de IA a cambio de un 50% de los ingresos. Todo un reto
Nuevo algoritmo de ordenación
Gracias a la IA se ha conseguido obtener un nuevo algoritmo de ordenación, que es hasta un 70% más rápido que el anterior. Es decir se ha usado IA para conseguir nueva IA.
Siguiendo los pasos de AlphaZero, Google DeepMind ha creado AlphaDev, una versión derivada con un objetivo diferente. AlphaDev se centra en el ordenamiento de listas, y los resultados han sido impresionantes. Según un artículo técnico en Nature, este sistema de IA ha descubierto una implementación de la función "sort" que es un 70% más rápida que la existente en la librería estándar de LLVM en C++.
El impacto de este avance ha sido inmediato, y después de un riguroso análisis, la implementación se incluyó en el lenguaje C++, reemplazando a la anterior. Este ha sido el primer cambio en ese aspecto en C++ en más de una década.
Para lograr estos avances, DeepMind trabajó con el lenguaje ensamblador, descomponiendo los algoritmos en pequeños pasos para encontrar soluciones más eficientes. AlphaDev "jugó millones de partidas" de instrucciones en ensamblador para crear incluso una nueva instrucción para su algoritmo, es decir se estaba usando la IA para resolver este problema, demostrando una vez más su potencial para resolver problemas prácticos y mejorar la eficiencia en diversos campos.
Esto en el día a día se traduce en:
Mayor eficiencia en aplicaciones y software.
Optimización de recursos.
Mejor rendimiento en sistemas embebidos.
Mejora en la seguridad informática.
Avances en otros campos de la computación.
Gemini: Objetivo eclipsar a ChatGPT
De nuevo, volvemos a hablar de Google Deepmind. Después de hazañas como AlphaGo, AlphaZero y ahora AlphaDev, quieren más y el último objetivo que se han marcado es eclipsar ChatGPT-
Demis Hassabis, CEO de Google DeepMind, ha explicado cómo sus ingenieros están trabajando en un gran modelo de lenguaje (LLM), similar a GPT-4. Sin embargo, lo interesante es que están incorporando técnicas utilizadas en AlphaGo, que permitirán al modelo planificar y resolver problemas de manera más efectiva.
El aprendizaje por refuerzo juega un papel crucial en este proceso. Al igual que AlphaGo, el software aprende a resolver problemas mediante el ensayo y error. Cuando comete errores, recibe indicaciones y "explicaciones" para entender los motivos. Del mismo modo, cuando tiene éxito, se refuerzan las acciones correctas. Mediante un método de búsqueda en árbol, el modelo es capaz de explorar y recordar, por ejemplo, los posibles movimientos en un juego de Go. Ahora, estas técnicas se están aplicando al desarrollo de Gemini, el nuevo modelo de lenguaje.
Esta combinación de un gran modelo de lenguaje con técnicas de aprendizaje por refuerzo promete ampliar las capacidades del sistema, permitiendo que Gemini no solo genere texto coherente, sino que también pueda planificar y resolver problemas de manera más eficiente.
¡MUCHAS GRACIAS!
Si el artículo te ha gustado, dejar un ❤️ y compartirlo con alguien a quién creas que pueda servirle sería la MEJOR FORMA DE VALORAR MI TRABAJO
Cada semana recibirás en tu bandeja de entrada algo nuevo que aprender sobre el mundo de los datos.




