La aplicación de la Inteligencia Artificial en la industria tecnológica no deja de mostrarnos novedades interesantes y esta semana no ha sido la excepción. Esto debido a que el rezagado Apple al fin ha mostrado la forma en que introducirá la IA generativa en sus productos.
Bienvenido a esta nueva edición de The Background, el espacio para explorar a fondo la inteligencia artificial y mantenerte informado de lo más relevante del sector.
En el correo de hoy
Nueva Siri y nueva estrategia de IA para Apple
Top Papers
Al día con la IA
Nueva Siri y nueva estrategia de IA para Apple
Apple finalmente mostró sus cartas, anunciando ayer en la WWDC su nuevo sistema "Apple Intelligence" y una colaboración con OpenAI. ¿El objetivo? Ofrecer una experiencia más personalizada a sus 2.200 millones de usuarios.
Detalles Clave:
Apple Intelligence: Un asistente integral que abarca desde revisar textos hasta analizar el tráfico.
Mejoras en Siri: Siri ahora entiende mejor el lenguaje natural y puede interactuar de manera más profunda con las apps.
Integración con ChatGPT: Para preguntas complejas, Siri ofrecerá la opción de consultar directamente con ChatGPT.
Privacidad: La mayor parte del procesamiento se realizará en el dispositivo, con modelos más grandes manejados por los servidores de Apple en 'Private Cloud Compute'.
Sin embargo, no todos están contentos. Elon Musk ha amenazado con prohibir dispositivos Apple en sus empresas si integran OpenAI, calificándolo como una "violación de seguridad inaceptable". Además, los proveedores de Apple en Asia vieron caer sus acciones, ya que el evento "careció de un factor sorpresa", según los analistas.
Fuente: BBC News
Lee aquí la opinión de Steve Wozniak sobre estas nuevas herramientas
Descubre el origen del Transformador
Top Papers
Autoregressive Model Beats Diffusion: Llama for Scalable Image Generation
LlamaGen es una nueva familia de modelos de generación de imágenes que aplican el paradigma de predicción del siguiente token de los grandes modelos de lenguaje al dominio visual. Estos modelos, que van desde 111M hasta 3.1B de parámetros, superan a los modelos de difusión populares en ImageNet. Además, logran una aceleración del 326%-414% en la velocidad de inferencia, liberando todos los modelos y códigos para la comunidad de código abierto.
Vript: A Video Is Worth Thousands of Words
Vript aborda la necesidad de conjuntos de datos video-texto de alta calidad con un corpus anotado de 12K videos en alta resolución, ofreciendo descripciones detalladas para más de 420K clips. Las leyendas incluyen operaciones de cámara y movimientos. Vriptor, un modelo de vanguardia, genera descripciones densas para videos largos, comparable a GPT-4V. Además, Vript-Hard presenta tres tareas desafiantes para la comprensión de videos, evaluando alucinaciones de acción y objeto, razonamiento en preguntas largas, y comprensión temporal de eventos.
Husky: A Unified, Open-Source Language Agent for Multi-Step Reasoning
Husky es un agente de lenguaje de código abierto que aborda tareas complejas utilizando un espacio de acción unificado para razonamiento numérico, tabular y basado en conocimiento. Husky alterna entre generar la siguiente acción y ejecutarla con modelos expertos, actualizando el estado de la solución. Supera a agentes previos en 14 conjuntos de datos de evaluación y en HuskyQA, que prueba el razonamiento con múltiples herramientas. Pese a usar modelos de 7B parámetros, Husky iguala o supera a LMs como GPT-4 en estos desafíos. Todo el código y los modelos están disponibles online.
Al día con la IA
Meta ha anunciado que utilizará publicaciones públicas de Instagram y Facebook para entrenar su IA a partir del 26 de junio, lo que ha generado preocupaciones sobre la privacidad entre los usuarios europeos. En EE.UU., donde las leyes de privacidad son menos estrictas, ya se ha estado utilizando esta información sin notificación previa. Los usuarios europeos pueden optar por no participar configurando sus cuentas como privadas, mientras que los usuarios de EE.UU. no tienen esta opción. (The New York Times)
IBBX, una startup brasileña especializada en IoT e IA para la monitorización y automatización industrial, ganó la vertical Industry 5.0 en South Summit Madrid 2024. Su solución mejora la eficiencia, seguridad y sostenibilidad de industrias, ciudades y agricultura, alineándose con el tema "Human by design" del evento. La 13ª edición del South Summit fue coorganizada por IE University y contó con apoyo institucional y de varias empresas tecnológicas. (Tekios)
NVIDIA inició la semana con acciones más accesibles tras dividir su precio del viernes ($1,208.88) a $120.88, y subiendo casi un 1%. Si tenías cuatro acciones el jueves, ¡sorpresa! Ahora posees cuarenta. Este split ayuda con la accesibilidad para los traders minoristas. (Yahoo Finance)
Gracias por leer The Background. Hasta la próxima 👋.