Yoga Sessions

Baidu Presentó nuevo LLM que segun dicen, super a GPT5

Overview

Baidu presentó el 11 de noviembre ERNIE-4.5-VL-28B-A3B-Thinking, un modelo multimodal de código abierto que, según la empresa, supera a GPT-5 de OpenAI y a Gemini 2.5 Pro de Google en múltiples benchmarks. El anuncio intensifica la competencia entre compañías chinas y occidentales en inteligencia artificial.

El modelo utiliza una arquitectura Mixture-of-Experts con 28.000 millones de parámetros totales, pero activa solo 3.000 millones por inferencia, reduciendo de forma drástica los costos computacionales sin sacrificar rendimiento. Según Baidu, supera a Gemini 2.5 Pro en evaluaciones VQA, MMBench y SEED-Bench para comprensión de documentos y gráficos.

La arquitectura ligera permite inferencias entre dos y tres veces más rápidas que modelos equivalentes completos y usa mucha menos memoria. El modelo incorpora la función “Thinking with Images”, que permite ampliar regiones dentro de una imagen, razonar sobre recortes y combinar observaciones locales en respuestas completas.

El sistema fue entrenado con una fase intensiva de datos de razonamiento visual-lingüístico y emplea técnicas avanzadas de refuerzo como GSPO e IcePop. Destaca en razonamiento visual, resolución de problemas STEM, grounding visual, uso de herramientas y comprensión de video.

La publicación llega mientras China intensifica su estrategia de IA de código abierto. Diversos análisis indican que China ya supera a Estados Unidos en descargas de modelos open source, mostrando que empresas como DeepSeek, Alibaba y Baidu pueden desarrollar modelos potentes a menor coste. Investigadores afirman que cada lanzamiento de un modelo de código abierto de alto rendimiento eleva la presión sobre laboratorios cerrados como OpenAI y Anthropic.

Baidu mostrará la familia ERNIE y más avances el 13 de noviembre en su conferencia Baidu World 2025 en Pekín, buscando consolidarse como líder dentro del ecosistema chino de IA.