Empresas chinas de IA reducen la brecha con Occidente pese a las restricciones de EE.UU.

Las empresas chinas de inteligencia artificial (IA) están cerrando la brecha con los líderes occidentales como OpenAI a un ritmo más rápido de lo que los expertos de la industria habían anticipado, a pesar de las restricciones del gobierno estadounidense a la exportación de chips avanzados a China. Estos avances han sorprendido a los observadores, ya que los investigadores chinos han logrado replicar modelos sofisticados de IA en un período relativamente corto, desafiando la percepción de que los chips avanzados son esenciales para desarrollar tecnologías de IA de vanguardia.

El modelo "pensante" de OpenAI y la respuesta china

En septiembre de 2024, OpenAI presentó un nuevo modelo conocido como o1. Este "modelo pensante" se centra en analizar consultas a fondo antes de generar respuestas, lo que resulta en respuestas más precisas, perspicaces y menos propensas a errores. El modelo demostró sus capacidades en áreas como la retroalimentación detallada en investigación científica, impresionando a expertos en campos altamente especializados.

Sin embargo, empresas chinas como DeepSeek y Moonshot AI han afirmado recientemente avances significativos en modelos con capacidades comparables a o1.

DeepSeek, respaldada por un importante fondo de cobertura chino, reveló en noviembre una demostración de un modelo de lenguaje grande (LLM) que, según aseguran, rivaliza con el "modelo pensante" de OpenAI. Moonshot AI, por su parte, lanzó un modelo especializado en resolver problemas matemáticos complejos, logrando un desempeño cercano al de o1 en este ámbito. Incluso Alibaba anunció que sus modelos experimentales superaron a los de OpenAI en escenarios específicos.

Desafíos en la verificación y el impacto de las restricciones

La evaluación de estos modelos ha sido complicada debido a la falta de estándares universalmente aceptados. Una posible métrica, el American Invitational Mathematics Examination (AIME), mostró que el modelo de DeepSeek superó al de OpenAI, aunque pruebas independientes revelaron que o1 resolvió las preguntas más rápidamente. No obstante, el hecho de que todos los modelos respondieran correctamente es un logro notable, considerando que sistemas anteriores de IA solían tener dificultades incluso con aritmética básica.

Los avances chinos son aún más destacables porque se lograron sin acceso a los chips más avanzados. Desde octubre de 2022, EE.UU. ha impuesto restricciones estrictas a la exportación de chips de alto rendimiento a China, limitando su capacidad para desarrollar sistemas avanzados de IA. Estas medidas han incluido desde vetos a inversiones estadounidenses en firmas chinas hasta limitaciones en la exportación de chips de memoria.

Innovaciones chinas frente a la escasez de recursos

Las empresas chinas han respondido con métodos alternativos que requieren menos recursos computacionales. Algunas, como Tencent, han adoptado enfoques como el "mixture of experts" (MoE), que utiliza submodelos especializados para tareas específicas, optimizando eficiencia. Tencent afirma que su modelo MoE, lanzado en noviembre, iguala el desempeño del modelo Llama 3.1 de Meta, pero con una fracción de su potencia computacional. Otras, como DeepSeek, han maximizado el rendimiento de chips menos avanzados mediante diseños eficientes de hardware y software.

Incertidumbre frente a la próxima generación de IA

A pesar de estos avances, las empresas chinas enfrentan desafíos a medida que competidores globales despliegan sistemas de IA de próxima generación impulsados por chips avanzados. Para 2025, se espera que entren en operación supercomputadoras como la de xAI (de Elon Musk), que construye un centro de datos con 100,000 chips Nvidia Blackwell, o el proyecto similar de Amazon con chips propietarios.

Este escenario ha impactado la capacidad de financiación de las firmas chinas. Zhipu AI, por ejemplo, completó una ronda de financiación valuada en $3 mil millones, una cifra muy inferior a las de sus contrapartes estadounidenses, y pospuso sus planes de salir a bolsa en 2025 por dudas sobre su valuación.

Video

Tags

    There are no post in the library.