Todo sobre DeepSeek, la alternativa china que compite con OpenAI

El éxito de la firma china DeepSeek ha hecho temblar al sector europeo tecnológico asociado a la inteligencia artificial, logrando que las acciones de SML, Infineon, ASMI, BE Semiconductor Industries (BESI), por ejemplo, se desplomen.
Este terremoto en el sector mundial de la IA llega luego de que DeepSeek presentase la semana pasada un modelo de inteligencia artificial actualizado, de mismonombre, que es de código abierto y que, según la empresa, es competitivo con la tecnología de OpenAI.
¿El resultado? Medios reportan que las acciones de ASML se han desplomando un 8%, los títulos de Infineon Technologies han bajado más del 2% y las acciones de ASM International (ASMI) y BESI se hunden un 12% y un 7%, respectivamente.
Sin embargo, hay otros afectados, como la empresa alemana Siemens Energy, que se hunde un 18% en el Dax, y de la francesa Schneider Electric, que baja un 10% en el Cac. Ambas compañías están involucradas en la provisión de soluciones energéticas y de infraestructura que impactan indirectamente en el desarrollo y funcionamiento de la IA, de acuerdo con BolsaManía.
El interés en las noticias sobre DeepSeek subió este fin de semana, y es que, los expertos señalan que el producto es rentable y funciona con chips de menor capacidad, lo que podría plantear dudas sobre el dominio de las empresas tecnológicas estadounidenses, incluidas Nvidia.
Todo sobre DeepSeek
Esta startup tiene sede en Hangzhou, China, y sus modelos desafían a empresas como OpenAI y Anthropic. Aunque, señalan, sus avances técnicos prometen una mayor accesibilidad y reducción de costos.
Las principales características de DeepSeek es que su chatbot nativo, el de su web oficial, es totalmente gratuito y no requiere de ninguna suscripción para utilizar su modelo más avanzado. Su aplicación puede usarse gratis online o bajándose su app móvil, y no tiene ninguna cuota.
Escribes una pregunta en lenguaje natural, DeepSeek R1 analizará las palabras de tu pregunta para encontrar el resultado, y luego buscará en la base de datos con la que fue entrenado o en Internet para obtener datos con los que componer una respuesta también en lenguaje natural.
Está especializado en razonamiento, y ha sido capaz de alcanzar o superar el rendimiento de los modelos más avanzados de OpenAI en pruebas clave de matemáticas y programación. Con él, es la primera vez que un modelo chino de código abierto y gratuito iguala a los líderes occidentales, rompiendo el monopolio de Silicon Valley.
Su enfoque es innovador. Si bien, entrenar modelos de inteligencia artificial como GPT-4 implica costos superiores a los 100 millones de dólares y el uso de miles de GPU de alta gama, DeepSeek logró reducir estos costos drásticamente.
Los propios desarrolladores de la empresa informan en el reporte técnico, que entrenaron su modelo DeepSeek-V3 con solo 5, 576 millones de dólares, utilizando chips H800 de Nvidia. Este hardware, diseñado originalmente como una alternativa limitada por las sanciones estadounidenses contra China, demostró ser suficiente para alcanzar resultados competitivos.
Otras características serían que opera con un sistema de parámetros optimizados, ya que utilizó solo 37 mil millones de parámetros activos simultáneamente, dentro de un sistema total de 671 mil millones, lo que representa una reducción significativa de los requisitos de memoria y hardware, permitiendo que sus sistemas funcionen con GPU convencionales, como las diseñadas para videojuegos, en lugar de depender exclusivamente de costosos centros de datos.
Igualmente, los desarrolladores implementaron un sistema “multi-token”, que optimiza la forma en que el modelo procesa información. En vez de analizar palabra por palabra, como lo haría un modelo tradicional, el enfoque de DeepSeek permite que el sistema procese frases.
Preocupaciones por la ciberseguridad
Con el ascenso de DeepSeek, han surgido preocupaciones en torno a la privacidad y sciberseguridad, debido a las prácticas de almacenamiento de datos de la empresa y las vulnerabilidades inherentes a la gestión de información sensible. La política de esta señala que los datos recopilados se almacenan en servidores en China.
Muchos consideran que puede actuar como un caballo de Troya, ya que podría recopilar datos sensibles, ya sea de manera intencionada o accidental. Además, señala, “la información personal que recopilamos puede almacenarse en servidores ubicados fuera del país donde vive el usuario. Almacenamos los datos en servidores seguros localizados en la República Popular China”.
A los analistas les preocupa que la debilidad de las leyes de protección de datos en dicho país permita que esta información sea retenida, procesada o expuesta sin un control adecuado. Además, hay quienes consideran que este modelo sea una evolución de TikTok.