El nuevo modelo de DeepSeek reduce los costos de inferencia de la IA
DeepSeek presenta V3.2-exp, un modelo diseñado para reducir significativamente los costos de inferencia con su innovador sistema de atención dispersa.
posted on 29/09/2025DeepSeek presenta V3.2-exp, un modelo diseñado para reducir significativamente los costos de inferencia con su innovador sistema de atención dispersa.
posted on 29/09/2025Google revela Ironwood, su TPU de 7ª generación, optimizada para inferencia de IA, ofreciendo rendimiento y eficiencia mejorados para clientes de Google Cloud.
posted on 09/04/2025Explorando el potencial de la búsqueda en tiempo de inferencia como una nueva ley de escala de la IA, examinando sus beneficios y limitaciones según los expertos.
posted on 19/03/2025