Lo que DeepSeek V4 realmente lanza y el sustrato de tier-de-costo contra el que califica la matriz de enrutamiento de FY27
La convergencia de la pista-de-frontera-China que anclaba el Q1 2026 — seis laboratorios chinos de frontera lanzando dentro de la misma ventana de dos semanas — se estabilizó en una sola entrada portante dentro de Q2: DeepSeek V4, lanzado con pesos abiertos bajo la licencia MIT en dos variantes — V4 Pro con 1.6T parámetros totales / 49B activos y V4 Flash con 284B totales / 13B activos — ambos soportando una ventana de contexto de 1 millón de tokens por defecto. El precio aterrizó en $1.74 por millón de tokens de entrada y $3.48 por millón de tokens de salida al tier Pro (Flash a $0.14/$0.28), contra el tier estándar de $5/$25 de Opus 4.7 contra el que se ha anclado el espacio del contrato permanente de FY27 — aproximadamente 1/20 del costo por-token-de-salida en la banda de frontera de grado-de-producción contra la que el comprador de industria-regulada estaba leyendo contra el límite de presupuesto-por-token contra el que se escribió el plan de FY27.
Las piezas operativamente importantes:
- El sustrato de tier-de-costo acaba de colapsar por un factor de 20 contra la banda de costo por-token-de-salida contra la que se escribió el contrato permanente de FY27. El límite de costo por-token-de-salida del contrato permanente contra el que el plan de FY27 codificó la banda de frontera clase-Opus 4.7 ($25 por millón de tokens de salida) era el límite contra el que la política de enrutamiento de modelo por-carga-de-trabajo corría la decisión de enrutamiento por-prompt. La entrada de DeepSeek V4 Pro a $3.48 por millón de tokens de salida contra la misma banda de precisión en las cargas de trabajo de forma-de-verificador contra las que califica el equipo (matemáticas, emisión-de-código, extracción estructurada, conformidad de esquema) colapsa el sustrato de tier-de-costo por 7-20x contra la misma superficie de grado-por-carga-de-trabajo. La lectura honesta no es la decisión de enrutamiento por-carga-de-trabajo se mueve por completo a DeepSeek; es el tier-de-costo por-token-de-salida contra el que califica la política de enrutamiento simplemente cambió lo suficiente como para que la decisión de enrutamiento por-carga-de-trabajo contra la banda de carga-de-trabajo de forma-de-verificador tenga un arbitraje de costo-por-token contra el que no se escribió el contrato permanente.
- Pesos-abiertos bajo MIT cierra el espacio on-prem y de fine-tuning que la frontera de pesos-cerrados no podía llenar. La licencia MIT — la más permisiva de las licencias estándar de código abierto — cierra el espacio de despliegue on-premises, sustrato de inferencia controlado-por-comprador-de-industria-regulada, y fine-tuning por-carga-de-trabajo que la frontera de pesos-cerrados no podía llenar contra la superficie de cumplimiento de industria-regulada. El comité de cumplimiento que no podía respaldar la frontera de pesos-cerrados contra el requisito de residencia-de-datos por-entorno contra el que se escribió el plan de despliegue-de-producción de FY27 ahora tiene un sustrato de pesos-abiertos de banda-frontera dentro de la envolvente de cumplimiento por-entorno; el espacio de fine-tuning por-carga-de-trabajo contra el que corre el engagement de servicios-de-entrenamiento-de-IA ahora tiene un modelo base de pesos-abiertos de banda-frontera contra el que se puede escribir el contrato permanente de fine-tuning.
- La arquitectura MoE de 1.6T parámetros con 49B activos es la forma de inferencia-de-producción contra la que corre la calificación de costo-por-token del contrato permanente. Una forma mixture-of-experts de 1.6T-totales / 49B-activos es el sustrato contra el que califica la curva de costo-de-inferencia por-token — el costo por-token contra el que el equipo respalda el límite de costo-de-inferencia del contrato permanente está acotado por el cómputo por-token contra la fracción 49B-activa, no contra el conteo de parámetros 1.6T-totales. La curva de costo por-token contra la que se escribió el contrato permanente de FY27 era la curva de costo por-token al sustrato de inferencia de pesos-cerrados; la curva de costo por-token al sustrato de inferencia MoE de pesos-abiertos contra la fracción 49B-activa es la curva de costo por-token contra la que el plan de FY27 tiene que re-codificar el límite de presupuesto-por-token.
- La integración con chips Huawei es la señal regulatoria-y-de-cadena-de-suministro contra la que la diligencia de adquisición por-carga-de-trabajo tiene que codificar. DeepSeek V4 está diseñado contra una integración estrecha con el stack de chips de Huawei — la superficie de cadena-de-suministro contra la que califica el régimen de control-de-exportaciones del gobierno de EE.UU. La lectura honesta es el sustrato de pesos-abiertos bajo MIT es portable a través del sustrato de inferencia por-entorno contra el que el equipo elige correr (el sustrato de inferencia por-entorno que el comprador de industria-regulada elige corre el sustrato de pesos-abiertos contra el hardware controlado-por-comprador, no contra la integración con Huawei contra la que se entrenó el modelo). La diligencia de adquisición por-carga-de-trabajo tiene que codificar la decisión del sustrato-de-inferencia por-entorno contra la superficie regulatoria-y-de-cadena-de-suministro explícitamente; el sustrato es portable, pero la decisión del sustrato-de-inferencia por-entorno es el artefacto contra el que el comité de cumplimiento respalda, no la superficie de cadena-de-suministro del entrenamiento-de-modelo.
La lectura estructural no es DeepSeek V4 reemplaza la frontera de pesos-cerrados. Es que el sustrato de tier-de-costo contra la banda de carga-de-trabajo de producción de forma-de-verificador acaba de colapsar por 1/20 contra el límite de costo por-token-de-salida contra el que se escribió el contrato permanente de FY27, la superficie de pesos-abiertos bajo MIT cierra el espacio on-prem y de fine-tuning que la frontera de pesos-cerrados no podía llenar, y la matriz de enrutamiento de modelo por-carga-de-trabajo de FY27 tiene que codificar el espacio de tier-de-costo-y-pesos-abiertos contra el que el sustrato acaba de aterrizar, no la política de enrutamiento por-prompt contra la banda de frontera de pesos-cerrados contra la que el contrato permanente ancló.
Lo que el sustrato de tier-de-costo de pesos-abiertos reestructura sobre las adquisiciones de enrutamiento-de-modelos de FY27
Cuatro cambios concretos que se siguen cuando la curva de costo por-token colapsa por 1/20 contra la banda de carga-de-trabajo de producción de forma-de-verificador.
La matriz de enrutamiento de modelo por-prompt añade un espacio de tier-de-costo-y-pesos-abiertos por-carga-de-trabajo, con la banda de frontera de pesos-cerrados enrutando solo las clases de carga de trabajo cuyo arbitraje de tier-de-costo no sobrevive. La banda de frontera de pesos-cerrados contra la que ancló el plan de FY27 — clase-Opus 4.7, clase-GPT-5.5, clase-Gemini 3.5 Flash — era el default de política-de-enrutamiento por-carga-de-trabajo contra cada clase de carga de trabajo contra la que corre el bucle del agente de programación del equipo. El espacio de tier-de-costo de pesos-abiertos invierte el default contra la banda de carga-de-trabajo de producción de forma-de-verificador (matemáticas, emisión-de-código, extracción estructurada, conformidad de esquema, seguimiento-de-formato — las clases de carga de trabajo contra las que el verificador determinista cierra la brecha de precisión por-output): el default enruta al espacio de tier-de-costo de pesos-abiertos, y la banda de frontera de pesos-cerrados carga el camino de escalación por-carga-de-trabajo para las cargas de trabajo de brecha-de-cobertura-del-verificador que el sustrato de pesos-abiertos no puede respaldar. El equipo que lanza la actualización de la política de enrutamiento por-prompt contra la banda de carga-de-trabajo de forma-de-verificador compra el arbitraje de tier-de-costo por-token-de-salida 1/20; el equipo que pospone la actualización paga el sobrecosto por-token contra el que el límite de costo por-token del contrato permanente anterior no aprovisionó.
El espacio on-prem y de fine-tuning se convierte en el espacio portante de proveedor-permanente contra el que corre el engagement de entrenamiento-de-IA de FY27. La banda de frontera de pesos-cerrados contra la que se escribió el engagement de entrenamiento-de-IA de FY27 no podía respaldar el espacio de residencia-de-datos por-entorno, fine-tuning por-carga-de-trabajo, o sustrato de inferencia controlado-por-comprador contra el que el comité de cumplimiento del comprador de industria-regulada requiere que corra el engagement de entrenamiento-de-IA. El sustrato de pesos-abiertos bajo MIT a la banda-frontera cierra el espacio — el engagement de fine-tuning por-carga-de-trabajo contra el mapa de cobertura del verificador de carga-de-trabajo-de-producción se puede escribir contra el modelo base de pesos-abiertos, el sustrato de inferencia por-entorno se puede escribir contra el hardware controlado-por-comprador, y la superficie de residencia-de-datos por-entorno se puede escribir contra el despliegue de inferencia por-entorno. El contrato permanente de servicios-de-entrenamiento-de-IA que se escribió contra la banda de frontera de pesos-cerrados necesita el espacio de fine-tuning de pesos-abiertos por-carga-de-trabajo añadido como una partida de primer nivel; el equipo que re-escribe el contrato este trimestre toma el espacio de clase-de-carga-de-trabajo de fine-tuning-de-pesos-abiertos contra el que el engagement de entrenamiento-de-IA carga los ingresos por-ciclo.
La decisión del sustrato-de-inferencia por-entorno se convierte en el nuevo artefacto de diligencia de adquisición por-carga-de-trabajo contra el que respalda el comité de cumplimiento. El sustrato de inferencia por-token de la banda de frontera de pesos-cerrados era la superficie de API hospedada del proveedor de pesos-cerrados — la decisión del sustrato-de-inferencia por-entorno era trivial (llama a la API). El sustrato de pesos-abiertos bajo MIT a la banda-frontera hace la decisión del sustrato-de-inferencia por-entorno portante — el sustrato es portable a través de la elección del equipo de inferencia hospedada (Anyscale, Fireworks, Together), la inferencia on-prem controlada-por-comprador, la inferencia edge controlada-por-entorno, y el despliegue de inferencia con fine-tuning controlada-por-grado-por-carga-de-trabajo. La decisión del sustrato-de-inferencia-por-entorno es el nuevo artefacto de diligencia de adquisición por-carga-de-trabajo contra el que el comité de cumplimiento respalda el contrato permanente de FY27; el equipo que lanza la decisión del sustrato-de-inferencia por-entorno implícita lanza la brecha de defensibilidad-ante-el-comité-de-cumplimiento que la decisión del sustrato por-entorno debería haber expuesto.
El límite de presupuesto-por-token del contrato permanente se re-codifica contra la curva de costo por-carga-de-trabajo, no contra el límite de costo por-prompt contra el que ancló la banda de frontera de pesos-cerrados. El límite de costo por-prompt contra el que se ancló el contrato permanente de FY27 era el límite de costo por-token en la banda de frontera de pesos-cerrados — un solo número contra un solo sustrato. La curva de costo por-carga-de-trabajo contra la que corre la política de enrutamiento por-prompt contra el sustrato de tier-de-costo y banda-frontera de pesos-abiertos es el artefacto portante de calificación-de-costo por-carga-de-trabajo — un número por-banda-de-carga-de-trabajo contra un sustrato por-banda-de-carga-de-trabajo, con la política de enrutamiento por-prompt calificando contra la curva de costo por-banda-de-carga-de-trabajo, no contra el límite de costo por-prompt. El equipo que re-codifica el límite de presupuesto-por-token del contrato permanente contra la curva de costo por-carga-de-trabajo compra el arbitraje de tier-de-costo por-carga-de-trabajo que provee el sustrato; el equipo que pospone la re-codificación lanza la brecha del contrato permanente de FY27 que el límite de costo por-prompt de pesos-cerrados ya ha expuesto contra el sustrato.
Dónde el sustrato de tier-de-costo de pesos-abiertos es señal y dónde es ruido
Cuatro lecturas honestas sobre lo que DeepSeek V4 realmente le dice al comprador en la revisión de diligencia de enrutamiento-de-modelos de FY27.
Señal: el arbitraje de tier-de-costo por-carga-de-trabajo en la banda de carga-de-trabajo de producción de forma-de-verificador es la propiedad operativa portante del sustrato. El colapso del tier-de-costo por-token-de-salida 1/20 contra la banda de carga-de-trabajo de producción de forma-de-verificador es la propiedad operativa que la política de enrutamiento por-carga-de-trabajo traduce al arbitraje de tier-de-costo por-carga-de-trabajo. El equipo que lanza la actualización de la política de enrutamiento por-prompt contra la banda de carga-de-trabajo de forma-de-verificador compra el arbitraje de tier-de-costo por-carga-de-trabajo en el límite de presupuesto-por-token del contrato permanente de FY27; el equipo que no lanza la actualización lanza el sobrecosto por-token contra el que se ancló la banda de frontera de pesos-cerrados.
Señal: la licencia MIT es el artefacto portante de portabilidad del espacio on-prem y de fine-tuning, no la señal de superficie-de-marketing. La licencia MIT es la más permisiva de las licencias estándar de código abierto — la superficie de despliegue por-entorno, fine-tuning por-carga-de-trabajo, sustrato de inferencia controlado-por-comprador es abierta contra el sustrato que el licenciatario elige desplegar. El comité de cumplimiento que no podía respaldar la superficie de API hospedada de la banda de frontera de pesos-cerrados contra el requisito de residencia-de-datos por-entorno tiene un sustrato respaldable de pesos-abiertos a la banda-frontera; la decisión del sustrato-de-inferencia por-entorno que el sustrato hace portante es el artefacto contra el que el comité de cumplimiento califica, y el artefacto contra el que corre la diligencia del sustrato-de-inferencia-por-entorno.
Ruido: el límite de costo por-prompt sobre la política de enrutamiento por-prompt no es la curva de costo por-carga-de-trabajo contra la que califica el sustrato. El límite de costo por-prompt sobre el límite de presupuesto-por-token del contrato permanente era el límite de costo por-token anclado a la banda-frontera de pesos-cerrados; la curva de costo por-carga-de-trabajo contra la que califica el sustrato de pesos-abiertos es la curva de costo por-banda-de-carga-de-trabajo, con la política de enrutamiento por-prompt corriendo contra la curva de costo por-banda-de-carga-de-trabajo, no contra el límite de costo por-prompt. El equipo que corre el sustrato contra el límite de costo por-prompt malinterpreta la curva de costo por-carga-de-trabajo contra la que califica el sustrato y paga el sobrecosto por-prompt contra el que se traduce la curva de costo por-carga-de-trabajo; el equipo que corre contra la curva de costo por-carga-de-trabajo traduce el arbitraje de tier-de-costo por-carga-de-trabajo a la decisión de enrutamiento por-banda-de-carga-de-trabajo que el sustrato respalda.
Ruido: la señal de cadena-de-suministro de integración-con-chips-Huawei no es un descalificador del sustrato-de-inferencia por-entorno. La señal de cadena-de-suministro de integración-con-chips-Huawei es la señal de cadena-de-suministro del entrenamiento-de-modelo — el sustrato de inferencia por-entorno es portable a través del hardware de inferencia por-entorno contra el que el equipo elige desplegar. La lectura honesta es el sustrato de pesos-abiertos es portable, la decisión del sustrato-de-inferencia por-entorno es el artefacto contra el que el comité de cumplimiento respalda, y la diligencia de adquisición por-carga-de-trabajo codifica la decisión del sustrato-de-inferencia por-entorno contra la superficie regulatoria-y-de-cadena-de-suministro explícitamente — no el sustrato es descalificado contra el espacio del sustrato-de-inferencia por-entorno contra el que respalda el comité de cumplimiento del comprador de industria-regulada.
Lo que el equipo de ingeniería debería hacer en el próximo trimestre
Cuatro acciones concretas que cierran la brecha entre el sustrato de tier-de-costo de pesos-abiertos y la política de enrutamiento por-prompt de FY27 contra la que el sustrato reestructura.
Actualizar la política de enrutamiento por-prompt contra la banda de carga-de-trabajo de producción de forma-de-verificador con el espacio de tier-de-costo y banda-frontera de pesos-abiertos como la ruta-por-defecto dentro del próximo sprint. El artefacto de política-de-enrutamiento en el repo del equipo es el artefacto portante dentro del cual aterriza el arbitraje de tier-de-costo por-carga-de-trabajo. Actualizar la ruta-por-defecto contra la banda de carga-de-trabajo de producción de forma-de-verificador (matemáticas, emisión-de-código, extracción estructurada, conformidad de esquema, seguimiento-de-formato) de la banda de frontera de pesos-cerrados al espacio de tier-de-costo y banda-frontera de pesos-abiertos, escribir el camino de escalación por-clase-de-carga-de-trabajo contra la banda de frontera de pesos-cerrados para las cargas de trabajo de brecha-de-cobertura-del-verificador, y lanzar la política con la cadencia de revisión por-ciclo contra la que el siguiente ciclo-de-sustrato re-valida. El equipo que lanza la actualización de política de enrutamiento dentro del próximo sprint traduce el arbitraje de tier-de-costo por-token-de-salida 1/20 a la superficie de costo por-prompt; el equipo que pospone la actualización lanza el sobrecosto por-token contra el que el límite de costo por-token del contrato permanente anterior no aprovisionó.
Ejecutar una diligencia del sustrato-de-inferencia por-entorno dentro de las próximas dos semanas contra la curva de costo por-carga-de-trabajo y la superficie regulatoria-y-de-cadena-de-suministro. La decisión del sustrato-de-inferencia por-entorno es el nuevo artefacto de diligencia de adquisición por-carga-de-trabajo. Para cada una de las tres clases de carga de trabajo de producción de forma-de-verificador principales del equipo, ejecutar la entrada de diligencia del sustrato-de-inferencia por-entorno — mapa de proveedor de inferencia-hospedada (Anyscale, Fireworks, Together), curva de costo de inferencia on-prem controlada-por-comprador, superficie de latencia de inferencia edge controlada-por-entorno, tier-de-costo de despliegue de inferencia con fine-tuning de grado-por-carga-de-trabajo — contra la curva de costo por-carga-de-trabajo y la superficie regulatoria-y-de-cadena-de-suministro. El artefacto que la diligencia produce es el mapa de decisión del sustrato-de-inferencia por-entorno contra el que el contrato permanente de FY27 respalda; el equipo que ejecuta la diligencia este trimestre toma la decisión de adquisición con-forma-de-decisión-del-sustrato-de-inferencia por-entorno contra la curva de costo por-carga-de-trabajo.
Re-escribir el contrato permanente de servicios-de-entrenamiento-de-IA contra el espacio de fine-tuning por-carga-de-trabajo de pesos-abiertos dentro del próximo trimestre. El contrato permanente de servicios-de-entrenamiento-de-IA que se escribió contra la banda de frontera de pesos-cerrados necesita el espacio de fine-tuning por-carga-de-trabajo de pesos-abiertos añadido como una partida de primer nivel. Re-escribir el contrato contra la cadencia de ciclo-de-fine-tuning por-carga-de-trabajo (refresh del modelo base por-trimestre, ciclo de curación de brecha-de-cobertura-del-verificador por-trimestre, despliegue de fine-tuning por-carga-de-trabajo por-trimestre), el tier-de-costo por-carga-de-trabajo en el presupuesto de cómputo de fine-tuning por-carga-de-trabajo, la superficie de despliegue de fine-tuning por-entorno (residencia-de-datos por-entorno, sustrato-de-inferencia por-entorno, enrutamiento por-grado-de-carga-de-trabajo por-entorno), y el artefacto de traza-de-verificación por-output contra el que califica el ciclo de fine-tuning por-carga-de-trabajo. El equipo que re-escribe el contrato este trimestre toma el espacio de clase-de-carga-de-trabajo de fine-tuning de pesos-abiertos contra el que el engagement de entrenamiento-de-IA por-ciclo carga los ingresos; el equipo que no re-escribe paga la brecha del espacio de fine-tuning por-carga-de-trabajo por-ciclo contra la que no se escribió el contrato permanente.
Re-codificar el límite de presupuesto-por-token del contrato permanente contra la curva de costo por-carga-de-trabajo, no contra el límite de costo por-prompt contra el que ancló la banda de frontera de pesos-cerrados. El límite de presupuesto-por-token del contrato permanente se re-codifica contra la curva de costo por-carga-de-trabajo. Escribir la curva de costo por-carga-de-trabajo como una entrada de diligencia de primer nivel — límite de costo por-token-de-salida por-banda-de-carga-de-trabajo, límite de costo por-token-de-entrada por-banda-de-carga-de-trabajo, superficie de costo de política-de-enrutamiento por-grado-de-carga-de-trabajo por-banda-de-carga-de-trabajo, tier-de-costo del sustrato-de-inferencia por-entorno por-banda-de-carga-de-trabajo — y lanzar la curva de costo por-carga-de-trabajo como el artefacto contra el que la negociación del contrato permanente de FY27 califica, no el límite de costo por-prompt contra el que se ancló la banda de frontera de pesos-cerrados. El equipo que re-codifica el límite de presupuesto-por-token del contrato permanente contra la curva de costo por-carga-de-trabajo compra el arbitraje de tier-de-costo por-carga-de-trabajo que el sustrato provee; el equipo que pospone lanza el sobrecosto por-token por-ciclo contra el que se traduce la curva de costo por-carga-de-trabajo.
El trabajo de juicio-senior que el sustrato de tier-de-costo de pesos-abiertos hace operativamente barato pero no reemplaza
El sustrato de tier-de-costo de pesos-abiertos comprime el costo de pagar el límite de costo por-token-de-salida de la banda de frontera de pesos-cerrados contra la banda de carga-de-trabajo de producción de forma-de-verificador, ejecutar la decisión del sustrato-de-inferencia por-entorno contra la superficie de API hospedada de pesos-cerrados, escribir el engagement permanente de entrenamiento-de-IA contra la superficie de no-fine-tuning de la banda de frontera de pesos-cerrados, y calificar la política de enrutamiento por-prompt contra el límite de costo por-prompt contra el que ancló la banda de frontera de pesos-cerrados. No comprime el juicio-senior de decidir qué clases de carga de trabajo son de forma-de-verificador-y-enrutables-a-pesos-abiertos y cuáles no lo son, escribir el verificador por-carga-de-trabajo contra el sustrato de pesos-abiertos contra el que califica la política de enrutamiento por-prompt, ser dueño de la decisión del sustrato-de-inferencia por-entorno contra el que el comité de cumplimiento respalda, y re-escribir el engagement permanente de entrenamiento-de-IA contra el espacio de fine-tuning de pesos-abiertos por-carga-de-trabajo que el sustrato hace portante. Los equipos que confunden el costo por-token abaratado con el juicio abaratado son los equipos que enrutan la superficie de generación de forma-libre por-carga-de-trabajo contra el sustrato de pesos-abiertos contra el que la brecha-de-cobertura-del-verificador no cierra, y leen el post-mortem de fiabilidad-de-producción por-ciclo sobre la brecha de la política-de-enrutamiento que el mapa de cobertura del verificador por-carga-de-trabajo habría expuesto. Los equipos que mantienen el juicio-senior en el centro de la decisión de política-de-enrutamiento por-prompt son los equipos que traducen el arbitraje de tier-de-costo por-token-de-salida 1/20 a la superficie de tier-de-costo por-carga-de-trabajo que la banda de frontera de pesos-cerrados no podía producir. El sustrato es el apalancamiento; el juicio-senior es el muro portante.
La pregunta de enrutamiento de modelo ya no es qué proveedor de banda-frontera de pesos-cerrados ancla el contrato permanente; es para qué clases de carga de trabajo de producción de forma-de-verificador el sustrato de tier-de-costo de pesos-abiertos es la ruta-por-defecto, qué decisión del sustrato-de-inferencia por-entorno respalda el comité de cumplimiento, qué espacio de fine-tuning de pesos-abiertos por-carga-de-trabajo corre el engagement permanente de entrenamiento-de-IA, y qué curva de costo por-carga-de-trabajo re-codifica el límite de presupuesto-por-token del contrato permanente. Los equipos que hacen la pregunta correcta este trimestre traducen el arbitraje de tier-de-costo por-token-de-salida 1/20 a la superficie de tier-de-costo por-carga-de-trabajo; los equipos que hacen la incorrecta lanzan el sobrecosto por-token por-ciclo a la revisión de adquisiciones de FY28 contra un límite de costo por-prompt de banda-frontera-de-pesos-cerrados que el sustrato ya colapsó.
En SONNET CODE ejecutamos las prácticas de Desarrollo de IA y Entrenamiento de IA contra el sustrato de tier-de-costo de pesos-abiertos — actualizaciones de política de enrutamiento por-prompt contra la banda de carga-de-trabajo de producción de forma-de-verificador, diligencia del sustrato-de-inferencia por-entorno contra la curva de costo por-carga-de-trabajo, y ciclos de fine-tuning de pesos-abiertos por-carga-de-trabajo contra el artefacto de traza-de-verificación por-output. Si la política de enrutamiento por-prompt de tu equipo todavía está anclada contra el límite de costo por-token de la banda de frontera de pesos-cerrados, agenda una llamada — te llevaremos a través de la actualización de matriz-de-enrutamiento de tier-de-costo-y-pesos-abiertos por-carga-de-trabajo que lanzamos dentro de un sprint.

