PT-2026-38288 · Vllm · Vllm
Yunzez
·
Publicado
2026-05-06
·
Atualizado
2026-05-12
·
CVE-2026-44223
CVSS v3.1
6.5
Média
| Vetor | AV:N/AC:L/PR:L/UI:N/S:U/C:N/I:N/A:H |
Nome do Software Vulnerável e Versões Afetadas
vLLM versões 0.18.0 até 0.19.1
Description
O propositor de decodificação especulativa
extract hidden states retorna um tensor com um formato incorreto após a primeira etapa de decodificação, levando a um RuntimeError que interrompe o processo EngineCore. Isso ocorre quando qualquer solicitação em um lote utiliza parâmetros de penalidade de amostragem: repetition penalty, frequency penalty ou presence penalty. O problema originou-se de uma refatoração na função propose(), onde a remoção da chamada .unsqueeze(-1) causou uma incompatibilidade de formato de transmissão durante a aplicação da penalidade, pois o amostrador de rejeição produz um formato de (batch size, 2) em vez do esperado (batch size, 1) após a primeira etapa de decodificação. Uma única solicitação contendo um parâmetro de penalidade é suficiente para causar a interrupção determinística e imediata do servidor, resultando em perda total da disponibilidade do serviço.Recommendations
Atualizar para a versão 0.20.0.
Evitar o uso de
extract hidden states como método de decodificação especulativa.
Remover ou rejeitar os parâmetros repetition penalty, frequency penalty e presence penalty das solicitações recebidas no gateway de API.Exploit
Correção
Incorrect Type Conversion or Cast
Encontrou algum problema na descrição? Tem algo a acrescentar? Fique à vontade para nos escrever 👾
Identificadores relacionados
Produtos afetados
Vllm