PT-2024-15407 · Langchain Ai · Langchain

Eyurtsev

·

Publicado

2024-02-24

·

Atualizado

2025-02-25

·

CVE-2024-0243

CVSS v3.1

8.1

Alta

VetorAV:N/AC:H/PR:N/UI:N/S:U/C:H/I:H/A:H
Nome do software vulnerável e versões afetadas
Versões do langchain anteriores àquela que inclui a correção disponível em https://github.com/langchain-ai/langchain/pull/15559
Descrição
O problema ocorre quando um invasor controla o conteúdo de um site, como https://example.com, e insere um arquivo HTML malicioso com links para sites externos, como https://example.completely.different/my file.html. Mesmo com prevent outside=True definido na configuração do rastreador, o RecursiveUrlLoader ainda baixaria o arquivo do site externo. Isso se deve ao comportamento do carregador ao encontrar links no conteúdo HTML.
Recomendações
Para versões anteriores à correção em https://github.com/langchain-ai/langchain/pull/15559, considere atualizar para uma versão que inclua essa correção para resolver o problema. Como solução alternativa temporária, considere restringir o parâmetro url no RecursiveUrlLoader para permitir apenas links de domínios confiáveis até que um patch esteja disponível. Além disso, tenha cuidado ao usar o parâmetro extractor com funções lambda que analisam conteúdo HTML, pois isso pode potencialmente levar a downloads indesejados.

Exploit

Correção

SSRF

Encontrou algum problema na descrição? Tem algo a acrescentar? Fique à vontade para nos escrever 👾

Enumeração de Fraquezas

Identificadores relacionados

CVE-2024-0243
GHSA-H9J7-5XVC-QHG5
PYSEC-2024-235

Produtos afetados

Langchain