sampanews.com
  • Cidades
  • Mundo
  • Política
  • Negócios
  • Esporte
  • Saúde
  • Cultura
  • Tecnologia
  • Auto

O que você está procurando?

Auto Cidades Cultura Economia Esporte Mundo Negócios

Recente

Jaques Wagner diz que rejeição de Messias foi usada para dar ‘cassetada’ em Lula
6 de maio de 2026
IA do Claude poderá ‘sonhar’ e melhorar suas capacidades sozinha
6 de maio de 2026
Justiça inglesa nega novo recurso de mineradora sobre caso Mariana
6 de maio de 2026
Governo descarta riscos em encontro de Lula com Trump após telefonema em tom amistoso
6 de maio de 2026
quarta-feira, maio 6, 2026
Top Posts
Jaques Wagner diz que rejeição de Messias foi...
IA do Claude poderá ‘sonhar’ e melhorar suas...
Justiça inglesa nega novo recurso de mineradora sobre...
Governo descarta riscos em encontro de Lula com...
Maio Cultural 2026 leva programação gratuita de arte...
Anthropic vai usar supercomputador de IA da SpaceX
Enorme tsunami de 2025 no Alasca foi o...
PGR pede a André Mendonça para manter prisão...
Cupom Ray-Ban: até 50% off em ofertas de...
Israel diz que realizou ataque contra comandante da...
sampanews.com
Banner
  • Cidades
  • Mundo
  • Política
  • Negócios
  • Esporte
  • Saúde
  • Cultura
  • Tecnologia
  • Auto

O que você está procurando?

Auto Cidades Cultura Economia Esporte Mundo Negócios

Recente

Jaques Wagner diz que rejeição de Messias foi usada para dar ‘cassetada’ em Lula
6 de maio de 2026
IA do Claude poderá ‘sonhar’ e melhorar suas capacidades sozinha
6 de maio de 2026
Justiça inglesa nega novo recurso de mineradora sobre caso Mariana
6 de maio de 2026
Governo descarta riscos em encontro de Lula com Trump após telefonema em tom amistoso
6 de maio de 2026
sampanews.com

O que você está procurando?

Auto Cidades Cultura Economia Esporte Mundo Negócios

Recente

Jaques Wagner diz que rejeição de Messias foi usada para dar ‘cassetada’ em Lula
6 de maio de 2026
IA do Claude poderá ‘sonhar’ e melhorar suas capacidades sozinha
6 de maio de 2026
Justiça inglesa nega novo recurso de mineradora sobre caso Mariana
6 de maio de 2026
Governo descarta riscos em encontro de Lula com Trump após telefonema em tom amistoso
6 de maio de 2026
sampanews.com
  • Cidades
  • Mundo
  • Política
  • Negócios
  • Esporte
  • Saúde
  • Cultura
  • Tecnologia
  • Auto
Copyright 2026 - Todos os Direitos Reservados

Bleeding Llama: falha no Ollama vaza dados de 300 mil servidores

por SampaNews 6 de maio de 2026
6 de maio de 2026
6

Uma falha permite acessar dados confidenciais de servidores que rodam o Ollama sem precisar de senha ou credenciais. Descoberta pela empresa de segurança Cyera, a falha afeta cerca de 300 mil instâncias expostas na internet e recebeu nota 9.3 de 10 na escala de gravidade CVSS. Ela foi registrada como CVE-2026-7482 e apelidada de “Bleeding Llama”.

O Ollama é uma plataforma de código aberto que possibilita rodar modelos de linguagem diretamente em servidores próprios, sem depender de serviços como OpenAI ou Anthropic. Empresas usam a ferramenta para hospedar modelos como Llama e Mistral internamente, mantendo os dados dentro da própria infraestrutura. A solução tem mais de 170 mil estrelas no GitHub e passou de 100 milhões de downloads no Docker Hub.

smart_display

Nossos vídeos em destaque

Diagrama mostra o fluxo do ataque Bleeding Llama: o atacante envia um arquivo GGUF malicioso via /api/create, o servidor salva o modelo com dados vazados da memória heap e, em seguida, o /api/push envia o arquivo completo para um servidor externo controlado pelo atacante. Imagem: Cyera.

O problema é que, por padrão, o Ollama não exige autenticação. Ele também escuta em todas as interfaces de rede da máquina onde está instalado, o que significa que qualquer instância acessível pela internet está automaticamente exposta.

Como funciona a falha

Para entender o bug, é preciso saber o que são arquivos GGUF. Esse é o formato usado para armazenar os pesos dos modelos de linguagem, basicamente os dados que representam tudo que o modelo aprendeu durante o treinamento.

bleeding llama (2).png
Os metadados do tensor original são copiados para um novo objeto com tipo atualizado, mas sem validação do tamanho real dos dados. Imagem: Cyera.

Dentro de um arquivo GGUF existem estruturas chamadas tensores, que são arrays multidimensionais de números. Cada tensor tem um campo que informa quantos elementos ele contém.

O problema está justamente aí. O Ollama não verifica se o número declarado de elementos corresponde ao tamanho real dos dados no arquivo. Um atacante pode criar um GGUF malicioso informando que o tensor tem 1 milhão de elementos quando, na prática, ele tem muito menos.

Quando o servidor tenta processar esse arquivo, ele lê muito além da área de memória reservada para aqueles dados.

bleeding llama (3).png
Diagrama mostra como o Ollama processa um arquivo GGUF ao criar um modelo. O arquivo bruto passa pela função ggufLayer, que extrai metadados do arquivo e os tensores do modelo, estruturando tudo em uma camada interna usada nas etapas seguintes. Imagem: Cyera.

Isso é o que os pesquisadores chamam de heap out-of-bounds read, ou seja, uma leitura fora dos limites da memória alocada. O heap é a região da memória onde o sistema armazena dados em uso. No caso do Ollama, essa memória contém prompts de usuários, chaves de API, variáveis de ambiente e saídas de ferramentas conectadas ao servidor.

Por que os dados chegam intactos ao atacante

Normalmente, ao processar um arquivo GGUF, o Ollama converte os tensores de um formato para outro, o que poderia corromper os dados vazados durante o processo. Os pesquisadores encontraram uma forma de contornar isso usando uma conversão específica entre os formatos F16 e F32.

F16 e F32 são formas de representar números com diferentes níveis de precisão. A conversão de F16 para F32 é sem perda de dados, isso porque cada número passa de 2 bytes para 4 bytes sem descarte de informação. Isso significa que os dados lidos além do limite da memória chegam ao arquivo de saída exatamente como estavam na memória original.

bleeding llama (4).png
O servidor valida o nome do modelo e os caminhos dos arquivos, mas não impede que o nome seja uma URL externa, lacuna que viabiliza a exfiltração dos dados vazados via /api/push. Imagem: Cyera.

Três chamadas de API são suficientes para o ataque completo

O ataque inteiro utiliza apenas três chamadas à API do Ollama, todas sem autenticação. Primeiro, o atacante envia o arquivo GGUF malicioso para o servidor. Depois, cria um modelo usando esse arquivo e define como nome do modelo uma URL controlada por ele.

Por fim, usa a função nativa de push do Ollama para enviar o modelo para um servidor externo.

Essa função de push existe para que usuários possam publicar modelos em repositórios remotos. O Ollama não impede que o nome do modelo seja uma URL arbitrária, o que torna possível redirecionar o envio para qualquer servidor. O arquivo enviado contém os dados vazados da memória, incluindo tudo que estava sendo processado no servidor no momento do ataque.

bleeding llama (5).png
Diagrama mostra as duas formas de criar modelos no Ollama via /api/create: a partir de arquivos locais em formato GGUF ou a partir de um registro remoto. A ausência de validação no campo de nome do modelo permite que uma URL controlada pelo atacante seja usada no lugar de um identificador legítimo. Imagem: Cyera.

O que pode ser exposto

A Cyera demonstrou que a memória extraída contém prompts enviados por usuários, system prompts de outros modelos em execução no mesmo servidor e variáveis de ambiente da máquina hospedeira. Isso inclui chaves de API, tokens de autenticação e segredos de configuração.

Em ambientes corporativos, o impacto pode ser ainda maior. Quando o Ollama está conectado a ferramentas como o Claude Code, todas as saídas dessas ferramentas passam pelo servidor e ficam registradas na memória. Contratos de clientes, código proprietário e dados de produção podem ser expostos sem que a organização perceba.

Correção disponível e medidas recomendadas

A Ollama corrigiu a vulnerabilidade na versão 0.17.1. A recomendação imediata é atualizar todas as instâncias assim que possível. Além da atualização, as organizações devem colocar um proxy de autenticação na frente do servidor, restringir o acesso por firewall e isolar o Ollama em segmentos de rede sem exposição direta à internet.

bleeding llama (1).png
Trecho do código-fonte do Ollama em Go mostra a função WriteTo, responsável pela conversão de tensores. A seção destacada em vermelho indica a chamada a ConvertToF32, que lê um número de elementos definido pelo próprio arquivo GGUF sem validar se esse valor corresponde ao tamanho real dos dados. Imagem: Cyera.

A Cyera também recomenda auditar instâncias em execução para verificar exposição externa. Qualquer servidor acessível pela internet deve ser tratado como potencialmente comprometido, e as credenciais que passaram por ele devem ser rotacionadas.

Acompanhe o TecMundo nas redes sociais. Para mais notícias de segurança e tecnologia, inscreva-se em nossa newsletter e canal do YouTube.

autor de origem

Compartilhar 0 FacebookTwitterLinkedinWhatsapp
postagem anterior
Governo reduz juros e amplia prazo de pagamento de programa para financiar reformas
próxima postagem
Tarcísio responde sobre piora da segurança e diz que rankings não superam dados

Você também pode gostar

IA do Claude poderá ‘sonhar’ e melhorar suas...

6 de maio de 2026

Anthropic vai usar supercomputador de IA da SpaceX

6 de maio de 2026

Cupom Ray-Ban: até 50% off em ofertas de...

6 de maio de 2026

iFood usa IA para exibir bulas de remédios...

6 de maio de 2026

POSTS MAIS RECENTES

  • Jaques Wagner diz que rejeição de Messias foi usada para dar ‘cassetada’ em Lula
  • IA do Claude poderá ‘sonhar’ e melhorar suas capacidades sozinha
  • Justiça inglesa nega novo recurso de mineradora sobre caso Mariana
  • Governo descarta riscos em encontro de Lula com Trump após telefonema em tom amistoso
  • Maio Cultural 2026 leva programação gratuita de arte e música a Bragança Paulista

Siga-nos

  • Recente
  • Popular
  • Jaques Wagner diz que rejeição de Messias foi usada para dar ‘cassetada’ em Lula

    6 de maio de 2026
  • IA do Claude poderá ‘sonhar’ e melhorar suas capacidades sozinha

    6 de maio de 2026
  • Justiça inglesa nega novo recurso de mineradora sobre caso Mariana

    6 de maio de 2026
  • Governo descarta riscos em encontro de Lula com Trump após telefonema em tom amistoso

    6 de maio de 2026
  • 1

    Assessor ⁠da Casa Branca diz que novo chair do Fed deve ser “uma pessoa independente”

    22 de janeiro de 2026
  • 2

    IPVA mais caro do Brasil custa R$ 1 milhão; veja o carro mais caro de cada estado

    20 de janeiro de 2026
  • 3

    WordPress ganha assistente de IA integrado a sites para edição e design

    18 de fevereiro de 2026
  • 4

    (Des)controle discute o alcoolismo feminino e a dificuldade de pedir ajuda: “Essa história tem que ser contada”

    6 de fevereiro de 2026

Postagens em destaque

Anthropic vai usar supercomputador de IA da SpaceX

6 de maio de 2026

Enorme tsunami de 2025 no Alasca foi o...

6 de maio de 2026

PGR pede a André Mendonça para manter prisão...

6 de maio de 2026

Cupom Ray-Ban: até 50% off em ofertas de...

6 de maio de 2026

Israel diz que realizou ataque contra comandante da...

6 de maio de 2026

Leitura obrigatória

  • Jaques Wagner diz que rejeição de Messias foi usada para dar ‘cassetada’ em Lula

    6 de maio de 2026
  • IA do Claude poderá ‘sonhar’ e melhorar suas capacidades sozinha

    6 de maio de 2026
  • Justiça inglesa nega novo recurso de mineradora sobre caso Mariana

    6 de maio de 2026
  • Governo descarta riscos em encontro de Lula com Trump após telefonema em tom amistoso

    6 de maio de 2026
  • Maio Cultural 2026 leva programação gratuita de arte e música a Bragança Paulista

    6 de maio de 2026

Newsletter

Posts relacionados

  • IA do Claude poderá ‘sonhar’ e melhorar suas capacidades sozinha

    6 de maio de 2026
  • Anthropic vai usar supercomputador de IA da SpaceX

    6 de maio de 2026
  • Cupom Ray-Ban: até 50% off em ofertas de Maio de 2026

    6 de maio de 2026
  • iFood usa IA para exibir bulas de remédios em pedidos de farmácia

    6 de maio de 2026
  • Luke Cage está de volta ao MCU em Demolidor Renascido! Saiba tudo sobre o retorno

    6 de maio de 2026

Mais vistas da semana

Previsão do tempo: Campinas deve ter sábado de sol entre nuvens e sem chuva
2 de maio de 2026
Hackers norte-coreanos usaram o Claude para infectar pacote NPM com vírus
1 de maio de 2026
Onça-pintada do Parque Ecológico de Americana morre aos 21 anos
3 de maio de 2026

Postagens Aleatórias

Nintendo comenta importância de Star Fox e relação entre jogos e filmes
4 de maio de 2026
Fones e caixas de som da Coca-Cola: 5 modelos para conhecer na loja oficial na Shopee
22 de fevereiro de 2026
Conta de luz vai ficar mais cara em maio; veja valores
25 de abril de 2026

Categorias Populares

  • Tecnologia (3.719)
  • Política (2.827)
  • Mundo (2.643)
  • Campinas (1.255)
  • Economia (992)
  • Negócios (973)
  • Auto (730)
  • Bragança Paulista (670)
  • Esporte (402)
  • Cultura (296)

Notícias de São Paulo e do mundo, em tempo real. Cobertura completa de política, economia, mercado, cidades e assuntos que importam — com contexto e credibilidade.

Facebook Twitter Instagram Linkedin Youtube

Copyright © 2026 SampaNews. Todos os Direitos Reservados.

  • Anuncie
  • Contato
  • Política de Privacidade
sampanews.com
  • Home