sampanews.com
  • Cidades
  • Mundo
  • Política
  • Negócios
  • Esporte
  • Saúde
  • Cultura
  • Tecnologia
  • Auto

O que você está procurando?

Auto Cidades Cultura Economia Esporte Mundo Negócios

Recente

Motociclista morre em colisão frontal na Rodovia Alkindar Monteiro Junqueira
12 de junho de 2026
OpenAI é processada por suposta contribuição do ChatGPT em suicídio
12 de junho de 2026
Para quem faz sentido comprar um iPad Mini?
12 de junho de 2026
Sesc SP tem programação especial para celebrar a Copa de 2026
11 de junho de 2026
sexta-feira, junho 12, 2026
Top Posts
Motociclista morre em colisão frontal na Rodovia Alkindar...
OpenAI é processada por suposta contribuição do ChatGPT...
Para quem faz sentido comprar um iPad Mini?
Sesc SP tem programação especial para celebrar a...
Play Store libera 5 jogos grátis por tempo...
Coreia do Sul e República Tcheca fecham primeiro...
Anthropic admite que Fable 5 sabotava respostas sem...
12 modelos de impressão 3D úteis para fazer...
Uso de celular ao volante gera mais de...
Interpol prende 201 pessoas em operação contra golpes...
sampanews.com
Banner
  • Cidades
  • Mundo
  • Política
  • Negócios
  • Esporte
  • Saúde
  • Cultura
  • Tecnologia
  • Auto

O que você está procurando?

Auto Cidades Cultura Economia Esporte Mundo Negócios

Recente

Motociclista morre em colisão frontal na Rodovia Alkindar Monteiro Junqueira
12 de junho de 2026
OpenAI é processada por suposta contribuição do ChatGPT em suicídio
12 de junho de 2026
Para quem faz sentido comprar um iPad Mini?
12 de junho de 2026
Sesc SP tem programação especial para celebrar a Copa de 2026
11 de junho de 2026
sampanews.com

O que você está procurando?

Auto Cidades Cultura Economia Esporte Mundo Negócios

Recente

Motociclista morre em colisão frontal na Rodovia Alkindar Monteiro Junqueira
12 de junho de 2026
OpenAI é processada por suposta contribuição do ChatGPT em suicídio
12 de junho de 2026
Para quem faz sentido comprar um iPad Mini?
12 de junho de 2026
Sesc SP tem programação especial para celebrar a Copa de 2026
11 de junho de 2026
sampanews.com
  • Cidades
  • Mundo
  • Política
  • Negócios
  • Esporte
  • Saúde
  • Cultura
  • Tecnologia
  • Auto
Copyright 2026 - Todos os Direitos Reservados

Anthropic admite que Fable 5 sabotava respostas sem aviso e revisa IA

por SampaNews 11 de junho de 2026
11 de junho de 2026
5

A Anthropic reconheceu o erro de implementar mecanismos de segurança ocultos no novo Claude Fable 5. O grande modelo de linguagem da classe do Mythos estava sabotando respostas caso percebesse que estava ajudando a desenvolver outra inteligência artificial (IA).

“Estamos implementando mudanças para tornar visíveis as salvaguardas do Fable 5 para o desenvolvimento de LLMs de fronteira”, afirmou a Anthropic em um post no X na conta ClaudeDevs (@ClaudeDevs). “A partir desta semana, solicitações sinalizadas cairão visivelmente de volta para o Opus 4.8 – o mesmo que nossas salvaguardas para cibersegurança e pesquisas biológicas. Você verá isso toda vez que isso acontecer”, complementou.

smart_display

Nossos vídeos em destaque

Ao implementar mecanismos de segurança discretos, a Anthropic queria tornar suas ativações mais direcionadas. Porém, a empresa percebeu que a transparência sobre essas barreiras é importante, e os usuários deveriam ser notificados caso sejam afetados por elas.

“Tornar as salvaguardas visíveis as torna mais fáceis de contornar, então mantê-las robustas contra jailbreaks infelizmente significará mais falsos positivos enquanto melhoramos os classificadores”, afirmou a empresa. A Anthropic também revisou os classificadores relacionados a cibersegurança e pesquisas biológicas para acionar menos em solicitações inofensivas.

Claude Fable 5 era nerfado de forma discreta

O Claude Fable 5 é uma versão do Claude Mythos com diversos mecanismos de segurança para evitar uso malicioso. Se o chatbot percebe uma solicitação potencialmente perigosa acerca de temas como cibersegurança, biologia, química e destilação, ele delega a resposta a um modelo menos poderoso, como o Opus 4.8.

No entanto, a Anthropic também incluiu freios invisíveis no comportamento do Fable 5. “Tendo em vista a capacidade dos modelos recentes de acelerar seu próprio desenvolvimento, implementamos novas intervenções que limitam a eficácia do Claude para solicitações direcionadas ao desenvolvimento de modelos de aprendizado de máquina de ponta (na construção de pipelines de pré-treinamento, infraestrutura de treinamento distribuída ou design de aceleradores de aprendizado de máquina, por exemplo)”, explica a empresa no documento “System Card: Claude Fable 5 e Claude Mythos 5”.

Ainda no texto, a empresa ressalta que o uso do Claude para desenvolver modelos concorrentes já viola os Termos de Serviço. A Anthropic acreditava que aplicar essa restrição por meio de salvaguardas invisíveis evitaria acelerar o trabalho de quem tenta burlar esses termos.

Freios invisíveis foram alvo de críticas nas redes

A estratégia não só evitou o desenvolvimento de modelos concorrentes, mas comprometeu a pesquisa científica relacionada à inteligência artificial e aprendizagem de máquina – sem qualquer aviso ao pesquisador. Esse comportamento ganhou repercussão nas redes sociais nos nichos relacionados ao tema.

“Sinceramente, eu não usaria isso para nada. Uma recusa ou um erro HTTP-4XX para o conteúdo é aceitável, mas isso basicamente está pegando seu dinheiro e contaminando sua base de código”, afirmou um usuário no Reddit.

Quer ficar por dentro das novidades do mundo da tecnologia? Acesse o TecMundo e acompanhe as últimas notícias sobre Anthropic, Claude e inteligência artificial.

autor de origem

Compartilhar 0 FacebookTwitterLinkedinWhatsapp
postagem anterior
12 modelos de impressão 3D úteis para fazer em casa
próxima postagem
Coreia do Sul e República Tcheca fecham primeiro dia de Copa do Mundo

Você também pode gostar

OpenAI é processada por suposta contribuição do ChatGPT...

12 de junho de 2026

Para quem faz sentido comprar um iPad Mini?

12 de junho de 2026

Play Store libera 5 jogos grátis por tempo...

11 de junho de 2026

12 modelos de impressão 3D úteis para fazer...

11 de junho de 2026

POSTS MAIS RECENTES

  • Motociclista morre em colisão frontal na Rodovia Alkindar Monteiro Junqueira
  • OpenAI é processada por suposta contribuição do ChatGPT em suicídio
  • Para quem faz sentido comprar um iPad Mini?
  • Sesc SP tem programação especial para celebrar a Copa de 2026
  • Play Store libera 5 jogos grátis por tempo limitado! Resgate agora (11)

Siga-nos

  • Recente
  • Popular
  • Motociclista morre em colisão frontal na Rodovia Alkindar Monteiro Junqueira

    12 de junho de 2026
  • OpenAI é processada por suposta contribuição do ChatGPT em suicídio

    12 de junho de 2026
  • Para quem faz sentido comprar um iPad Mini?

    12 de junho de 2026
  • Sesc SP tem programação especial para celebrar a Copa de 2026

    11 de junho de 2026
  • 1

    Assessor ⁠da Casa Branca diz que novo chair do Fed deve ser “uma pessoa independente”

    22 de janeiro de 2026
  • 2

    IPVA mais caro do Brasil custa R$ 1 milhão; veja o carro mais caro de cada estado

    20 de janeiro de 2026
  • 3

    (Des)controle discute o alcoolismo feminino e a dificuldade de pedir ajuda: “Essa história tem que ser contada”

    6 de fevereiro de 2026
  • 4

    WordPress ganha assistente de IA integrado a sites para edição e design

    18 de fevereiro de 2026

Postagens em destaque

Coreia do Sul e República Tcheca fecham primeiro...

11 de junho de 2026

Anthropic admite que Fable 5 sabotava respostas sem...

11 de junho de 2026

12 modelos de impressão 3D úteis para fazer...

11 de junho de 2026

Uso de celular ao volante gera mais de...

11 de junho de 2026

Interpol prende 201 pessoas em operação contra golpes...

11 de junho de 2026

Leitura obrigatória

  • Motociclista morre em colisão frontal na Rodovia Alkindar Monteiro Junqueira

    12 de junho de 2026
  • OpenAI é processada por suposta contribuição do ChatGPT em suicídio

    12 de junho de 2026
  • Para quem faz sentido comprar um iPad Mini?

    12 de junho de 2026
  • Sesc SP tem programação especial para celebrar a Copa de 2026

    11 de junho de 2026
  • Play Store libera 5 jogos grátis por tempo limitado! Resgate agora (11)

    11 de junho de 2026

Newsletter

Posts relacionados

  • OpenAI é processada por suposta contribuição do ChatGPT em suicídio

    12 de junho de 2026
  • Para quem faz sentido comprar um iPad Mini?

    12 de junho de 2026
  • Play Store libera 5 jogos grátis por tempo limitado! Resgate agora (11)

    11 de junho de 2026
  • 12 modelos de impressão 3D úteis para fazer em casa

    11 de junho de 2026
  • Interpol prende 201 pessoas em operação contra golpes e fraudes na internet

    11 de junho de 2026

Mais vistas da semana

Assessor ⁠da Casa Branca diz que novo chair do Fed deve ser “uma pessoa independente”
22 de janeiro de 2026
Escalação do Brasil: Ancelotti define seleção para jogo com Panamá e garante Neymar na Copa
31 de maio de 2026
⁠Infantino tem razão? Será que o futebol não existiria em ‘150 países’ sem a FIFA?
5 de abril de 2026

Postagens Aleatórias

Falta de oportunidades para mães ‘empurra’ mulheres para o empreendedorismo
8 de março de 2026
INSS, 8/1 e aborto e atuação do STF: veja o resumo da sabatina de Jorge Messias
29 de abril de 2026
Galaxy S26 FE: imagens revelam suposto módulo de câmera parecido com topos de linha
25 de maio de 2026

Categorias Populares

  • Tecnologia (5.068)
  • Política (3.650)
  • Mundo (3.258)
  • Campinas (1.752)
  • Negócios (1.271)
  • Economia (1.255)
  • Auto (950)
  • Bragança Paulista (917)
  • Esporte (545)
  • Saúde (420)

Notícias de São Paulo e do mundo, em tempo real. Cobertura completa de política, economia, mercado, cidades e assuntos que importam — com contexto e credibilidade.

Facebook Twitter Instagram Linkedin Youtube

Copyright © 2026 SampaNews. Todos os Direitos Reservados.

  • Anuncie
  • Contato
  • Política de Privacidade
sampanews.com
  • Home