sampanews.com
  • Cidades
  • Mundo
  • Política
  • Negócios
  • Esporte
  • Saúde
  • Cultura
  • Tecnologia
  • Auto

O que você está procurando?

Auto Cidades Cultura Economia Esporte Mundo Negócios

Recente

Empresário é baleado em Campinas; PM busca suspeitos
12 de junho de 2026
Prefeito de Amparo é investigado por suspeita de violência doméstica contra filha
12 de junho de 2026
Motociclista morre em colisão frontal na Rodovia Alkindar Monteiro Junqueira
12 de junho de 2026
OpenAI é processada por suposta contribuição do ChatGPT em suicídio
12 de junho de 2026
sexta-feira, junho 12, 2026
Top Posts
Empresário é baleado em Campinas; PM busca suspeitos
Prefeito de Amparo é investigado por suspeita de...
Motociclista morre em colisão frontal na Rodovia Alkindar...
OpenAI é processada por suposta contribuição do ChatGPT...
Para quem faz sentido comprar um iPad Mini?
Sesc SP tem programação especial para celebrar a...
Play Store libera 5 jogos grátis por tempo...
Coreia do Sul e República Tcheca fecham primeiro...
Anthropic admite que Fable 5 sabotava respostas sem...
12 modelos de impressão 3D úteis para fazer...
sampanews.com
Banner
  • Cidades
  • Mundo
  • Política
  • Negócios
  • Esporte
  • Saúde
  • Cultura
  • Tecnologia
  • Auto

O que você está procurando?

Auto Cidades Cultura Economia Esporte Mundo Negócios

Recente

Empresário é baleado em Campinas; PM busca suspeitos
12 de junho de 2026
Prefeito de Amparo é investigado por suspeita de violência doméstica contra filha
12 de junho de 2026
Motociclista morre em colisão frontal na Rodovia Alkindar Monteiro Junqueira
12 de junho de 2026
OpenAI é processada por suposta contribuição do ChatGPT em suicídio
12 de junho de 2026
sampanews.com

O que você está procurando?

Auto Cidades Cultura Economia Esporte Mundo Negócios

Recente

Empresário é baleado em Campinas; PM busca suspeitos
12 de junho de 2026
Prefeito de Amparo é investigado por suspeita de violência doméstica contra filha
12 de junho de 2026
Motociclista morre em colisão frontal na Rodovia Alkindar Monteiro Junqueira
12 de junho de 2026
OpenAI é processada por suposta contribuição do ChatGPT em suicídio
12 de junho de 2026
sampanews.com
  • Cidades
  • Mundo
  • Política
  • Negócios
  • Esporte
  • Saúde
  • Cultura
  • Tecnologia
  • Auto
Copyright 2026 - Todos os Direitos Reservados

Anthropic admite que Fable 5 sabotava respostas sem aviso e revisa IA

por SampaNews 11 de junho de 2026
11 de junho de 2026
6

A Anthropic reconheceu o erro de implementar mecanismos de segurança ocultos no novo Claude Fable 5. O grande modelo de linguagem da classe do Mythos estava sabotando respostas caso percebesse que estava ajudando a desenvolver outra inteligência artificial (IA).

“Estamos implementando mudanças para tornar visíveis as salvaguardas do Fable 5 para o desenvolvimento de LLMs de fronteira”, afirmou a Anthropic em um post no X na conta ClaudeDevs (@ClaudeDevs). “A partir desta semana, solicitações sinalizadas cairão visivelmente de volta para o Opus 4.8 – o mesmo que nossas salvaguardas para cibersegurança e pesquisas biológicas. Você verá isso toda vez que isso acontecer”, complementou.

smart_display

Nossos vídeos em destaque

Ao implementar mecanismos de segurança discretos, a Anthropic queria tornar suas ativações mais direcionadas. Porém, a empresa percebeu que a transparência sobre essas barreiras é importante, e os usuários deveriam ser notificados caso sejam afetados por elas.

“Tornar as salvaguardas visíveis as torna mais fáceis de contornar, então mantê-las robustas contra jailbreaks infelizmente significará mais falsos positivos enquanto melhoramos os classificadores”, afirmou a empresa. A Anthropic também revisou os classificadores relacionados a cibersegurança e pesquisas biológicas para acionar menos em solicitações inofensivas.

Claude Fable 5 era nerfado de forma discreta

O Claude Fable 5 é uma versão do Claude Mythos com diversos mecanismos de segurança para evitar uso malicioso. Se o chatbot percebe uma solicitação potencialmente perigosa acerca de temas como cibersegurança, biologia, química e destilação, ele delega a resposta a um modelo menos poderoso, como o Opus 4.8.

No entanto, a Anthropic também incluiu freios invisíveis no comportamento do Fable 5. “Tendo em vista a capacidade dos modelos recentes de acelerar seu próprio desenvolvimento, implementamos novas intervenções que limitam a eficácia do Claude para solicitações direcionadas ao desenvolvimento de modelos de aprendizado de máquina de ponta (na construção de pipelines de pré-treinamento, infraestrutura de treinamento distribuída ou design de aceleradores de aprendizado de máquina, por exemplo)”, explica a empresa no documento “System Card: Claude Fable 5 e Claude Mythos 5”.

Ainda no texto, a empresa ressalta que o uso do Claude para desenvolver modelos concorrentes já viola os Termos de Serviço. A Anthropic acreditava que aplicar essa restrição por meio de salvaguardas invisíveis evitaria acelerar o trabalho de quem tenta burlar esses termos.

Freios invisíveis foram alvo de críticas nas redes

A estratégia não só evitou o desenvolvimento de modelos concorrentes, mas comprometeu a pesquisa científica relacionada à inteligência artificial e aprendizagem de máquina – sem qualquer aviso ao pesquisador. Esse comportamento ganhou repercussão nas redes sociais nos nichos relacionados ao tema.

“Sinceramente, eu não usaria isso para nada. Uma recusa ou um erro HTTP-4XX para o conteúdo é aceitável, mas isso basicamente está pegando seu dinheiro e contaminando sua base de código”, afirmou um usuário no Reddit.

Quer ficar por dentro das novidades do mundo da tecnologia? Acesse o TecMundo e acompanhe as últimas notícias sobre Anthropic, Claude e inteligência artificial.

autor de origem

Compartilhar 0 FacebookTwitterLinkedinWhatsapp
postagem anterior
12 modelos de impressão 3D úteis para fazer em casa
próxima postagem
Coreia do Sul e República Tcheca fecham primeiro dia de Copa do Mundo

Você também pode gostar

OpenAI é processada por suposta contribuição do ChatGPT...

12 de junho de 2026

Para quem faz sentido comprar um iPad Mini?

12 de junho de 2026

Play Store libera 5 jogos grátis por tempo...

11 de junho de 2026

12 modelos de impressão 3D úteis para fazer...

11 de junho de 2026

POSTS MAIS RECENTES

  • Empresário é baleado em Campinas; PM busca suspeitos
  • Prefeito de Amparo é investigado por suspeita de violência doméstica contra filha
  • Motociclista morre em colisão frontal na Rodovia Alkindar Monteiro Junqueira
  • OpenAI é processada por suposta contribuição do ChatGPT em suicídio
  • Para quem faz sentido comprar um iPad Mini?

Siga-nos

  • Recente
  • Popular
  • Empresário é baleado em Campinas; PM busca suspeitos

    12 de junho de 2026
  • Prefeito de Amparo é investigado por suspeita de violência doméstica contra filha

    12 de junho de 2026
  • Motociclista morre em colisão frontal na Rodovia Alkindar Monteiro Junqueira

    12 de junho de 2026
  • OpenAI é processada por suposta contribuição do ChatGPT em suicídio

    12 de junho de 2026
  • 1

    Assessor ⁠da Casa Branca diz que novo chair do Fed deve ser “uma pessoa independente”

    22 de janeiro de 2026
  • 2

    IPVA mais caro do Brasil custa R$ 1 milhão; veja o carro mais caro de cada estado

    20 de janeiro de 2026
  • 3

    (Des)controle discute o alcoolismo feminino e a dificuldade de pedir ajuda: “Essa história tem que ser contada”

    6 de fevereiro de 2026
  • 4

    WordPress ganha assistente de IA integrado a sites para edição e design

    18 de fevereiro de 2026

Postagens em destaque

Sesc SP tem programação especial para celebrar a...

11 de junho de 2026

Play Store libera 5 jogos grátis por tempo...

11 de junho de 2026

Coreia do Sul e República Tcheca fecham primeiro...

11 de junho de 2026

Anthropic admite que Fable 5 sabotava respostas sem...

11 de junho de 2026

12 modelos de impressão 3D úteis para fazer...

11 de junho de 2026

Leitura obrigatória

  • Empresário é baleado em Campinas; PM busca suspeitos

    12 de junho de 2026
  • Prefeito de Amparo é investigado por suspeita de violência doméstica contra filha

    12 de junho de 2026
  • Motociclista morre em colisão frontal na Rodovia Alkindar Monteiro Junqueira

    12 de junho de 2026
  • OpenAI é processada por suposta contribuição do ChatGPT em suicídio

    12 de junho de 2026
  • Para quem faz sentido comprar um iPad Mini?

    12 de junho de 2026

Newsletter

Posts relacionados

  • OpenAI é processada por suposta contribuição do ChatGPT em suicídio

    12 de junho de 2026
  • Para quem faz sentido comprar um iPad Mini?

    12 de junho de 2026
  • Play Store libera 5 jogos grátis por tempo limitado! Resgate agora (11)

    11 de junho de 2026
  • 12 modelos de impressão 3D úteis para fazer em casa

    11 de junho de 2026
  • Interpol prende 201 pessoas em operação contra golpes e fraudes na internet

    11 de junho de 2026

Mais vistas da semana

Assessor ⁠da Casa Branca diz que novo chair do Fed deve ser “uma pessoa independente”
22 de janeiro de 2026
Escalação do Brasil: Ancelotti define seleção para jogo com Panamá e garante Neymar na Copa
31 de maio de 2026
⁠Infantino tem razão? Será que o futebol não existiria em ‘150 países’ sem a FIFA?
5 de abril de 2026

Postagens Aleatórias

DF acionou o STF para obrigar governo federal a participar do socorro ao BRB
26 de maio de 2026
AtlasIntel: Avaliação de Lula reage, mas ainda enfrenta rejeição majoritária de 52,5%
28 de abril de 2026
Palpites para Botafogo x Boavista: Análises e Onde Assistir (28/01/2026)
26 de fevereiro de 2026

Categorias Populares

  • Tecnologia (5.068)
  • Política (3.650)
  • Mundo (3.258)
  • Campinas (1.754)
  • Negócios (1.271)
  • Economia (1.255)
  • Auto (950)
  • Bragança Paulista (917)
  • Esporte (545)
  • Saúde (420)

Notícias de São Paulo e do mundo, em tempo real. Cobertura completa de política, economia, mercado, cidades e assuntos que importam — com contexto e credibilidade.

Facebook Twitter Instagram Linkedin Youtube

Copyright © 2026 SampaNews. Todos os Direitos Reservados.

  • Anuncie
  • Contato
  • Política de Privacidade
sampanews.com
  • Home