sampanews.com
  • Cidades
  • Mundo
  • Política
  • Negócios
  • Esporte
  • Saúde
  • Cultura
  • Tecnologia
  • Auto

O que você está procurando?

Auto Cidades Cultura Economia Esporte Mundo Negócios

Recente

Anthropic quer utilizar IA para desenvolver novos remédios
3 de julho de 2026
As pessoas não colecionam caixas vazias, elas colecionam jogos, diz loja de games físicos Gamer Hut
3 de julho de 2026
Festival de Inverno de Bragança Paulista começa nesta sexta com programação gratuita
3 de julho de 2026
Steam recebe 5 jogos grátis nesta semana! Veja lista e resgate (3)
3 de julho de 2026
sexta-feira, julho 3, 2026
Top Posts
Anthropic quer utilizar IA para desenvolver novos remédios
As pessoas não colecionam caixas vazias, elas colecionam...
Festival de Inverno de Bragança Paulista começa nesta...
Steam recebe 5 jogos grátis nesta semana! Veja...
Prefeitura e Grupo Carrefour Brasil discutem implantação do...
Anthropic explica como funcionam os freios de segurança...
Roubo de hardware de IA cresce e impulsiona...
Dez escolas municipais de Bragança Paulista receberão sistemas...
Novo vírus para Android controla microfone e câmeras...
QR de julho: Hyundai i20 chega para encarar...
sampanews.com
Banner
  • Cidades
  • Mundo
  • Política
  • Negócios
  • Esporte
  • Saúde
  • Cultura
  • Tecnologia
  • Auto

O que você está procurando?

Auto Cidades Cultura Economia Esporte Mundo Negócios

Recente

Anthropic quer utilizar IA para desenvolver novos remédios
3 de julho de 2026
As pessoas não colecionam caixas vazias, elas colecionam jogos, diz loja de games físicos Gamer Hut
3 de julho de 2026
Festival de Inverno de Bragança Paulista começa nesta sexta com programação gratuita
3 de julho de 2026
Steam recebe 5 jogos grátis nesta semana! Veja lista e resgate (3)
3 de julho de 2026
sampanews.com

O que você está procurando?

Auto Cidades Cultura Economia Esporte Mundo Negócios

Recente

Anthropic quer utilizar IA para desenvolver novos remédios
3 de julho de 2026
As pessoas não colecionam caixas vazias, elas colecionam jogos, diz loja de games físicos Gamer Hut
3 de julho de 2026
Festival de Inverno de Bragança Paulista começa nesta sexta com programação gratuita
3 de julho de 2026
Steam recebe 5 jogos grátis nesta semana! Veja lista e resgate (3)
3 de julho de 2026
sampanews.com
  • Cidades
  • Mundo
  • Política
  • Negócios
  • Esporte
  • Saúde
  • Cultura
  • Tecnologia
  • Auto
Copyright 2026 - Todos os Direitos Reservados

Anthropic explica como funcionam os freios de segurança do Claude Fable 5

por SampaNews 3 de julho de 2026
3 de julho de 2026
5

O Claude Fable 5 está disponível para usuários do mundo inteiro – embora não dure muito até consumir todo o limite de interações. O modelo é uma variante do Claude Mythos 5, a inteligência artificial mais avançada da Anthropic, mas reforçado com mecanismos de segurança adicionais para evitar o uso malicioso.

Nesta quinta-feira (2), a Anthropic divulgou um artigo detalhado acerca das salvaguardas embutidas no Fable 5. A documentação busca esclarecer o tema para o público geral e governos atentos aos desdobramentos sobre o modelo, uma vez que a IA teve disponibilidade restrita temporariamente por ordens dos Estados Unidos e freios ocultos abalaram a confiança da comunidade de pesquisadores.

smart_display

Nossos vídeos em destaque

O sistema de defesa do Fable 5 conta com classificadores para interações e métricas de gravidade para jailbreaks. (Fonte: Anthropic/Reprodução)

Quais são os mecanismos de segurança do Claude Fable 5?

Nem todas as atividades relacionadas à cibersegurança são rejeitadas pelo Fable 5. Para diferenciar as solicitações, o modelo contém classificadores que as identificam:

  • Uso benigno: atividades que não podem causar danos são permitidas, mas com certo monitoramento;
  • Uso de baixo risco: atividades comumente utilizadas de forma defensiva, mas que também podem ter valor para agentes maliciosos, são liberadas, mas monitoradas e, às vezes, bloqueadas para evitar jailbreak;
  • Uso de alto risco: atividades comuns entre agentes maliciosos, embora também úteis para aplicações benignas, são bloqueadas;
  • Uso proibido: atividades que poderiam ser utilizadas para causar danos significativos e/ou danos na grande maioria dos usos, com pouca ou nenhuma utilidade defensiva, são bloqueadas.

A Anthropic ressalta que a categoria de uso de baixo risco se sobrepõe consideravelmente com a margem de segurança do Fable. Os freios do modelo atuam contra vários usos inofensivos relacionados à cibersegurança – e a empresa adotou essa postura por precaução extra. “A margem de segurança significa que uma solicitação precisa parecer claramente segura para evitar o acionamento do classificador”, descreve a companhia.

undefined
A margem de segurança para uso de baixo risco é bem maior no Fable 5. (Fonte: Anthropic/Reprodução)

Os classificadores não são os únicos mecanismos de proteção do Fable 5, porém. A empresa também adota controles de acesso, treinamento de segurança dedicado e monitoramento offline como camadas adicionais de precaução.

O que é o ‘uso proibido’ do Fable 5?

Na categoria de “Uso proibido” do Fable 5, estão incluídas as ações:

  • Solicitações relacionadas a ataques de ransomware, wipers, deface, sabotagem de integridade de dados e negação de serviço;
  • Sabotagem cibernética física: manipulação de processos físicos (energia, água, transporte, serviços médicos, óleo e gás) por meios digitais;
  • Evasão de mecanismos de defesa: técnicas de evasão de antivírus ou sistemas de detecção e resposta de endpoint, anti-forense, adulteração de logs ou ofuscação;
  • Desenvolvimento, aprimoramento, modificação ou debugging de malware, incluindo trojans, RATs, backdoors, worms, stealers, loaders e spyware;
  • Desenvolvimento de infraestrutura command-and-control (C2).

O que é o ‘uso benigno’ do Fable 5?

Quanto à categoria de “Uso benigno”, estão as interações:

  • Programação segura e correções de vulnerabilidades conhecidas no projeto;
  • Debugging;
  • Tradução de código em linguagens seguras;
  • Uso de TI geral, incluindo gestão de redes e cloud;
  • Configuração defensiva de firewalls, sistemas de detecção e resposta e mais;
  • Reportagem e descrições de alto nível sobre atividade cibernética;
  • Planejamento contra incidentes.

Como funciona o sistema de detecção de jailbreaks do Fable 5?

O framework para avaliação de gravidade de jailbreaks ainda está em desenvolvimento junto à indústria de IA, segundo a Anthropic. O modelo adotado atualmente é uma espécie de rascunho e pode mudar ao longo do tempo.

Na avaliação da gravidade de jailbreaks, um dos principais pontos avaliados é o potencial de destruição que um método oferece – isto é, quais capacidades bloqueadas o jailbreak desbloqueia. O sistema sugerido pela Anthropic é composto pela escala “Cyber Jailbreak Severity” (“CJS”, ou “Escala de Gravidade de Jailbreak Cibernético” em português), que varia entre CJS-0 (nulo ou informacional) e CJS-4 (crítico).

A Anthropic explica que o cálculo de gravidade considera quatro fatores:

  • Desbloqueio de capacidades: quais funções o jailbreak consegue desbloquear;
  • Amplitude do ganho de capacidades: em quantas tarefas ofensivas distintas aquela mesma técnica funciona;
  • Facilidade de armamento: quanto esforço humano é necessário para transformar o jailbreak em um ataque em execução;
  • Facilidade de descoberta: com que facilidade um agente de ameaça consegue obter a técnica pela primeira vez.

Cada aspecto é avaliado de forma independente, numa escala entre 0 e 4. A soma, então, classifica a brecha dentro das categorias CJS.

Primeira iteração de sistema de segurança

A Anthropic ressalta que o atual framework é a primeira iteração de um sistema de defesa robusto para modelos de alta capacidade como o Fable 5. “Estamos desenvolvendo isso com base em nossa própria experiência na prevenção de usos indevidos e com o auxílio de feedback de nossos parceiros do setor e do governo”, destacou a empresa.

A documentação completa acerca dos mecanismos de segurança do Fable 5, bem como os critérios específicos sobre as quatro variáveis de avaliação de jailbreaks, pode ser conferida no site da Anthropic.

Quer ficar por dentro das novidades do mundo da tecnologia? Acesse o TecMundo e acompanhe as últimas notícias sobre Anthropic, Claude e segurança de IA.

autor de origem

Compartilhar 0 FacebookTwitterLinkedinWhatsapp
postagem anterior
Roubo de hardware de IA cresce e impulsiona mercado ilegal bilionário
próxima postagem
Prefeitura e Grupo Carrefour Brasil discutem implantação do Atacadão em Bragança Paulista

Você também pode gostar

Anthropic quer utilizar IA para desenvolver novos remédios

3 de julho de 2026

As pessoas não colecionam caixas vazias, elas colecionam...

3 de julho de 2026

Steam recebe 5 jogos grátis nesta semana! Veja...

3 de julho de 2026

Roubo de hardware de IA cresce e impulsiona...

3 de julho de 2026

POSTS MAIS RECENTES

  • Anthropic quer utilizar IA para desenvolver novos remédios
  • As pessoas não colecionam caixas vazias, elas colecionam jogos, diz loja de games físicos Gamer Hut
  • Festival de Inverno de Bragança Paulista começa nesta sexta com programação gratuita
  • Steam recebe 5 jogos grátis nesta semana! Veja lista e resgate (3)
  • Prefeitura e Grupo Carrefour Brasil discutem implantação do Atacadão em Bragança Paulista

Siga-nos

  • Recente
  • Popular
  • Anthropic quer utilizar IA para desenvolver novos remédios

    3 de julho de 2026
  • As pessoas não colecionam caixas vazias, elas colecionam jogos, diz loja de games físicos Gamer Hut

    3 de julho de 2026
  • Festival de Inverno de Bragança Paulista começa nesta sexta com programação gratuita

    3 de julho de 2026
  • Steam recebe 5 jogos grátis nesta semana! Veja lista e resgate (3)

    3 de julho de 2026
  • 1

    Assessor ⁠da Casa Branca diz que novo chair do Fed deve ser “uma pessoa independente”

    22 de janeiro de 2026
  • 2

    IPVA mais caro do Brasil custa R$ 1 milhão; veja o carro mais caro de cada estado

    20 de janeiro de 2026
  • 3

    ⁠Infantino tem razão? Será que o futebol não existiria em ‘150 países’ sem a FIFA?

    5 de abril de 2026
  • 4

    ⁠Infantino tem razão? Será que o futebol não existiria em ‘150 países’ sem a FIFA?

    5 de abril de 2026

Postagens em destaque

Anthropic explica como funcionam os freios de segurança...

3 de julho de 2026

Roubo de hardware de IA cresce e impulsiona...

3 de julho de 2026

Dez escolas municipais de Bragança Paulista receberão sistemas...

3 de julho de 2026

Novo vírus para Android controla microfone e câmeras...

3 de julho de 2026

QR de julho: Hyundai i20 chega para encarar...

3 de julho de 2026

Leitura obrigatória

  • Anthropic quer utilizar IA para desenvolver novos remédios

    3 de julho de 2026
  • As pessoas não colecionam caixas vazias, elas colecionam jogos, diz loja de games físicos Gamer Hut

    3 de julho de 2026
  • Festival de Inverno de Bragança Paulista começa nesta sexta com programação gratuita

    3 de julho de 2026
  • Steam recebe 5 jogos grátis nesta semana! Veja lista e resgate (3)

    3 de julho de 2026
  • Prefeitura e Grupo Carrefour Brasil discutem implantação do Atacadão em Bragança Paulista

    3 de julho de 2026

Newsletter

Posts relacionados

  • Anthropic quer utilizar IA para desenvolver novos remédios

    3 de julho de 2026
  • As pessoas não colecionam caixas vazias, elas colecionam jogos, diz loja de games físicos Gamer Hut

    3 de julho de 2026
  • Steam recebe 5 jogos grátis nesta semana! Veja lista e resgate (3)

    3 de julho de 2026
  • Roubo de hardware de IA cresce e impulsiona mercado ilegal bilionário

    3 de julho de 2026
  • Novo vírus para Android controla microfone e câmeras para vazar dados

    3 de julho de 2026

Mais vistas da semana

Hospital universitário no Rio inaugura era de UTIs Inteligentes no SUS
27 de junho de 2026
Home office: 105 vagas para trabalho remoto [30/06]
30 de junho de 2026
9 melhores filmes e séries para assistir na Netflix em julho
1 de julho de 2026

Postagens Aleatórias

Fiat Cronos é vendido por menos de R$ 100.000 e é sedã mais barato do Brasil
23 de fevereiro de 2026
Entenda por que plano dos EUA contra PCC e CV preocupa o governo Lula
10 de março de 2026
PF pericia dados de Vorcaro e apura possível cópia de arquivos em HD externo
18 de março de 2026

Categorias Populares

  • Tecnologia (5.866)
  • Política (3.650)
  • Mundo (3.258)
  • Campinas (2.027)
  • Negócios (1.271)
  • Economia (1.255)
  • Auto (1.092)
  • Bragança Paulista (1.060)
  • Esporte (761)
  • Saúde (487)

Notícias de São Paulo e do mundo, em tempo real. Cobertura completa de política, economia, mercado, cidades e assuntos que importam — com contexto e credibilidade.

Facebook Twitter Instagram Linkedin Youtube

Copyright © 2026 SampaNews. Todos os Direitos Reservados.

  • Anuncie
  • Contato
  • Política de Privacidade
sampanews.com
  • Home