A Era da Checagem Dupla: o fim das alucinações na IA Jurídica

A Microsoft lançou o Critique, que combina GPT e Claude para eliminar alucinações. Entenda o que muda para o Direito e qual o dever ético do jurista segundo a Recomendação OAB 001/2024.

Há um paradoxo silencioso no coração da adoção da inteligência artificial pelo Direito. As ferramentas que prometem rigor, velocidade e consistência na pesquisa jurídica são, precisamente por sua arquitetura, incapazes de distinguir entre o que sabem e o que inventam. O modelo produz. A linguagem convence. A citação não existe. E o profissional que não verificou assinou.

Esse paradoxo tem nome técnico: alucinação. E, até muito recentemente, a única resposta disponível era inteiramente humana. Em 30 de março de 2026, contudo, a Microsoft anunciou um recurso que representa a primeira resposta estrutural e automatizada ao problema: o “Critique”, integrado ao Copilot Researcher do Microsoft 365. Pela primeira vez, a checagem dupla das respostas de IA deixa de ser uma boa prática recomendada e passa a ser uma característica nativa da ferramenta.

Para o campo jurídico, trata-se de uma inflexão relevante. Não porque elimine a responsabilidade do profissional, mas porque reconfigura o debate sobre como ela deve ser exercida. Neste artigo, analiso o que o recurso representa tecnicamente, o que ele não resolve, o que a Recomendação OAB 001/2024 e a Resolução CNJ 615/2025 exigem dos operadores do Direito e por que o dever ético de verificação não apenas persiste, como se aprofunda, diante de ferramentas mais sofisticadas.

Por que a IA alucina: a arquitetura do problema

Compreender por que os modelos de linguagem alucinam é condição para utilizá-los com responsabilidade. E a explicação não é simples, mas é acessível.

Os grandes modelos de linguagem, tecnicamente denominados LLMs (Large Language Models), da categoria descrita pela própria Recomendação OAB 001/2024, não funcionam como bancos de dados que recuperam informações armazenadas. Eles são sistemas probabilísticos treinados em volumes colossais de texto para prever, a cada etapa, qual sequência de palavras tem maior probabilidade estatística de suceder a sequência anterior. Em termos técnicos, o modelo não “sabe” que uma informação é verdadeira: ele atribui pesos estatísticos a tokens (unidades de linguagem) e gera o próximo token com base nos padrões aprendidos durante o treinamento.

A consequência direta desse mecanismo é que, quando o modelo não possui a informação correta em sua distribuição probabilística de pesos, ele não para nem sinaliza incerteza. Ele completa o padrão com o que é estatisticamente mais coerente dado o contexto. No Direito, isso se traduz em um acórdão com número de processo plausível, ementa jurídica coerente, relator com nome real e data compatível com o período citado. A aparência de fundamento é total. A realidade do fundamento é nula.

Agrava o problema a própria mecânica de avaliação dos modelos: sistemas que “arriscam” respostas tendem a obter pontuações superiores nos benchmarks de desempenho em comparação com sistemas que admitem incerteza. Há, portanto, um incentivo estrutural ao preenchimento confiante de lacunas, não à sua declaração. Um estudo divulgado em março de 2026 confirma que as alucinações são uma característica arquitetural dos LLMs, não um defeito corrigível por atualização. O modelo não mente. Ele completa padrões. E no Direito, o padrão completado sem base factual é o erro mais grave que um documento pode conter.

O recurso Critique da Microsoft: como a checagem dupla funciona

O anúncio da Microsoft em 30 de março de 2026 introduziu uma resposta estrutural a esse problema no nível da engenharia de sistemas. O recurso “Critique”, integrado ao agente Researcher do Copilot, encadeia dois modelos de fornecedores distintos em um mesmo fluxo de trabalho: o GPT, da OpenAI, gera a resposta inicial; o Claude, da Anthropic, a revisa criticamente, avaliando precisão factual e qualidade antes de apresentar o resultado ao usuário.

A lógica é epistemologicamente robusta. Dois modelos treinados com metodologias, corpora e arquiteturas distintas tendem a apresentar perfis de erro diferentes. O que um modelo alucina com confiança, o outro pode questionar ou corrigir, justamente porque os padrões probabilísticos subjacentes são independentes. Nicole Herskowitz, vice-presidente corporativa do Microsoft 365 e Copilot, descreveu a proposta como levar a abordagem multimodelo “para o próximo nível”: não apenas oferecer múltiplos modelos ao usuário, mas fazer com que os modelos trabalhem conjuntamente, cada qual exercendo sobre o outro uma função crítica.

Um segundo recurso lançado simultaneamente, o “Model Council”, vai além da revisão sequencial: apresenta as respostas do GPT e do Claude lado a lado, exibindo explicitamente os pontos de concordância e de divergência entre os modelos. A divergência entre eles, longe de ser um defeito, constitui um sinal de alerta metodológico: identifica precisamente os pontos onde a verificação humana adicional é mais necessária. Para tarefas de pesquisa jurídica complexa, a transparência sobre o desacordo entre modelos é mais valiosa do que a aparência de consenso de um modelo único.

A Microsoft informou que a abordagem combinada supera o Perplexity Deep Research nos benchmarks de precisão, completude e objetividade. É uma mudança de paradigma na confiabilidade das respostas geradas por IA, e seria intelectualmente desonesto minimizá-la.

O que a checagem dupla automatizada não resolve

A mesma honestidade intelectual que obriga a reconhecer o avanço exige delimitar o que ele não abarca.

A checagem cruzada entre modelos reduz significativamente o risco de alucinação não detectada. Ela não o elimina. Dois modelos podem convergir numa informação incorreta se ambos foram expostos, durante o treinamento, a conteúdo que a referencia de forma consistente. A concordância entre modelos não equivale à veracidade da afirmação. A divergência sinaliza incerteza. A concordância não garante exatidão.

Há, ademais, uma distinção técnica que precisa ser feita com precisão. O recurso Critique opera sobre a coerência interna e a qualidade da resposta gerada, não sobre a verificação de existência real da fonte citada em repositórios jurídicos oficiais. A confirmação de que um acórdão específico do Superior Tribunal de Justiça realmente existe, com a ementa descrita, no sistema e-STJ, exige acesso à fonte primária oficial. Isso nenhuma combinação de LLMs substitui.

Nessa toada, a checagem dupla automatizada é uma primeira camada de filtragem. A verificação humana nas fontes primárias continua sendo a camada insubstituível. E é precisamente sobre essa camada que o ordenamento jurídico brasileiro já se posicionou de forma expressa.

A Recomendação OAB 001/2024 e a responsabilidade intransferível do advogado

O Conselho Federal da Ordem dos Advogados do Brasil, em sessão de 11 de novembro de 2024, aprovou a Recomendação 001/2024, elaborada pelo Observatório Nacional de Cibersegurança, Inteligência Artificial e Proteção de Dados. Trata-se do principal marco deontológico para o uso de IA generativa na advocacia brasileira, e seu conteúdo é de uma clareza que não comporta ambiguidade interpretativa.

A Recomendação é categórica em quatro diretrizes centrais. Primeira: o uso de IA deve observar estrita conformidade com o Estatuto da Advocacia (Lei 8.906/1994), o Código de Ética e Disciplina da OAB, o Código de Processo Civil e a Lei Geral de Proteção de Dados. Segunda: atividades privativas da advocacia, incluindo a subscrição de peças processuais e o assessoramento jurídico, não podem ser delegadas a sistemas de IA. Terceira: a supervisão humana é obrigatória sobre todo conteúdo gerado por IA que o advogado subscreva. Quarta: a dependência excessiva de ferramentas de IA é expressamente considerada inconsistente com a prática profissional responsável.

O ponto mais denso e consequente da Recomendação, para os fins deste artigo, é o tratamento da responsabilidade profissional. O texto não admite qualquer margem de transferência ou mitigação: a IA não divide, não dilui e não suspende a responsabilidade do advogado pelo conteúdo que subscreve. Protocolar peça com precedente inexistente gerado por IA, sem verificação prévia, é, para todos os efeitos deontológicos, protocolar peça com precedente inexistente. A ferramenta que gerou o erro não é parte da relação de responsabilidade. O profissional que assinou, sim.

A Recomendação prevê, ainda, que o advogado deve formalizar por escrito ao cliente, antes de utilizar IA na prestação dos serviços, as medidas de segurança adotadas e os possíveis riscos envolvidos. Essa exigência de transparência ativa amplia o perímetro da responsabilidade profissional: não basta verificar o conteúdo gerado. É preciso gerir a relação entre o cliente e a tecnologia utilizada em seu nome.

A Resolução CNJ 615/2025 e o enquadramento normativo para o Judiciário

No âmbito do Poder Judiciário, o marco regulatório equivalente é a Resolução CNJ 615/2025, publicada em 11 de março de 2025, que atualizou e substituiu a Resolução 332/2020. O texto foi concebido especificamente para a era dos grandes modelos de linguagem e estabelece um sistema de governança estruturado sobre os princípios da transparência, da supervisão humana, da rastreabilidade e da proporcionalidade ao risco.

Para o tema em análise, o dispositivo de maior relevância é o art. 19, § 3º, II, que veda o uso de IA generativa como instrumento autônomo de tomada de decisões judiciais, exigindo a orientação, interpretação, verificação e revisão por parte do magistrado, que permanece integralmente responsável pelas informações contidas nas decisões. A norma enquadra a IA como ferramenta auxiliar, nunca como agente decisório. A responsabilidade pela fundamentação, requisito constitucional nos termos do art. 93, IX, da Constituição Federal, é exclusivamente do magistrado que assina.

A Resolução também alinha o Judiciário brasileiro às melhores práticas internacionais, inspirando-se no AI Act europeu e dialogando com o PL 2.338/2023, que aguarda votação na Câmara dos Deputados, após aprovação pelo Senado em dezembro de 2024. Esse alinhamento normativo progressivo indica que o que hoje é exigência deontológica tende a se converter em obrigação legal formalmente sancionada.

O PL 6.206/2025 e as consequências processuais do descuido

No plano estritamente processual, a ausência de verificação humana sobre o conteúdo gerado por IA começa a produzir consequências normativas diretas. O PL 6.206/2025, apresentado em dezembro de 2025 pela Deputada Denise Pessôa e atualmente em tramitação na Comissão de Constituição e Justiça e de Cidadania da Câmara, propõe acrescentar ao art. 966 do Código de Processo Civil uma nova hipótese de ação rescisória: a decisão de mérito transitada em julgado que se apoiar em “precedente ou lei inexistente”.

A justificativa do projeto enquadra expressamente as “alucinações algorítmicas” como situação que o regramento processual atual não contempla de forma suficiente. O diagnóstico é correto. Se uma decisão judicial transitou em julgado com fundamento em acórdão inventado por IA que ninguém verificou, o sistema processual vigente não oferece via expressa para a correção dessa distorção. O PL pretende preencher essa lacuna.

A aprovação do PL criaria, como efeito colateral saudável, um incentivo processual concreto para que advogados e magistrados incorporem protocolos formais de verificação de fontes como etapa obrigatória do fluxo de trabalho assistido por IA. O marco normativo não resolve o problema de fundo, que é comportamental e educacional, mas sinaliza de forma inequívoca em qual direção o ordenamento está se movendo.

FAQ: Checagem Dupla e Alucinações na IA Jurídica

O que é exatamente uma alucinação em IA jurídica e por que ela ocorre?

Alucinação é o fenômeno pelo qual um modelo de linguagem gera informações falsas, como precedentes ou dispositivos legais inexistentes, com aparência total de veracidade. Ela ocorre porque os LLMs são sistemas probabilísticos que completam padrões linguísticos, não sistemas de recuperação de fatos. Quando o modelo não possui a informação correta, ele não para: produz o que estatisticamente parece correto dado o contexto.

O recurso Critique da Microsoft elimina completamente as alucinações?

Não. Ele reduz significativamente o risco, mas não o elimina. Dois modelos podem convergir em uma informação incorreta se ambos foram expostos a ela durante o treinamento. A checagem cruzada automatizada é uma camada adicional de filtragem, não um substituto para a verificação nas fontes primárias oficiais, como os portais do STJ, STF e TST.

O que a Recomendação OAB 001/2024 determina sobre a responsabilidade do advogado que usa IA?

A Recomendação é expressa: a responsabilidade profissional do advogado pelo conteúdo que subscreve é intransferível. A IA não divide nem mitiga essa responsabilidade. Atividades privativas da advocacia não podem ser delegadas a sistemas de IA, e a supervisão humana é obrigatória sobre todo conteúdo gerado que o profissional assine. A dependência excessiva de IA é considerada inconsistente com a prática profissional responsável.

A Resolução CNJ 615/2025 autoriza o uso de IA no Judiciário?

Sim, com condições estritas. A Resolução autoriza o uso de IA, inclusive generativa, mas veda sua utilização como instrumento autônomo de tomada de decisões judiciais. O magistrado permanece integralmente responsável pelas informações contidas nas decisões, mesmo quando utiliza IA como ferramenta auxiliar, nos termos expressos do art. 19, § 3º, II da norma.

O que o PL 6.206/2025 representa para quem usa IA sem verificação adequada?

O PL propõe uma nova hipótese de ação rescisória no CPC para decisões fundadas em precedente ou lei inexistente, enquadrando explicitamente as alucinações algorítmicas. Se aprovado, criará consequências processuais diretas para o uso irresponsável de IA, reforçando o que já é hoje uma obrigação deontológica: verificar toda fonte antes de assinar.

Conclusão: o dever ético que a tecnologia não absorve

A inovação representada pelo recurso Critique da Microsoft é genuína e merece reconhecimento sem reservas. O princípio de encadear modelos distintos para que um critique o outro, aproveitando a independência estatística entre suas distribuições de pesos, é uma resposta tecnicamente sólida a um problema estrutural. É o momento em que a própria indústria reconhece, em arquitetura de produto, que a confiança em um único modelo é insuficiente para o nível de precisão que o Direito exige.

Mas o Direito não é governado apenas pela lógica da engenharia. É governado pela lógica da responsabilidade. E nessa lógica, a evolução tecnológica não transfere, não dilui e não suspende a obrigação deontológica do profissional que subscreve um documento ou profere uma decisão. A Recomendação OAB 001/2024 fixou essa premissa para a advocacia. A Resolução CNJ 615/2025 a consagrou para o Judiciário. O PL 6.206/2025 está convertendo-a em consequência processual.

O jurista que compreende por que a IA alucina estruturalmente, que conhece os limites do que a checagem automatizada entre modelos alcança e que incorpora a verificação nas fontes primárias como protocolo inegociável de trabalho, não é apenas um profissional tecnologicamente atualizado. É um profissional eticamente íntegro. Em um ordenamento jurídico que se funda na fundamentação, na transparência e na responsabilidade, não há atalho para o dever de conhecer o que se assina. A IA que verifica a IA é uma inovação bem-vinda. O jurista que verifica o que a IA verificou é uma exigência que não tem substituto.

Se você quer desenvolver essa consciência crítica com profundidade metodológica, conheça o Fluência em IA para Juristas da PM Cursos, o ponto de entrada para quem quer trabalhar com IA de forma tecnicamente informada. Para quem busca dominar os protocolos avançados de verificação, governança e uso estratégico de IA na prática jurídica, o IA Juris Pro oferece a formação completa que o mercado jurídico já demanda.

Referências

  • MICROSOFT. Copilot Researcher lança recurso Critique com GPT e Claude. Reuters / CNN Brasil, 30 mar. 2026. Disponível em: CNN Brasil
  • CONSELHO FEDERAL DA OAB. Recomendação 001/2024. Uso de Inteligência Artificial Generativa na Prática Jurídica. Brasília, 11 nov. 2024.
  • CONSELHO NACIONAL DE JUSTIÇA. Resolução 615, de 11 de março de 2025. Disponível em: atos.cnj.jus.br
  • PL 6.206/2025 (Deputada Denise Pessôa). Câmara dos Deputados, 2025.
  • STRECK, Lenio Luiz. O robô, a invenção de precedentes e o viés de perspectiva. Consultor Jurídico, 22 abr. 2025.
  • Caso Mata v. Avianca, S.D.N.Y., 2023.