Glossário de IA
Termos essenciais de Inteligência Artificial, Machine Learning e LLMs explicados em linguagem didática com exemplos aplicados ao Direito.
Índice rápido
Inteligência Artificial
Inteligência Artificial, ou simplesmente IA, é a área da tecnologia que busca criar sistemas capazes de executar tarefas que normalmente exigiriam algum tipo de inteligência humana.
Essas tarefas podem incluir reconhecer imagens, compreender textos, responder perguntas, tomar decisões, identificar padrões, gerar conteúdos, conversar com usuários e resolver problemas.
A IA não significa, necessariamente, que a máquina "pensa" como uma pessoa. Na prática, a IA trabalha com modelos matemáticos, estatísticos e computacionais que analisam dados e produzem respostas úteis.
Exemplo jurídico
Imagine uma pilha com milhares de processos judiciais. Um servidor humano poderia ler cada um deles e separar por assunto. Um sistema de IA pode ser treinado para fazer essa triagem automaticamente, identificando padrões nos textos e classificando os processos por tema.
Texto analisado: "O autor requer o fornecimento de medicamento de alto custo..." Classificação provável: Direito à saúde / fornecimento de medicamento.
Aprendizado de Máquina
Aprendizado de Máquina, ou Machine Learning, é uma subárea da IA em que o sistema aprende padrões a partir de dados.
Em vez de o programador escrever todas as regras manualmente, ele fornece exemplos ao sistema. O modelo observa esses exemplos, identifica regularidades e passa a fazer previsões ou classificações em situações novas.
Exemplo didático
Para ensinar uma IA a identificar spam, fornecemos exemplos rotulados:
Mensagem: "Ganhe dinheiro rápido clicando aqui." → Spam Mensagem: "Segue o relatório da reunião de ontem." → Não spam Mensagem: "Você ganhou um prêmio! Envie seus dados." → Spam
No Direito, a mesma lógica pode ser usada para classificar processos, detectar temas repetitivos, identificar peças urgentes ou organizar documentos.
Aprendizado Profundo
Aprendizado Profundo, ou Deep Learning, é uma forma mais avançada de Machine Learning que utiliza redes neurais com muitas camadas.
Essas redes conseguem aprender padrões complexos em textos, imagens, áudios, vídeos e grandes volumes de dados.
O termo "profundo" não significa que a máquina tem consciência ou pensamento humano. Significa apenas que o modelo possui várias camadas internas de processamento.
Exemplo jurídico (camadas de análise)
Camada inicial: identifica palavras como "medicamento", "SUS", "urgência". Camada intermediária: percebe que o texto trata de fornecimento de tratamento médico. Camada avançada: identifica possível ação judicial de saúde com pedido de tutela de urgência.
Rede Neural
Uma rede neural artificial é um modelo computacional inspirado, de forma abstrata, no funcionamento do cérebro humano.
Ela é composta por unidades chamadas neurônios artificiais, organizadas em camadas. Cada conexão entre essas unidades possui pesos matemáticos que são ajustados durante o treinamento.
Representação simplificada
Entrada Camadas internas Saída Texto do processo → análise de padrões → classificação do tema Imagem → análise visual → identificação do objeto Áudio → análise sonora → transcrição da fala
Exemplo jurídico
Entrada: "O autor requer aposentadoria por invalidez." Saída: Tema provável: Direito previdenciário / benefício por incapacidade.
IA Generativa
IA Generativa é o tipo de Inteligência Artificial capaz de criar novos conteúdos.
Ela pode gerar textos, imagens, vídeos, códigos de programação, músicas, áudios, apresentações, resumos, roteiros e respostas conversacionais.
A IA generativa não apenas classifica ou prevê. Ela produz uma nova saída a partir do comando recebido e dos padrões aprendidos durante seu treinamento.
Exemplo jurídico
Entrada: "Elabore um resumo didático sobre judicialização da saúde." Saída: "A judicialização da saúde ocorre quando o cidadão recorre ao Poder Judiciário..."
No contexto jurídico, a IA generativa pode ajudar a resumir peças, organizar argumentos, revisar minutas, criar roteiros de aula e estruturar relatórios.
Modelo de Linguagem Grande
Um Modelo de Linguagem Grande, ou LLM, é um tipo de modelo de IA treinado com enormes quantidades de texto para compreender, prever e gerar linguagem natural.
Ferramentas como ChatGPT, Claude, Gemini e outras utilizam LLMs.
Um LLM funciona, em grande parte, prevendo quais palavras ou trechos têm maior probabilidade de aparecer em determinado contexto.
Exemplo jurídico
Prompt: "Resuma esta sentença em cinco tópicos: fatos, pedidos, fundamentos, decisão e próximos passos." Resposta esperada: 1. Fatos principais. 2. Pedidos da parte autora. 3. Fundamentos jurídicos usados. 4. Resultado da sentença. 5. Providências processuais possíveis.
Agente de IA
Um agente de IA é um sistema que utiliza Inteligência Artificial para realizar tarefas com certo grau de autonomia.
Enquanto um chatbot comum apenas responde ao que o usuário pergunta, um agente pode receber um objetivo, dividir esse objetivo em etapas, usar ferramentas, consultar fontes, organizar informações e executar ações.
Exemplo: monitoramento de jurisprudência
Objetivo: "Monitore novidades sobre execução fiscal." Etapas do agente: 1. Acessar fontes jurídicas selecionadas. 2. Buscar decisões recentes. 3. Filtrar o que é relevante. 4. Resumir os julgados. 5. Organizar em uma tabela. 6. Enviar um relatório ao usuário.
IA Agêntica
IA Agêntica é uma abordagem em que sistemas de IA são capazes de planejar, executar tarefas, usar ferramentas e tomar decisões intermediárias para alcançar um objetivo.
Ela representa uma evolução em relação aos chatbots tradicionais. Na IA agêntica, a máquina deixa de ser apenas uma "respondedora" e passa a atuar como uma executora de fluxos de trabalho.
Exemplo: relatório semanal do STJ
"Prepare um relatório semanal sobre os principais precedentes do STJ em matéria tributária." IA agêntica: 1. Define as fontes de pesquisa. 2. Pesquisa julgados recentes. 3. Separa os casos tributários. 4. Verifica relevância. 5. Resume cada decisão. 6. Agrupa por tema. 7. Cria o relatório. 8. Envia ao usuário.
Chatbot
Um chatbot é uma interface conversacional que permite ao usuário interagir com um sistema por meio de linguagem natural.
Existem chatbots simples (que seguem regras pré-definidas) e chatbots avançados baseados em LLM, que conseguem interpretar contexto e responder de forma flexível.
Chatbot com LLM — exemplo jurídico
Usuário: "Não entendi por que meu processo foi arquivado." Chatbot: "Posso ajudar a interpretar a movimentação. O arquivamento pode ocorrer por vários motivos, como cumprimento da decisão, ausência de manifestação ou extinção do processo. Se você me enviar o texto da movimentação, posso explicar melhor."
Prompt
Prompt é a instrução, pergunta ou comando fornecido a uma IA para orientar sua resposta.
O prompt é uma das partes mais importantes da interação com modelos generativos. Quanto mais claro for o comando, melhor tende a ser a resposta.
Elementos de um bom prompt
1. O papel que a IA deve assumir. 2. A tarefa que deve realizar. 3. O público-alvo. 4. O formato da resposta. 5. O nível de profundidade. 6. As restrições. 7. O exemplo de saída desejada.
Exemplo bem estruturado
Atue como professor de Inteligência Artificial aplicada ao Direito. Objetivo: explicar o conceito de IA para alunos iniciantes. Formato: - definição simples; - exemplo cotidiano; - exemplo jurídico; - alerta sobre limitações. Tom: didático, claro e progressivo.
Ajuste Fino
Ajuste fino, ou fine-tuning, é o processo de especializar um modelo já existente para uma tarefa, área, linguagem, estilo ou padrão específico.
Em vez de treinar um modelo do zero, utiliza-se um modelo já treinado e faz-se um treinamento adicional com dados selecionados.
Exemplo prático em tribunal
Um tribunal poderia especializar um modelo com:
- decisões anteriores; - modelos de despacho; - padrões de ementa; - manuais de redação; - normas internas; - classificações processuais.
O resultado seria um modelo mais alinhado à linguagem e aos procedimentos daquela instituição.
Treinamento de Dados
Treinamento com dados é o processo pelo qual um modelo aprende padrões a partir de exemplos. Durante esse processo, o sistema ajusta seus parâmetros internos para melhorar seu desempenho.
Exemplo jurídico
Texto: "O segurado requer concessão de auxílio-doença." Rótulo: Previdenciário / benefício por incapacidade. Texto: "O autor busca anulação de débito fiscal." Rótulo: Tributário / anulação de lançamento. Texto: "O paciente requer fornecimento de medicamento não incorporado ao SUS." Rótulo: Saúde pública / fornecimento de medicamento.
Conjunto de Dados
Um conjunto de dados, ou dataset, é uma coleção organizada de informações usada para treinar, validar, testar ou avaliar um modelo de IA.
A qualidade do dataset é decisiva. Dados ruins produzem modelos ruins.
Características de um bom dataset
relevante; representativo; atualizado; bem organizado; corretamente rotulado; livre de duplicações problemáticas; compatível com regras de privacidade e proteção de dados.
Modelo
Um modelo é o sistema matemático-computacional treinado para realizar uma tarefa. Depois de treinado, o modelo recebe uma entrada e gera uma saída.
Exemplos de modelos
Texto de uma petição → Modelo de classificação → Tema do processo Imagem de um documento → Modelo de visão computacional → Texto extraído Pergunta do usuário → Modelo de linguagem → Resposta em linguagem natural
Automação
Automação é o uso de tecnologia para executar tarefas repetitivas com pouca ou nenhuma intervenção humana.
Toda IA pode ser usada em automações, mas nem toda automação é IA.
Automação com IA — exemplo jurídico
Todo dia às 8h: 1. ler as novas intimações; 2. identificar quais são urgentes; 3. classificar por tema; 4. sugerir providências; 5. enviar um relatório ao gabinete.
Visão Computacional
Visão Computacional é a área da IA que permite a sistemas interpretar imagens e vídeos.
Ela pode reconhecer objetos, pessoas, documentos, placas, assinaturas, cenas, tabelas, formulários e padrões visuais.
Aplicações em documentos jurídicos
Em documentos jurídicos digitalizados, a visão computacional pode: identificar páginas; localizar assinaturas; reconhecer carimbos; extrair texto de imagens; separar anexos; detectar tabelas.
Processamento de Linguagem Natural
Processamento de Linguagem Natural, ou PLN, é a área da IA dedicada a fazer computadores trabalharem com a linguagem humana.
O PLN permite que sistemas compreendam, analisem, resumam, traduzam, classifiquem e gerem textos ou falas.
Os LLMs são uma evolução poderosa das técnicas de PLN.
Exemplo de análise jurídica
Texto: "O autor requer indenização por danos morais em razão de negativação indevida." Parte: autor. Pedido: indenização por danos morais. Causa: negativação indevida. Área provável: Direito do consumidor.
IA de Voz
IA de Voz é a aplicação de Inteligência Artificial ao reconhecimento, interpretação e geração de fala.
Ela inclui tecnologias como transcrição automática, comandos por voz, síntese de voz, identificação de locutor, resumo de reuniões e assistentes falados.
Exemplo: análise de audiência
Áudio da audiência ↓ Transcrição automática ↓ Separação por falantes ↓ Resumo dos principais pontos ↓ Identificação de pedidos, argumentos e decisões
Personalização
Personalização é a capacidade de adaptar respostas, recomendações, conteúdos ou serviços ao perfil e às necessidades de cada usuário.
A personalização melhora a experiência, mas exige cuidado com privacidade, transparência e proteção de dados.
Exemplo em plataforma de estudos jurídicos
Usuário A (estudante iniciante): Conteúdo recomendado: conceitos básicos, exemplos simples. Usuário B (advogado experiente): Conteúdo recomendado: IA aplicada à advocacia, automação. Usuário C (magistrado ou assessor): Conteúdo recomendado: triagem processual, apoio à decisão, ética.
Ética da IA
Ética da IA é o conjunto de princípios e práticas destinados a garantir que sistemas de Inteligência Artificial sejam desenvolvidos e utilizados de forma responsável.
Em áreas sensíveis, como Justiça, saúde, crédito, segurança pública e educação, a ética não é um detalhe. É condição de legitimidade.
Princípios éticos fundamentais
transparência; privacidade; segurança; não discriminação; explicabilidade; supervisão humana; responsabilidade; proteção de dados; mitigação de vieses; uso proporcional da tecnologia.
Token
Token é a unidade básica de texto processada por um modelo de linguagem.
Um token pode ser uma palavra inteira, parte de uma palavra, um número, uma pontuação ou um fragmento de texto.
Os LLMs não processam frases como seres humanos. Eles transformam o texto em tokens e trabalham matematicamente sobre esses tokens.
Exemplo de tokenização
Frase: "Inteligência Artificial aplicada ao Direito" Tokens aproximados: [Inteligência] [Artificial] [aplicada] [ao] [Direito] Alguns modelos podem quebrar mais: [Intelig] [ência] [Artificial] [aplicada] [ao] [Direito]
Embeddings
Embeddings são representações numéricas de palavras, frases, documentos, imagens ou outros dados que permitem que a IA compare significados de forma matemática.
Em vez de tratar palavras apenas como texto, o sistema transforma cada palavra ou frase em uma lista de números que representa sua posição em um "espaço de significados".
Por que embeddings são importantes
Permitem: busca semântica; recomendação de documentos; agrupamento de temas; comparação de textos; sistemas RAG; detecção de similaridade; organização de grandes bases documentais.
Busca semântica jurídica
Busca literal por "medicamento" pode não encontrar: "fármaco de alto custo" Busca semântica com embeddings: encontra também "remédio", "fármaco", "tratamento farmacológico", "terapia medicamentosa".
Janela de Contexto
Janela de contexto é a quantidade máxima de informação que um modelo consegue considerar em uma interação.
Ela inclui o prompt do usuário, mensagens anteriores, documentos anexados e a resposta que será gerada.
Analogia da mesa de trabalho
Janela pequena: o modelo analisa apenas alguns parágrafos. Janela grande: o modelo consegue analisar contratos longos, decisões extensas ou vários documentos juntos.
Quando o conteúdo é maior do que a janela de contexto, o sistema precisa usar estratégias como divisão do texto, resumo progressivo ou busca semântica.
RAG — Geração Aumentada por Recuperação
RAG, ou Retrieval-Augmented Generation, é uma técnica que combina LLMs com busca em fontes externas.
Em vez de o modelo responder apenas com base no que aprendeu no treinamento, ele primeiro busca documentos relevantes e depois gera a resposta com base nesses documentos.
RAG é essencial quando a resposta precisa estar baseada em documentos específicos, atualizados ou internos.
Fluxo RAG
Pergunta do usuário ↓ Busca em documentos confiáveis ↓ Recuperação dos trechos relevantes ↓ LLM analisa os trechos ↓ Resposta fundamentada
Exemplo jurídico
Pergunta: "Qual foi o entendimento do STJ no julgado X?" Sistema com RAG: 1. Localiza o acórdão. 2. Recupera a ementa e os fundamentos principais. 3. Resume o entendimento. 4. Indica os trechos relevantes.
Alucinação
Alucinação é o fenômeno em que a IA gera uma resposta falsa, imprecisa ou inventada, mas com aparência de segurança e coerência.
Esse é um dos maiores riscos no uso de LLMs, especialmente no contexto jurídico.
Exemplos de alucinação
inventar artigos de lei; inventar precedentes; atribuir frases a autores que nunca as disseram; criar dados estatísticos inexistentes; citar livros, decisões ou normas falsas; confundir institutos jurídicos; misturar regras de países diferentes.
Como reduzir o risco
pedir fontes; fornecer documentos confiáveis; usar RAG; verificar citações; evitar confiar cegamente na resposta; manter revisão humana; usar a IA como apoio, não como autoridade final.
Temperatura
Temperatura é um parâmetro que controla o grau de criatividade ou variabilidade das respostas de um modelo generativo.
Temperatura baixa produz respostas mais previsíveis. Temperatura alta produz respostas mais criativas, mas também pode aumentar o risco de imprecisão.
Uso recomendado
Para decisões, pareceres, relatórios técnicos: temperatura baixa. Para brainstorming, campanhas, slogans e ideias criativas: temperatura mais alta.
Viés Algorítmico
Viés algorítmico ocorre quando um sistema de IA produz resultados distorcidos, injustos ou discriminatórios.
Esse viés pode surgir dos dados usados no treinamento, das escolhas dos desenvolvedores ou da forma como o sistema é aplicado.
Cadeia do viés
Dados históricos enviesados ↓ Modelo aprende padrões enviesados ↓ Resultado injusto ou discriminatório
No contexto jurídico, um sistema de apoio à decisão precisa ser avaliado com muito cuidado para não reforçar desigualdades ou produzir recomendações injustificadas.
Explicabilidade
Explicabilidade é a capacidade de compreender, justificar ou auditar como um sistema de IA chegou a determinado resultado.
Em áreas sensíveis, não basta que a IA dê uma resposta. É importante saber por que ela chegou àquela resposta.
A explicabilidade é especialmente importante em sistemas usados em Justiça, saúde, crédito, segurança e administração pública.
Exemplo jurídico
Resposta pouco explicável: "Este processo deve ser classificado como urgente porque o sistema calculou assim." Resposta explicável: "O processo foi classificado como urgente porque contém expressões relacionadas a risco de morte, internação hospitalar, pedido de tutela de urgência e fornecimento imediato de medicamento."
Supervisão Humana
Supervisão humana é o princípio segundo o qual decisões relevantes apoiadas por IA devem permanecer sob controle e responsabilidade de pessoas.
A IA pode sugerir, organizar, resumir e auxiliar. Mas, em áreas sensíveis, a decisão final deve ser humana.
Uso adequado de minutas
IA gera uma minuta. A pessoa revisa os fatos. Confere fundamentos. Verifica citações. Ajusta o texto. Assume responsabilidade pela decisão final.
Multimodalidade
Multimodalidade é a capacidade de um sistema de IA trabalhar com diferentes tipos de informação, como texto, imagem, áudio, vídeo e tabelas.
Um modelo multimodal pode receber uma imagem e responder em texto, analisar um gráfico, interpretar uma foto, ler uma tabela ou resumir um áudio.
Exemplo jurídico multimodal
Entrada: PDF escaneado + áudio de audiência + planilha de dados processuais Saídas: - resumo do conteúdo; - classificação do processo; - extração de informações; - linha do tempo; - identificação de inconsistências.
Mapa Conceitual
Inteligência Artificial ├── Machine Learning │ ├── Deep Learning │ │ ├── Redes Neurais │ │ ├── LLMs │ │ ├── Visão Computacional │ │ └── IA de Voz │ └── Modelos preditivos e classificatórios ├── IA Generativa │ ├── geração de texto · imagem · áudio · vídeo │ └── Chatbots ├── Agentes de IA / IA Agêntica └── Automação Inteligente
Para usar essas tecnologias com qualidade, compreenda: prompt, treinamento, dataset, modelo, embeddings, tokens, janela de contexto, RAG, alucinação, viés, explicabilidade, supervisão humana e ética da IA.