Em vez de informações perfeitas, há imensas possibilidades desconhecidas, que vão desde informações em falta até ao engano deliberado.
Pensemos, por exemplo, num carro autónomo — pode definir o objetivo de chegar do ponto A ao B de forma eficiente e segura, cumprindo todas as leis. Mas o que acontece se o trânsito for pior do que o esperado, talvez devido a um acidente na estrada? E se, de repente, surgirem más condições meteorológicas? Ou que fazer perante acontecimentos aleatórios, como uma bola a saltar na rua, ou um pedaço de lixo que venha tapar a câmara do carro?
Um carro autónomo precisa de utilizar diversos sensores, incluindo sensores semelhantes a sonares e câmaras, para detetar onde se encontra e o que está à sua volta. Estes sensores nunca são perfeitos, uma vez que os seus dados incluem sempre alguns erros e imprecisões, designados «ruído». É muito habitual que um sensor indique que a estrada em frente vira à esquerda, mas outro sensor indique uma curva na direção oposta. É preciso resolver estas questões sem que haja necessidade de parar o carro sempre que ocorra ruído, mesmo que apenas numa ínfima quantidade.
Um dos motivos pelos quais os métodos modernos de IA funcionam efetivamente em problemas do mundo real — ao contrário da maioria dos métodos arcaicos usados entre os anos 60 a 80 — é a sua capacidade de lidar com a incerteza.
Nota
Na história da IA, assistimos a vários paradigmas concorrentes para lidar com a incerteza e informações imprecisas. Por exemplo, é possível que tenha ouvido falar de lógica difusa. Durante algum tempo, a lógica difusa foi candidata a melhor abordagem para lidar com informações incertas e imprecisas, tendo sido utilizada em muitas aplicações dirigidas a clientes, tais como máquinas de lavar roupa em que a máquina conseguia detetar a sujidade (numa escala de graus, e não apenas para definir se a roupa estava suja ou limpa) e ajustar o programa em consonância.
No entanto, a probabilidade revelou-se a melhor abordagem ao raciocínio em condições de incerteza e praticamente todas as atuais aplicações de IA são baseadas, pelo menos em alguma medida, nas probabilidades.
É possível que estejamos mais familiarizados com as aplicações da probabilidade em jogos: quais são as hipóteses de ter três cartas iguais no póquer (cerca de 1 em 46), quais são as hipóteses de ganhar a lotaria (muito pequenas), etc. Muito mais importante, no entanto, é que também é possível usar a probabilidade para quantificar e comparar riscos na vida quotidiana: quais são as hipóteses de ter um acidente de carro se ultrapassar o limite de velocidade, quais são as hipóteses de as taxas de juro da sua hipoteca subirem cinco pontos percentuais nos próximos cinco anos, ou quais são as hipóteses de a IA vir a automatizar tarefas específicas, como detetar fraturas ósseas em imagens de raios X ou servir às mesas num restaurante.
Nota
A mais importante lição que gostaríamos que aprendesse sobre a probabilidade não tem que ver com o cálculo de probabilidades, mas sim com a capacidade de pensar na incerteza como algo que pode ser quantificado, pelo menos em princípio. Isto significa que podemos falar sobre a incerteza como se fosse um número: os números podem ser comparados («isto é mais provável do que aquilo?») e, muitas vezes, podem ser medidos.
É verdade que medir probabilidades é difícil: normalmente, precisamos de muitas observações sobre um fenómeno para chegar a conclusões. No entanto, mediante a recolha sistemática de dados, podemos avaliar afirmações probabilísticas com sentido crítico e, por vezes, é possível verificar se os nossos números estão certos ou errados. Por outras palavras, a lição fundamental é que a incerteza não está fora do alcance do pensamento racional e do debate, e a probabilidade proporciona uma forma sistemática de aplicá-los.
A possibilidade de quantificar a incerteza reveste-se de importância fundamental, por exemplo, no âmbito de decisões relativas à vacinação ou outras políticas públicas. Antes de ser comercializada, qualquer vacina é clinicamente testada, para quantificar os seus benefícios e riscos. Os riscos nunca são conhecidos ao mínimo pormenor, mas normalmente a sua magnitude é conhecida o suficiente para permitir debater se os benefícios superam os riscos.
Nota
Se pensarmos na incerteza como algo que não pode ser quantificado ou medido, o aspeto da incerteza pode tornar-se um obstáculo ao debate racional. Por exemplo, podemos argumentar que, uma vez que não sabemos exatamente se uma vacina pode ter um efeito secundário nocivo, é demasiado perigoso utilizá-la. No entanto, isto pode levar-nos a ignorar uma doença potencialmente fatal que a vacina seria capaz de erradicar. Na maioria dos casos, os benefícios e os riscos são conhecidos com precisão suficiente para ver claramente que uns são mais significativos do que os outros.
A lição anterior é útil em muitos cenários do quotidiano e a nível profissional: por exemplo, os médicos, os juízes num tribunal ou os investidores têm de processar informações incertas e tomar decisões racionais com base nelas. Uma vez que este é um curso sobre IA, discutiremos como é que a probabilidade pode ser utilizada para automatizar o raciocínio incerto. Os exemplos que utilizaremos incluem o diagnóstico médico (embora esta não seja uma tarefa que gostaríamos de automatizar totalmente) e a identificação de mensagens de correio eletrónicas fraudulentas («spam»).
A forma mais fácil de representar a incerteza é, provavelmente, através das chances (em inglês, odds). Estas tornam particularmente fácil atualizar convicções à medida que ficam disponíveis mais informações (voltaremos a abordar isto na secção seguinte).
Antes de avançarmos, é melhor assegurar que se sente à vontade a fazer manipulações básicas de rácios (ou frações). Como se deve lembrar, as frações são números como 3/4 ou 21/365. Precisaremos de multiplicar e dividir números como estes, por isso é bom refrescar os seus conhecimentos sobre estas operações, se tiver dúvidas. Uma apresentação resumida para as pessoas que apenas precisam de avivar a memória está disponível em Wikibooks: Multiplying Fractions (Multiplicar frações). Sugerimos ainda outra apresentação animada e divertida sobre as operações básicas: Math is Fun: Using Rational Numbers (A matemática é divertida: utilizar números racionais). Não hesite em consultar a sua fonte favorita, caso necessário.
Quando nos referimos a chances, queremos dizer, por exemplo, 3:1 (três para um), o que significa que esperamos que, por cada três instâncias de um resultado — por exemplo, ganhar uma aposta — haja uma instância do resultado contrário, não ganhar a aposta. A outra forma de expressar a mesma coisa seria dizer que as hipóteses de ganhar são 3/4 (três em quatro). Estas são designadas sequências naturais, uma vez que envolvem apenas números inteiros. Com números inteiros, é fácil imaginar, por exemplo, quatro pessoas, das quais três têm olhos castanhos. Ou quatro dias, dos quais três são de chuva (se estiver em Helsínquia).
Nota
Como é óbvio, três em quatro é o mesmo que 75 % (os matemáticos preferem utilizar frações como 0,75 em vez de percentagens). Constatou-se que as pessoas ficam confusas e cometem erros mais facilmente ao lidar com frações e percentagens do que com frequências naturais ou chances. É por isso que utilizamos frequências naturais e chances sempre que isso é conveniente.
Um aspeto importante a ter em conta é que, embora sejam expressas como dois números, 3 e 1, por exemplo, na verdade as chances podem ser pensadas como uma única fração ou um rácio, por exemplo 3/1 (três a dividir por um), que é igual a 3. Assim, as chances de 3:1 são as mesmas que as chances de 6:2 ou 30:10, uma vez que estes rácios também são iguais a 3. Do mesmo modo, podemos pensar nas chances de 1:5 como 1/5 (um a dividir por cinco), o que é igual a 0,2. Uma vez mais, isto é igual às chances de 2:10 ou 10:50, porque é esse valor que obtemos ao dividir 2 por 10 ou 10 por 50. Mas tenha muito cuidado! Embora seja possível expressar as chances de 1:5 (uma vitória para cada cinco derrotas) como o número decimal 0,2, isto é diferente de uma probabilidade de 20 % (ou probabilidade de 0,2, utilizando a notação dos matemáticos). As chances de 1:5 significam que teria de jogar o jogo seis vezes para ganhar uma vez, em média. A probabilidade de 20 % significa que, em média, teria de jogar cinco vezes para ganhar uma vez.
Para chances superiores a um, tais como 5:1, é fácil ter em mente que não estamos a lidar com probabilidades, porque nenhuma probabilidade pode ser superior a 1 (ou superior a 100 %), mas para chances inferiores a um, tais como 1:5, o perigo de haver confusão está sempre à espreita.
Assim, certifique-se de que sabe sempre quando falamos de chances e quando falamos de probabilidades.
O exercício seguinte vai ajudá-lo(a) a praticar a correspondência entre chances e probabilidades. Não se preocupe se cometer alguns erros nesta fase: o objetivo principal é adquirir as competências de que irá precisar nas secções seguintes.