Um dos motivos para o interesse é a esperança de compreender a nossa própria mente, que surge do processamento neuronal no nosso cérebro. Outro motivo são os avanços na aprendizagem automática alcançados nos últimos anos, ao combinar enormes conjuntos de dados e técnicas de aprendizagem profunda.
Para compreender melhor o todo, começaremos por debater as unidades individuais que o compõem. Uma rede neuronal pode significar uma rede neuronal biológica «real», como a que existe no seu cérebro, ou uma rede neuronal artificial simulada num computador.
Terminologia importante
Aprendizagem profunda refere-se a determinadas técnicas de aprendizagem automática, em que várias «camadas» de unidades de processamento simples são ligadas numa rede, para que a entrada fornecida ao sistema passe através de cada uma delas, à vez. Esta arquitetura foi inspirada pelo processamento de informações visuais no cérebro, que chegam através dos olhos e são captadas pela retina. Esta profundidade permite à rede aprender estruturas mais complexas sem precisar de quantidades de dados irrealisticamente grandes.
Uma rede neuronal, quer seja biológica ou artificial, é composta por um grande número de unidades simples, os neurónios, que recebem e transmitem sinais entre si. Os neurónios são processadores de informação muito simples, compostos por um corpo celular e fios que os ligam aos outros neurónios. A maior parte do tempo, não fazem nada, aguardando e estando atentos a sinais que chegam através dos fios.
No jargão biológico, os fios que fornecem as informações de entrada aos neurónios são designados dendrites. Por vezes, dependendo dos sinais que chegam, o neurónio pode disparar e enviar um sinal, que será recebido pelos outros neurónios. O fio que transmite o sinal de saída é designado axónio. Cada axónio pode estar ligado a uma ou mais dendrites, em cruzamentos que são designados sinapses.
Isolado dos seus companheiros, um único neurónio é pouco impressionante, sendo apenas capaz de um conjunto muito limitado de comportamentos. No entanto, quando estão ligados uns aos outros, o sistema resultante da sua ação concertada pode tornar-se extremamente complexo. Para encontrar provas disto, basta olhar (para usar jargão jurídico) para o «Elemento de prova A»: o seu cérebro! O comportamento do sistema é determinado pelas formas como os neurónios estão ligados. Cada neurónio reage aos sinais recebidos de uma forma específica, que também se pode adaptar ao longo do tempo. Sabe-se que esta adaptação é a chave para funções como a memória e a aprendizagem.
O objetivo de desenvolver modelos artificiais do cérebro pode ser a neurociência, o estudo do cérebro e do sistema nervoso em geral. É tentador pensar que, se mapearmos o cérebro humano de forma suficientemente detalhada, podemos descobrir os segredos da cognição e da consciência humana e animal.
Nota
A iniciativa BRAIN (The BRAIN Initiative), liderada por investigadores americanos no domínio da neurociência, está a promover tecnologias para formar imagens do cérebro, bem como para o modelar e simular, a uma escala mais alargada e detalhada do que o alguma vez feito. Alguns projetos de investigação sobre o cérebro traçaram objetivos muito ambiciosos. O Projeto Cérebro Humano (The Human Brain Project) prometeu, há cerca de 5 anos, que «os mistérios da mente podem ser resolvidos… em breve». Após anos de trabalho, o Projeto Cérebro Humano enfrentou questões sobre quando é que os 1 000 milhões de EUR investidos pela União Europeia levarão à concretização dessa promessa, embora seja justo reconhecer que alguns marcos menos ambiciosos foram alcançados.
No entanto, apesar de aparentemente continuarmos ainda muito longe de compreender a mente e a consciência, foram alcançados marcos claros na neurociência. Graças à melhor compreensão da estrutura e do funcionamento do cérebro, já estamos a colher alguns frutos concretos. Podemos, por exemplo, identificar o funcionamento anormal e tentar ajudar o cérebro a evitá-lo, restabelecendo o funcionamento normal. Isto pode levar a novos tratamentos médicos, capazes de mudar a vida das pessoas que sofrem de perturbações neurológicas: epilepsia, doença de Alzheimer, problemas causados por perturbações no desenvolvimento ou danos causados por ferimentos, etc.
Nota
Uma direção da investigação na neurociência são as interfaces cérebro/computador, que permitem interagir com um computador simplesmente pelo pensamento. As interfaces atuais são muito limitadas e podem ser utilizadas, por exemplo, para reconstruir, de forma muito básica, o que uma pessoa está a ver, ou controlar braços robóticos ou drones através do pensamento. Talvez algum dia consigamos implementar máquinas capazes de ler o pensamento, que permitam instruções precisas, mas atualmente estas pertencem ao domínio da ficção científica. Também é concebível que consigamos fornecer informações ao cérebro, ao estimulá-lo por via de pequenos impulsos eletrónicos. Essa estimulação é utilizada atualmente para fins terapêuticos. Pelo menos para já, o fornecimento de informações detalhadas, como palavras, ideias, memórias ou emoções específicas, é ficção científica e não realidade, mas é evidente que não conhecemos os limites dessa tecnologia, nem quão difícil será alcançá-los.
Afastámo-nos um pouco do tema do curso. Na verdade, outro dos principais motivos para desenvolver redes neuronais artificiais tem pouco que ver com a compreensão de sistemas biológicos. Trata-se de utilizar os sistemas biológicos como uma inspiração para desenvolver melhores técnicas de IA e aprendizagem automática. A ideia é muito natural: o cérebro é um sistema de processamento de informação incrivelmente complexo, capaz de um vasto leque de comportamentos inteligentes (e, pontualmente, de alguns menos inteligentes), pelo que faz sentido inspirarmo-nos nele quando tentamos criar sistemas artificialmente inteligentes.
As redes neuronais têm sido uma grande tendência na IA desde os anos 60. Voltaremos a falar sobre as ondas de popularidade na história da IA na parte final. Atualmente, as redes neuronais estão novamente no topo da lista, com a aprendizagem profunda a ser utilizada para alcançar melhorias significativas em muitas áreas, como o processamento de linguagem natural e de imagens, que tradicionalmente têm sido pontos sensíveis da IA.
A defesa da utilização das redes neuronais, em geral, como uma abordagem à IA, assenta num argumento semelhante ao das abordagens baseadas na lógica. Neste último caso, pensou-se que, para atingir um nível de inteligência equivalente à humana, temos de simular processos mentais de nível superior, nomeadamente, a manipulação de símbolos que representam determinados conceitos concretos ou abstratos utilizando regras lógicas.
O argumento em prol das redes neuronais é que ao simular o nível inferior — o processamento de dados «subsimbólicos» ao nível dos neurónios e das redes neuronais — a inteligência irá surgir. Tudo isto parece muito razoável, mas tenha em mente que construir máquinas voadoras não significa construirmos aviões que batem as asas, ou que são feitos de ossos, músculos e penas. Do mesmo modo, nas redes neuronais artificiais, normalmente o mecanismo interno dos neurónios é ignorado e os neurónios artificiais são frequentemente muito mais simples do que os seus homólogos naturais. Os mecanismos de sinalização eletroquímicos entre os neurónios naturais também são largamente ignorados nos modelos artificiais, quando o objetivo é construir sistemas de IA, ao invés de simular sistemas biológicos.
Em comparação com o funcionamento tradicional dos computadores, as redes neuronais têm determinadas características especiais:
Em primeiro lugar, num computador tradicional, as informações são processadas num processador central (apropriadamente designado unidade central de processamento, ou CPU na forma abreviada [do inglês, central processing unit]), que apenas se consegue concentrar em fazer uma coisa de cada vez. A CPU consegue obter os dados a processar da memória do computador, armazenando o resultado igualmente na memória. Assim, o armazenamento e o processamento de dados são tratados por dois componentes separados do computador: a memória e a CPU. Nas redes neuronais, o sistema é composto por um grande número de neurónios, cada um dos quais consegue processar informações sozinho, pelo que em vez de ter uma CPU que processa cada elemento de informação, um após outro, os neurónios processam grandes quantidades de informações em simultâneo.
A segunda diferença é que o armazenamento (memória) e o processamento de dados não estão separados, tal como sucede nos computadores tradicionais. Os neurónios armazenam e processam informação, pelo que não há necessidade de obter dados da memória para efeitos de processamento. Os dados podem ser armazenados a curto prazo nos próprios neurónios (disparam ou não num dado momento), ou, no caso do armazenamento a longo prazo, nas ligações entre os neurónios — os seus pesos, que discutiremos adiante.
Devido a estas duas diferenças, as redes neuronais e os computadores tradicionais adequam-se a tarefas algo diferentes. Embora seja perfeitamente possível simular redes neuronais em computadores tradicionais, tendo sido assim que foram utilizadas durante muito tempo, a sua capacidade máxima é atingida apenas quando utilizamos hardware especial (dispositivos informáticos) capaz de processar muitos elementos de informação em simultâneo. Isto é designado processamento paralelo. Verificou-se, por acaso, que os processadores gráficos (ou unidades de processamento gráfico, ou ainda GPU [do inglês, graphics processing units]) têm esta capacidade, pelo que se tornaram uma solução económica para executar métodos maciços de aprendizagem profunda.