Conexionismo

O conexionismo é uma das duas grandes linhas de pesquisa da Inteligência Artificial e tem por objetivo investigar a possibilidade de simulação de comportamentos inteligentes através de modelos baseados na estrutura e funcionamento do cérebro humano. Os primeiros trabalhos desenvolvidos na área datam de 1943 quando o neurofisiologista, filósofo e poeta americano Warren McCulloch, e o lógico Walter Pitts desenvolveram o primeiro modelo matemático de um neurônio.

As linhas conexionistas e simbólicas nasceram praticamente juntas: o livro publicado após o encontro em Darthmouth College, em 1956, já continha um artigo a respeito de redes neuronais. No entanto, por uma série de razões, as técnicas simbólicas de IA, baseadas na lógica, tiveram preferência na época. Entre estas razões pode-se citar a falta de computadores suficientemente potentes para tratar a complexidade inerente ao método, e a publicação do livro Perceptrons por Minsky e Papert, onde as propriedades matemáticas de redes artificiais de neurônios são analisadas e suas limitações são apontadas, como, por exemplo, a impossibilidade de simular o operador "ou-exclusivo" com Perceptrons de uma camada.

Na década de 80, houve um renascimento do interesse sobre o conexionismo. Este renascimento deve-se a diversos fatores, por exemplo, melhores conhecimentos da estrutura real do cérebro, melhores algoritmos de treinamento e disponibilidade de computadores poderosos, inclusive paralelos. Os sucessos obtidos em aplicações práticas levaram a uma mudança de ênfase quanto ao objetivo da pesquisa na área. Uma parte da pesquisa passa a se dedicar ao estudo de redes neuronais vistas apenas como uma representação de funções matemáticas utilizando elementos computacionais aritméticos simples, sem maiores relações com a modelagem do sistema nervoso.

As características que tornam a metodologia de redes neuronais interessante do ponto de vista da solução de problemas são as seguintes:

  • Capacidade de "aprender" através de exemplos e de generalizar este aprendizado de maneira a reconhecer instâncias similares que nunca haviam sido apresentadas como exemplo.
  • Bom desempenho em tarefas mal definidas, onde falta o conhecimento explícito sobre como encontrar uma solução.
  • Não requer conhecimento a respeito de eventuais modelos matemáticos dos domínios de aplicação.
  • Elevada imunidade ao ruído, isto é, o desempenho de uma rede neuronal não entra em colapso em presença de informações falsas ou ausentes, como é o caso nos programas convencionais, mas piora de maneira gradativa.
  • Possibilidade de simulação de raciocínio "a priori" e impreciso, através da associação com a lógica nebulosa.

Alguns domínios onde são comuns aplicações da técnica de redes neuronais são: reconhecimento de padrões em geral (por exemplo, visão computacional, reconhecimento de voz, etc.), processamento de sinais, previsão desde variação de carga elétrica até cotações da bolsa de valores, diagnóstico de falhas e identificação e controle de processos.

Conexionismo (Redes Neurais ou Processamento Paralelo Distribuído)

Segundo Rastier (1991, p. 39), para a tradição conexionista "cognitivo é termo usado para toda interação complexa de um organismo com seu meio, e não apenas para a atividade mental dita superior". Diferentemente da abordagem anterior, o conhecimento não é entendido como representação, e não é necessariamente consciente, acessível ou "conceitual"; fala-se freqüentemente num nível "subconceitual". A cognição (inclusive a linguagem) não é necessariamente manipulação de símbolos, e alguns modelos conexionistas são descritos como "subsimbólicos".

As redes conexionistas são usadas prioritariamente para modelizar fenômenos relativos à percepção, em que se atribui grande importância ao contexto (no sentido não lingüístico do termo) espacial, temporal, intencional. Mas são usadas também para modelizar fenômenos lingüísticos, como o significado semântico/pragmático. Uma vez que se trata de redes conexionistas nos dois casos - modelos para a percepção e modelos para o significado - a distinção entre "pensamento" e percepção não é acentuada como era para o cognitivismo ortodoxo, associado à tradição da Inteligência Artificial tradicional.

O conexionismo inspira-se na estrutura cerebral, e desse modo abre um campo de cooperação importante entre a Inteligência Artificial e a Neurociência. A estrutura básica de um sistema conexionista compreende várias "unidades" ligadas entre si por relações de excitação e inibição com pesos ajustáveis. A inspiração neuronal é clara:

    input unidade output

        axônio corpo do neurônio dendritos

As várias conexões em paralelo reproduzem as conexões sinápticas. No entanto, segundo Clark (1991, P. 94), o "neurônio" conexionista é uma grande simplificação, uma vez que os neurônios e sinapses no cérebro são de diferentes tipos, com propriedades e complexidades de interconexão até agora intocadas pelos modelos conexionistas. Além disso, Rastier (1991, p. 43) critica o conexionismo por negligenciar totalmente o cérebro hormonal, cuja atividade não pode ser reduzida à propagação de sinais elétricos.

A atividade cognitiva, segundo o modelo conexionista, consiste numa propagação de ativações paralelas, ao invés de procedimentos seqüenciais combinatórios. Não existem representações discretas, mas sim, a informação é distribuída por toda rede, que pode apresentar padrões de ativação diferentes. Isso permite maior fluidez nas "representações", e reproduz certas vantagens do funcionamento cerebral, tais como "graceful degradation" (o sistema pode perder parte das unidades e mesmo assim funcionar) e tolerância a erros (mesmo com erros no input pode chegar a um resultado correto ou aproximado).

A "aprendizagem" de um sistema conexionista é uma mudança estrutural, e não algo guiado passo a passo e "de fora" (por um programador) como na IA tradicional. O sistema apresenta reorganizações que não foram determinadas nem previstas pelo "programador" (isto é, pelo ajuste inicial de pesos e ligações entre as unidades). Portanto, o sistema pode funcionar de maneiras imprevisíveis, e é capaz de produzir outputs realmente novos.

Numa rede conexionista a distinção entre software e hardware não se mantém, uma vez que não há programa com instruções passo a passo, independente do substrato físico, e sim ajustes no nível das unidades. Dessa forma, a concepção do cognitivismo tradicional, de "pensamento" ou de "mente" como uma entidade abstrata, independente de restrições físicas, é abandonado em favor de uma concepção do pensamento “incorporado” num organismo que se desenvolveu em um determinado ambiente, o que aproxima o pensamento da percepção. Essa mudança de abordagem está presente em teorias semânticas mais recentes, como as de Lakoff (1987) e de Rastier (1991).

Especificamente o conexionismo subsimbólico é considerado por Ramsey, Stich e Garan (1990) como uma teoria ontologicamente revolucionária, que supera o proposicionalismo modularista em psicologia (e em redes semânticas). Nesse tipo de modelo conexionista, a informação é altamente distribuída e não localizada. Em alguns modelos conexionistas ainda é possível ter algumas unidades individuais ou conjuntos pequenos de unidades que são concebidos como representações de propriedades específicas ou características do ambiente (como os schemata conexionistas de Rumelhardt et alli, 1988). Nesses modelos, quando a conexão de uma unidade com outra é forte, interpreta-se como se o sistema representasse a proposição seguinte: quando a característica representada pela primeira unidade está presente, a característica representada pela segunda unidade também estará. No entanto, em redes conexionistas subsimbólicas não é possível localizar representações proposicionais fora do nível do input.

Não há características particulares ou estadas do sistema que se prestam diretamente a uma interpretação semântica. Nenhuma unidade ou coleção de unidades representa uma característica específica do ambiente de modo imediato. Embora seja plausível ver tais redes como se coletiva ou holisticamente representassem proposições (e nesse sentido são consideradas simbólicas por Fodor e por Pylyshyn), nenhuma das unidades ocultas, ou seus pesos e desvios, podem ser confortavelmente entendidos como símbolos. Isto é, não são discretizáveis, atomicamente, como representações, e nesse sentido são como os semas, que só podem ser entendidos em meio a relações diferenciais.

FONTE:

Maria Elisa Marchini Sayeg - Doutora em Educação pela USP

Revista Tesseract - ISSN 1519-2415

 


Associação SoftwareLivre

A Associação SoftwareLivre.org (ASL) é uma associação civil sem fins-lucrativos, com sede em Porto Alegre/RS que reúne empresários, profissionais liberais, estudantes e servidores públicos, estabelecendo relações com os mais diversos setores da sociedade como o poder público, universidades, empresas, grupos de usuários, hackers e ONGs. A ASL tem por principal objetivo tornar o software livre amplamente incluído na sociedade, propiciando espaço de discussão, apoio, fomento e organização de iniciativas nas mais diversas áreas relacionadas. - Site oficial da associação