Conexionismo como paradigma de la ciencia cognitiva, superando el problema de sistematicidad

July 4, 2017 | Autor: Ignacio Cea | Categoría: Cognitive Science, Ciencias Cognitivas
Share Embed


Descripción

Seminario “Representación y Consciencia”‐ G. Satne ‐ UAH  Ignacio Cea J. ‐ Agosto 2015    Las redes conexionistas como paradigma cognitivo: superando el desafío de la  sistematicidad del pensamiento.    Introducción    En  su  libro  Psychosemantics,  de  1987,  Jerry  Fodor  asevera  que  “el costo de  no tener un lenguaje del pensamiento es no tener una teoría del pensar” (p. 147). El  filósofo  sostiene  que  el  cognitivismo  clásico,  entendido  como  el  paradigma  en  ciencia cognitiva basado en la hipótesis del lenguaje del pensamiento (en adelante  LOT) es la única alternativa viable a la hora de explicar la cognición. Esta tesis es  reforzada  más  enfáticamente  un  año  mas  tarde,  cuando  junto  a  Zenon  Pylyshyn,  publican  un  largo  artículo  en  el  que,  de  acuerdo  a  ellos,  demuestran  la  ineficacia  del proclamado nuevo paradigma cognitivo que tomaba en su tiempo cada vez más  fuerza: el conexionismo. El ataque es esencialmente el siguiente: El conexionismo,  prescindiendo  de  LOT,  es  incapaz  de  explicar  la  sistematicidad de  la  cognición,  y  por  ello,  es  una  teoría  insatisfactoria.  Por  otra  parte,  para  que  el  conexionismo  logre  explicarla,  debe  necesariamente  implementar  un  LOT  en  sus  sistemas  de  redes, y por ello no resulta un nuevo paradigma de la cognición, sino simplemente  una  nueva  forma  de  implementación  del  cognitivismo  clásico.  En  este  escrito  se  intentará demostrar que el ataque de Fodor & Pylyshyn (F&P) al conexionismo no  es  satisfactorio  dado  que  existen  maneras  de  modelar  la  sistematicidad  del  pensamiento en redes conexionistas prescindiendo de LOT. Además, se revisarán  las  razones    que  vuelven  preferible  a  la  arquitectura  cognitiva  conexionista  por  sobre la clásica, de las cuales me centro en el mejor posicionamiento de la primera  para  dar  cuenta  de  la  flexibilidad,  adaptabilidad  y  carácter  muchas  veces  impredecible  de  la  conducta  inteligente.  Mi  defensa  del  conexionismo  ante  el  problema  de  la  sistematicidad  estará  basado  en  los  modelos  conexionistas  de  Smolensky  (1987,1988)  y  Chalmers  (1990,  1993).  Este  punto  será  defendido  del  ataque de Aydede (1997) quien afirma que las distinciones en base a las cuales los  conexionistas pretenden que sus modelos se diferencien del paradigma clásico son  irrelevantes  y  que  por  tanto,  colapsan  en  meras  implementaciones  de  LOT.  Se  argumentará  que  Aydede  esta  desconociendo  aspectos  fundamentales  de  la  distinción  clasicismo/conexionismo  y  que  efectivamente  los  contraejemplos  a  las  afirmaciones de F&P son exitosos. La moraleja será que el paradigma conexionista  efectivamente  es  preferible  para  modelar  y  explicar  los  fenómenos  cognitivos,  superando  el  desafío  que  la  sistematicidad  del  pensamiento  le  presenta  y  que,  pretendidamente,  se  conformaba  como  un  poderoso  argumento  a  favor  de  la  hipótesis de LOT.   Procederé  así:  en  la  sección  1  expondré  la  perspectiva  cognitivista  clásica  que  adopta  la  hipótesis  del  lenguaje  del  pensamiento,  junto  a  las  ventajas  explicativas que la posicionarían como un modelo preferente de la cognición. En la  sección 2 describo aspectos centrales del paradigma conexionista, destacando sus  divergencias  con  respecto  al  modelo  clásico  y  analizando  las  motivaciones  para  preferirlo  sobre  este  último.  En  la  sección  3  me  centro  específicamente  en  el  abordaje  conexionista  de  lo  que  se  le  presenta  como  el  problema  de  explicar  la  sistematicidad  mental,  que  pretendidamente  sería  el  gran  argumento  contra  esta 

perspectiva  y  a  favor  del  paradigma  clásico.  Para  ello  discutiré  las  propuestas  específicas  de  Chalmers  y  Smolensky.  En  la  sección  4  me  dedicaré  a  refutar  la  objeción  de  Aydede  contra  las  apuestas  conexionistas,  y  demostrar  que  este  modelo  general  del  pensamiento  y  la  cognición  puede  por  tanto  servir  como  paradigma  de  las  ciencias  cognitivas,  siendo  a  su  vez  preferible  a  la  perspectiva  clásica.    1‐Cognitivismo clásico, lenguaje del pensamiento y sistematicidad    El cognitivismo clásico nace en los años cincuentas como una alternativa a  los  modelos  conductistas.  Estos  pretendían  dar  una  explicación  de  la  inteligencia  animal  basándose  únicamente  en  elementos  públicamente  observables,  i.e.  la  conducta,  omitiendo  toda  referencia  a  procesos  o  estados  mentales  internos  al  sujeto  o  agente.  La  apuesta  cognitivista  entró  en  escena  a  revindicar  esto.  La  hipótesis central fue considerar los procesos mentales como computaciones sobre  estructuras  de  información  de  acuerdo  a  algoritmos  que  sirven  como  reglas  definidas  para  el  operar  del  sistema.    De  esta  manera,  fenómenos  como  la  percepción,  el  recuerdo,  o  la  atención,  fueron  modelados  computacionalmente  como procesos  de información. Mas aún, estas estructuras de datos sobre las que  operaban  las  transformaciones  computacionales  funcionaban  como  símbolos  o  representaciones,  en  el  sentido  de  ‘estar  en  el  lugar  de’  o  ‘referir  a’  aspectos  del  mundo exterior. De esta manera, la mente era vista como un software operando en  base a reglas formales sobre representaciones simbólicas de tal forma de generar  outputs conductuales  inteligentes a partir de inputs sensoriales.   Este paradigma cognitivo fue notablemente desarrollado y  defendido por el  filósofo  Jerry  Fodor    a  partir  de  los  años  setentas,  especialmente  con  sus  contribuciones  en  torno  a  la  idea  de  que  la  mejor  explicación  de  la  cognición  requería  de  la  hipótesis  de  un  lenguaje  del  pensamiento  (Fodor,  1975).  Básicamente este lenguaje es un sistema simbólico de representaciones análogo a  los lenguajes naturales, tal que:     (1)  Las  representaciones  poseen  propiedades  combinatoriales  semánticas  y  sintácticas,  de  tal  forma  que  pensamientos  complejos  (moleculares)  como  ‘Juan  ama  a  María’  se  construyen  a  partir  de  la  combinación  de  sus  elementos  constituyentes (átomos), en este caso: ‘Juan’, ‘ama’, ‘a’ y ‘María’     y     (2)  Las  operaciones  que  se  realizan  sobre  las  representaciones  son  sensibles  a  dichas  estructuras  operando  en  referencia  a    la  forma  de  estas.12  (Aydede  &  McLaughlin, 2010; Fodor & Pylyshyn, 1988).     Siguiendo nuestro ejemplo, un sistema inteligente es capaz de pensar ‘Juan  ama a María’ dado que puede realizar operaciones formales sobre estructuras de                                                            Implícito esta el compromiso con la teoría representacional de la mente.   En este paradigma cognitivo, las representaciones simbólicas son realizadas físicamente en el cerebro y los procesos  mentales son a su vez implementados físicamente en la forma de mecanismos operando sobre la estructura formal  /sintáctica de las representaciones. En la medida que las relaciones semánticas puedan ser especificadas a través de  propiedades sintácticas‐formales, el cerebro puede ser visto como una maquina operando formalmente sobre  representaciones dando lugar así a procesos cognitivos semánticamente coherentes.    

1 2

datos  internas  que  representan  los  constituyentes  de  la  proposición  combinándolos  secuencialmente  en  el  orden  gramaticalmente  apropiado,  siendo  estas estructuras de datos, símbolos que representan aquellos aspectos del mundo  sobre  los  que  se  piensa.  De  acuerdo  a  Fodor  y  Pylyshyn  (en  adelante  F&P),  los  puntos  (1)  y  (2)  son  los  que  definen  a  los  modelos  clásicos  de  la  cognición,  diferenciándolos de otros modelos como los conexionistas y son precisamente los  que  permiten  explicar  características  esenciales  de  la  mentalidad  como  las   actitudes proposicionales o la productividad y sistematicidad del pensamiento.  Esta  perspectiva  va  además  mano  a  mano  con  la  teoría  funcionalista  de  la  mente.  De  acuerdo  a  esta,  las  representaciones  mentales,  que  son  los  ‘objetos’  propios de los procesos cognitivos, pueden ser caracterizados funcionalmente, en  términos  de  una  determinada  relación  de  inputs  y  outputs.  Así,  una  determinada  representación mental puede caracterizarse como una creencia por ejemplo, en la  medida  de  que  es  el  output  de  sistemas  perceptuales  e  input  de  sistemas  inferenciales  o  de  almacenamiento  en  memoria 3 .  Con  todos  estos  elementos,  podemos observar la potencia del cognitivismo clásico como manera fundamental  de  entender  la  mentalidad,  dado  que  sirve  como  una  plataforma  sólida  y  útil  de  modelar y explicar los procesos mentales dentro de una perspectiva estrictamente  naturalista. De esta forma hablaremos de cognitivismo clásico como el paradigma  computacional de la mente que postula un lenguaje del pensamiento especificado  en  los  términos  (1)  y  (2),  se  compromete  con  la  existencia  de  representaciones  mentales y además adhiere al funcionalismo.  Dentro  de  las  motivaciones  centrales  para  la  adopción  de  la  hipótesis  del  lenguaje  del  pensamiento  (en  adelante  LOTH)  se  encuentran  los  desarrollos  en  psicología cognitiva, de los cuales el modelamiento algorítmico y computacional de  la  percepción,  el  aprendizaje  de  conceptos  y  la  toma  de  decisiones,  implican  de  acuerdo  a  Fodor  (1975),  la  existencia  de  un  sistema  de  representaciones  con  las  características antes señaladas sobre las que se definan y operen los procesos de  información  modelados.  De  esta  manera,  el  éxito  explicativo  de  la  psicología  cognitiva  sirve  de  argumento  a  favor  de  LOTH  y  por  ende  del  paradigma  simbólico4.  Por otra parte, una característica sobresaliente de la cognición humana  es  la  capacidad  de  tener  potencialmente  infinitos  pensamientos.  Indudablemente  postular  algún  tipo  de  almacén  inagotable  donde  estos  estén  ‘esperando’  el  momento de instanciarse resulta implausible, y parece mas sensato la idea de que  esta  capacidad  se  lleve  a  cabo  a  partir  de  elementos  finitos  que  puedan  combinarse,  por  ejemplo  recursivamente,  para  dar  lugar  a  elementos  nuevos  en  principio inagotables. Esto es la productividad del pensamiento y el cognitivismo lo  explica fácilmente: a partir de átomos representacionales finitos,  sumado a reglas  combinatoriales, pueden producirse de manera recursiva potencialmente infinitas  nuevas representaciones. Además el pensar no esta caracterizado únicamente por  su  aspecto  productivo,  también  presenta  sistematicidad  y  este  punto  es  mas  relevante aún para el establecimiento de LOTH. Profundizaremos en este aspecto  de  la  cognición  pues  servirá  de  eje  a  la  discusión  que  llevaremos  a  cabo  durante  este escrito.  El  carácter  sistemático  del  pensamiento  puede  observarse  en  analogía  al  carácter  sistemático  de  la  comprensión  y  producción  de  lenguaje.  Parece  ser  una                                                            Caracterización extremadamente simplificada solo para ilustrar el punto.   Durante el escrito, clasicismo, paradigma simbólico, o hipótesis del lenguaje del pensamiento (LOTH) serán usados  intercambiablemente para hacer referencia al modelo cognitivista computacional clásico.   

3 4

verdad  empírica  de  que  todo  aquel  que  pueda  comprender  y  producir  en  su  lenguaje nativo una oración del tipo ARB, e.g. A=’Juan’, R=’ama a’, B=’María’, pueda  a  su  vez  comprender  y  producir  una  oración  del  tipo  BRA.  No  encontramos  hablantes  de  una  lengua  nativa  que  puedan  comprender  en  su  idioma  la  oración  ‘Juan  ama  a  María’  pero  no  ‘María  ama  a  Juan’.  Por  tanto  la  capacidad  de  comprender (y producir) una oración se encuentra intrínsecamente conectada con  la  capacidad  de  producir  otras  semánticamente  relacionadas.  La  manera  más  directa y simple de explicar esto es confiriendo estructura semántica y sintáctica a  las  oraciones.  Así,  la  capacidad  de  entender  ‘Juan  ama  a  María’  se  encuentra  sistemáticamente  conectada  con  la  capacidad  de  entender  ‘María  ama  a  Juan’  debido a que las oraciones poseen estructura constitutiva: están formadas a partir  de  elementos  atómicos,  combinados  de  acuerdo  a  reglas  gramaticales.  Para  comprender  la oración completa, es necesario comprender el aporte semántico de  cada  constituyente,  y  al  cumplirse  esto,  (y  conociendo  la  gramática  relevante)  inevitablemente  se  comprenderán  otras  oraciones  semánticamente  relacionadas  que  estén  formadas    a  partir  de  los  mismos  átomos  constitutivos.  En  nuestro  ejemplo, para comprender la oración ‘Juan ama a María’, en necesario comprender  el significado de los constituyentes ‘Juan’, ‘ama a’  y ‘María’ además de la gramática  del lenguaje en cuestión. Al cumplirse esto, será un hecho necesario de que pueda  comprenderse  también  ‘María  ama  a  Juan’,  pues  el  significado  de  esta  segunda  oración esta en función del aporte semántico de los mismos átomos constituyentes  de la primera5.   De la sistematicidad de la comprensión y producción del lenguaje, F&P dan el  salto  a  los  pensamientos.  Tal  como  no  encontramos  personas  que  puedan  comprender en su idioma nativo la oración ARB y no BRA, así mismo no parecen  haber  sistemas  cognitivos  que  puedan  pensar  en  ARB  y  no  en  BRA6.  Si  pensar  es  instanciar  una  representación  mental,  entonces  de  manera  análoga  al  caso  del  lenguaje,  que  la  capacidad  de  pensar  ‘Juan  ama  a  María’    este  intrínsecamente  vinculada a la capacidad de pensar ‘María ama a Juan’, se explica atribuyendo a los  pensamientos,  y  por  tanto  a  las  representaciones  mentales,  estructura  interna  constitutiva.  De  acuerdo  a  LOTH,  pensar  lo  primero  es  computar  sobre  las  representaciones  atómicas  combinándolas  sintácticamente  y  dando  lugar  a  una  representación  compuesta  con  significado.  Este  se  da  en  función  del  aporte  semántico  de  los  átomos  constituyentes    en  lo  que  se  conoce  como  composicionalidad  de  las  representaciones.    De  esta  manera,  para  pensar  una  representación  compuesta  con  sentido  se  representan  sus  constituyentes  y  esto  necesariamente trae consigo la capacidad de pensar otras representaciones cuyos  constituyentes  sean  los  mismos  gracias  a  las  propiedades  combinatoriales  de  las  representaciones y a la sensibilidad que las computaciones mentales tienen de las  estructuras constitutivas, i.e. gracias a (1) y (2). En palabras de F&P:     La sistematicidad del pensamiento muestra que deben haber relaciones estructurales entre  la  representación  mental  que  corresponde  al  pensamiento  que  Juan  ama  a  la  chica    y  la  representación mental que corresponde al pensamiento de que la chica ama a Juan; es decir, ambas 

                                                          Indudablemente para un lenguaje extranjero que no se domina, esto no se cumplirá en la medida de que la comprensión de  las  oraciones  sea  ‘de  tipo  diccionario’,  es  decir,  no  basada  en  la  comprensión  del  aporte  semántico  individual  de  cada  componente  ni  el  dominio  de  la  gramática,    sino  basado  en  ‘recetas’  del  tipo:  ‘quiero  un  café  por  favor’=  ’I  want  a  coffee  please’, en los que solo se conoce la utilidad, función o en el mejor caso, significado (en el sentido de que se sabe cuál es la  traducción) de determinadas oraciones relevantes para, e.g. una interacción básica exitosa en un país  extranjero.  6 Mas  aún  si  consideramos  que  para  comprender  o  producir  exitosamente  una  oración  determinada  debemos  pensar  la  proposición correspondiente.  5

representaciones mentales, como las dos oraciones, deben estar hechas de las mismas partes. Pero si  esta  explicación  es  correcta  (y  no  parecen  haber  otras  en  oferta),  entonces  las  representaciones  mentales tienen estructura interna y hay un lenguaje del pensamiento. (F&P 1988, p. 40, énfasis en  el original)   

  La  sistematicidad  del  pensamiento  se  conforma  así  como  un  poderoso  argumento a favor del cognitivismo clásico. Si la única (o mejor) explicación que se  tiene  de  la  sistematicidad  mental  es  a  través  de  representaciones  simbólicas  con  estructura constitutiva y procesos sensibles a estas, entonces LOTH parece ser el  caso. Al considerar, como los propios F&P señalan en su artículo, que el argumento  para LOTH a partir de la productividad cognitiva, si bien bastante plausible, puede  ser cuestionado al dudar la asumida ilimitada competencia representacional que le  sirve  de  premisa,  y  si  agregamos  que  pueden  haber  explicaciones  alternativas  plausibles  desde  distintas  corrientes  psicológicas  para  la  percepción,  la  toma  de  decisiones  y el aprendizaje de conceptos que no necesitarían postular de lenguaje  simbólico  interno,    el  argumento  desde  la  sistematicidad  del  pensamiento  se  muestra como el mas poderoso para la adopción de LOTH como paradigma de las  ciencias cognitivas.   A su vez, la explicación cognitivista clásica de la sistematicidad se conforma  directamente como un ataque para los modelos no clásicos, i.e. que niegan LOTH.  Específicamente,  F&P  (1988)  se  centran  en  demostrar  que  los  modelos  conexionistas, que durante los años ochentas  comenzaron a emerger como marcos  explicativos de la cognición alternativos al clasicismo, son presa de un dilema fatal:  o bien las redes conexionistas integran representaciones mentales con estructura  constitutiva y procesos sensibles a estas en su arquitectura cognitiva para explicar  la sistematicidad del pensamiento, i.e. integran (1)y(2), en cuyo caso no serían mas  que nuevas implementaciones del cognitivismo clásico, o bien prescinden de estas  conformándose  como  un  verdadero  paradigma  alternativo  pero  dejando  de  esta  forma  la  sistematicidad  como  un  misterio  y  por  tanto  mostrándose  como  una  marco explicativo cognitivo insatisfactorio. Es preciso detenernos un instante aquí  para  aclarar  la  especificidad  de  los  dos  niveles  de  explicación/descripción  en  juego.    Es fundamental tener en mente que el debate acerca del paradigma o marco  explicativo apropiado para las ciencias cognitivas, al menos como lo entienden F&P  y  quienes  discuten  con  ellos,    esta  centrado  en  discernir  cual  es  la  arquitectura  cognitiva preferible para analizar y explicar la mentalidad. Como los propios F&P  señalan,  esta  concierne  el  “conjunto  de  operaciones  básicas,  recursos,  funciones,  principios,  etc.,  cuyo  dominio  y  rango  son  los  estados  representacionales  del  organismo” (F&P 1988, p.10, énfasis en el original). La discusión relevante estará  centrada así en el dominio propiamente psicológico o cognitivo, que en el caso de  estos  autores  y  los  conexionistas  con  los  que  se  ha  desarrollado  el  debate,  esta  marcado  por    el  ámbito  de  las  representaciones  mentales 7 .  El  nivel  de  implementación  en  cambio,  concierne  estados  no‐representacionales  de  los  sistemas  cognitivos,  como  propiedades  biológicas,  neurales,  cuánticas,  etc.,  cuya  especificación  permite  dilucidar  la  manera  en  que  los  procesos  cognitivos  son  realizados    o  implementados físicamente.  De  esta  forma,    las  redes  conexionistas                                                            Los  modelos  conexionistas  tradicionales  adhieren  a  la  Teoría  Representacional  de  la  Mente  pero  no  al  Lenguaje  del  Pensamiento.  De  hecho,  un  aspecto  esencial  de  estos  modelos  son  las  ‘representaciones  distribuidas’  con  sus  distintivas  propiedades. Discutiendo perspectivas que adhieren a las representaciones mentales (representacionalismo) vs. las que las  niegan (eliminativismo), F&P declaran “Los conexionistas están en el lado Representacionalista de la disputa” (F&P 1988, p.  7). 

7

bien  pueden  implementar  arquitecturas  clásicas,  como  maquinas  de  Turing,  sin  por  ello  conformarse  como  modelos    alternativos  de  la  cognición,  o  bien  pueden  diferir  también  en  aspectos  relevantes  del  dominio  de  las  representaciones  mentales,  en cuyo caso si se ofrecen como modelos de inteligencia diferentes a los  clásicos.  Volviendo al argumento, si bien está centrado contra el conexionismo, este  es  válido  para  todo  enfoque  cognitivo  que  prescinda  de  LOTH,  como  la  ciencia  cognitiva corporizada, enactiva, o ecológica. El desafío mínimo para los opositores  del  clasicismo  está    entonces  en  explicar  la  sistematicidad  del  pensamiento  sin  recurrir  a  LOTH,  y  en  el  mejor  caso  dar  una  mejor  explicación  u  ofrecer  buenas  razones  para  preferirla.  Otra  opción  prima facie  menos  plausible  es  negar  que  la  sistematicidad  sea  relevante  para  la  cognición    desarticulando  el  dilema.  El  resto  del escrito estará destinado a enfrentar este desafío, demostrando que dentro del  conexionismo existen los recursos necesarios para explicar la cognición sin caer en  la mera implementación de LOTH, ni tampoco negando la importancia de explicar  la facultad de tener pensamientos vinculados sistemáticamente.  Comenzaremos  exponiendo  los  aspectos  esenciales  de  los  modelos  conexionistas,  destacando  los  rasgos  divergentes  en  relación  al  enfoque  tradicional,  evaluando  a  su  vez    sus  ventajas  explicativas,  que  ilustrarían  las  motivaciones que fueron, y siguen dando fuerza al conexionismo, como alternativa  al  cognitivismo  clásico.  Luego  nos  centraremos  en  las  respuestas  de  Chalmers  (1990, 1993) y Smolensky (1987, 1988) al desafío de F&P.     2‐ Las redes conexionistas.     Los modelos conexionistas están inspirados en la organización de las redes  neurales  del  cerebro8.  Estas  conformados  esencialmente  por  unidades  o  nodos,  vinculados  entre  si  por  conexiones,  dando  lugar  a  intrincados  patrones  de  conectividad  funcional.  Las  unidades  suelen  dividirse  en  tres  clases:  unidades  de  entrada,  de  salida  y  ocultas  (hidden  units),  encontrándose  estas  últimas  en  una  capa  intermedia    comunicando  el  flujo  de  actividad  desde  los  nodos  de  entrada  hacia los de salida. Tal como ocurre con las sinapsis neuronal, las conexiones entre  las  unidades  pueden  variar  en  ‘fuerza’.  Esto  se  conoce  como  el  peso  de  las  conexiones,  que  junto    al  valor  de  activación  de  una  unidad  emisora,  determina  gracias  a  una  función  de  transferencia,  la  respuesta  de  la  unidad  receptora  y  con  ello  la  consecuente  propagación  de  las  señales.  Los  pesos  pueden  tener  valores  positivos y negativos asociados correspondientemente a relaciones de excitación o  inhibición  entre  unidades.  Una  vez  que  la  red  es  estimulada  desde  los  nodos  de  entrada, es primordialmente la distribución de pesos la que determina el patrón de  activación global distribuido del sistema. Las redes suelen entrenarse con diversos  métodos  (Hebbian  learning,  backpropagation,  etc.)  para  responder  a  una  tarea  determinada  y  luego  son  puestas  a  prueba midiendo  su  capacidad  de  generalizar  sobre inputs desconocidos no utilizados en las rutinas de entrenamiento (Garson,  2015).   Un aspecto relevante de la respuesta de estas redes a los estímulos y tareas  presentadas  es  su  capacidad  de  auto‐organización.  En  términos  generales  esto                                                            De hecho suelen intercambiarse los términos redes conexionistas y redes neurales para referir a estos modelos. También el  paradigma general es llamado ‘subsimbólico’ por describir y modelar los procesos cognitivos de determinada forma, e.g. a  través de operaciones vectoriales, tal que en un nivel mayor de abstracción podrían interpretarse como correspondiendo a  símbolos y reglas estrictas. 

8

corresponde  a  patrones  de  actividad  global  coherente  que  presentan  ciertos  sistemas  físicos  en  determinadas  condiciones,  como  resultado  de  las  dinámicas  internas  propias  del  sistema  y  no  instruidos  desde  el  medio  externo  ni  determinados  por  reglas  o  programas  previos 9 .  Las  redes  conexionistas,  por  ejemplo, entrenadas por medio de Reglas de Hebb10, responden a una determinada  tarea por medio de un patrón global de activación autogenerado y no previsto, ni al  parecer posible de predecir, por el investigador o programador11. A su vez, dichos  patrones se conformarían como representaciones distribuidas de la respuesta a un  determinado problema como podría ser la categorización de un conjunto de inputs  visuales en una simulación perceptiva, o el reconocimiento de vocal o consonante  en  pruebas  gramaticales 12 .    Estas  representaciones  codificadas  en  patrones  globales  de  activación  corresponden  matemáticamente  a  vectores, cuya  evolución  en  el  tiempo  es  descrita  por  ecuaciones  diferenciales    operando  sobre  dominios  continuos y las operaciones sobre las representaciones corresponden por tanto a  operaciones  vectoriales  como  adición,  sustracción,  producto,  superposición,  etc.  Mas  aún,  y  en  fuerte  contraste  con  la  perspectiva  clásica,  en  dichas  representaciones  el  sentido  o  valor  semántico  no  se  daría  a  partir  de  la  composición  de  símbolos    atómicos  estructurales,  sino  que  estaría  ‘codificado’  holísticamente en la forma particular del patrón en sí (Garson, 2015). En palabras  de Varela, Thompson y Rosch (1991):    En el enfoque conexionista, el sentido no esta localizado en símbolos particulares, sino que  opera en función del estado global del sistema, y esta eslabonado con el desempeño general en un  área determinada, como el reconocimiento o el aprendizaje…El significado… (reside) en complejos  modelos  de  actividad  que  emergen  de  las  interacciones  de  dichos  componentes  (los  nodos  conectados en red). (p. 127)  

  La  carga  semántica  que  tendría  así  una  representación  mental  distribuida  sería el producto de una determinada respuesta no predecible, emergente  y auto‐ organizada, a un problema y contexto particular, distando así de ser el resultado de  operaciones formales lógicas sobre símbolos de acuerdo a reglas definidas. Como  ya  mencionamos,  dada  la  manera  en  que  funcionan  estas  redes,  las  tareas  de  categorización  a  partir  de  estímulos,  modelando  por  ejemplo  los  procesos  de  percepción, les han resultado especialmente naturales y exitosas, pero a su vez, la  reproducción  de  habilidades  lingüísticas  o  inferenciales  complejas  ,  les  han  significado mayor desafío, habilidades con las que naturalmente se manejan mejor  los modelos LOTH. Esto irremediablemente pone al debate cuales son los procesos  que conforman esencialmente la cognición, en cuya respuesta invariablemente se  favorecerá  a  uno  u  otro  paradigma.  No  abordaremos  este  punto  en  profundidad  ahora, pero cabe destacar que los modelos conexionistas parten de la premisa de  que la cognición no es esencialmente ‘dura’, como es caracterizada por los modelos  clásicos  con  su  apuesta  al  seguimiento  de  reglas  lógicas  estrictas  en  procesos  inferenciales  y  lingüísticos  que  les  sirven  como  ejemplos  primordiales  de  la  cognición, y mas bien rescatan la adaptabilidad y fluidez de la conducta inteligente,  para  el  modelamiento  de  los  cuales  las  redes  estarían  naturalmente  más                                                            El estudio de fenómenos auto‐organizativos es vasto, abarcando desde el nivel molecular hasta los sistemas económicos. El  estudio de las estructuras disipativas en este ámbito es de vital importancia. Ver Prigogine (1976).  10  Regla de acuerdo a la cuál, para unidades que disparan juntas, el peso de su conexión se fortalece. (Varela et al., 1991)   11  Aquí es donde entran en juego las matemáticas no‐lineales, los atractores en espacios de fase, etc.   12  Como en el caso del programa NetTalk de Sejnowski y Rosenberg (Garson , 2015).   9

aventajadas.  En  consonancia  con  esto,  en  los  modelos  conexionistas  se  da  preferencia a la percepción por sobre los procesos lógico‐inferenciales:   

Si  escribes  las  reglas,  pareciera  que  al  realizar  tales  reglas  en  sistemas  formales  automáticos  (aquello que los programas de IA son) resulta en sistemas que no son lo suficientemente fluidos, ni  robustos  en  desempeño,  para  constituir  lo  que  queremos  llamar  verdadera  inteligencia…  Una  aproximación  fundamentalmente  suave  es  atractiva  si  es  que  ves  la  percepción,  en  vez  de  la  inferencia  lógica,  como    el  cimiento  de  la  inteligencia.  En  el  enfoque  subsimbólico,  la  base  fundamental de la cognición es considerada como categorización y otros procesos perceptuales de  tal tipo. (Smolensky, 1987, p. 282, 284‐5)  

  El comentario de Smolensky tiene un fuerza intuitiva al menos en la idea de  que  la  imagen  del  robot  clásico,  cuyos  movimientos  están  plenamente  determinados  por  el  seguimiento  de  reglas  lógicas  definidas  y  que  presenta  por  tanto  una  conducta  predecible,  a  la  vez  que  limitada  al  procesamiento  de  información  de  estímulos  en  ambientes  controlados  y  relativo  a  tareas  preestablecidas, no asemeja al comportamiento inteligente que podríamos atribuir  a muchos animales y a nosotros mismos y mas bien parece una caricatura de ello.  No  obstante,  un  cognitivista  clásico  podría  objetar  de  que  el  marco  general  de  LOTH no implica una conducta tan rígida y predecible y que mas bien el hecho de  que  los  robots  funcionando  bajo  arquitecturas  clásicas  disten  tanto  de  lo  que  esperaríamos  de  un  agente  inteligente  se  debe  simplemente  al  estado  actual  embrionario de los algoritmos desarrollados y su implementación, los que estarían  explotado una mínima porción del potencial que brinda LOTH.    Esto  es  relevante  pues  es  uno  de  los  puntos  que  los  conexionistas  suelen  expresar  como  evidencia  a  su  favor.  Específicamente  en  relación  a  la  crítica  del  carácter  no‐determinista  de  la  conducta  humana,  para  el  cual  las  redes  serían  mucho mas favorables, F&P replican de que la conducta es finalmente el resultado  de “las interacciones entre el modelo y las propiedades intrínsecas del medio físico  en  el  que  es  realizado”  (F&P,  1988,  p.  59)  y  por  tanto,  las  arquitecturas  clásicas  estarían  bien  posicionados  para  crean  robots  con  una  inteligencia  robusta  y  flexible,  en  la  medida  que  las  propiedades  físicas  de  estos  se  conjuguen  con  los  algoritmos  para  permitir  tal  efecto.  Este  punto  es  importante  pues  el  paradigma  clásico estaría negando que el comportamiento inteligente sea solo producto de los  procesos  representacionales,  siendo  compatible,  al  menos  en  principio,  con  apuestas  que  dan  importancia  por  ejemplo  al  cuerpo,  en  la    producción  de  la  conducta. Aún así esto es un poco injusto con la perspectiva de estos autores pues  el  sustrato  físico  de  implementación  lo  que  brindaría  esencialmente  es  ruido  o  aleatoriedad  y  no  realmente  inteligencia.  No  obstante  esto  hace  que  el  punto  a  favor  del  modelo  conexionista  se  mantenga  pues  es  objetable  que  si  la  conducta  inteligente  es  el  resultado  de  la  interacción  de  factores  representacionales  y  de  implementación, solo uno de ellos aporte mentalidad y otro en cambio solo azar, y  parece  mas  bien  plausible  que  en  tal  caso,  o  bien  ambos  contribuyentes  posean  propiedades cognitivas, o bien ninguno por separado y solo en su interacción. En  radical  divergencia  con  esto,  la  emergencia  de  patrones  globales  de  activación  a  partir de dinámicas de auto‐organización propia de las redes conexionistas, que a  la  vez  son  dependientes  del  contexto  así  como  de  la  historia  de  aprendizaje,   posiciona  mucho  mas  favorablemente  a  estas  redes  en  la  tarea  de  modelar  el  aspecto flexible, adaptativo e impredecible de la conducta inteligente. Si bien no lo  argumentaré aquí y asumiré simplemente su fuerza intuitiva, lo anterior me parece 

se conforma en si mismo como una motivación esencial para dar preferencia a las  arquitecturas conexionistas por sobre las clásicas.   Otras ventajas que estas arquitecturas parecen tener sobre sus predecesores  son    la  capacidad  de  lidiar  mejor  con  procesos  no‐verbales  o  intuitivos,  mayor  robustez  ante  fallas  o  malfuncionamiento  de  partes  del  sistema,  adaptación  en  la  respuesta  a  tareas  nuevas  y  una  arquitectura  mas  afín  con  el  funcionamiento  del  cerebro  (F&P,  1998;  Garson,  2015).  Si  bien  se  han  ofrecido  respuestas  clásicas  a  estos y los anteriores puntos, en su conjunto ilustran los motivos por los cuales las  redes  conexionistas  comenzaron  a  cobrar  en  los  ochentas,  y  aún  tienen,  un  atractivo que pone en riesgo la primacía del enfoque cognitivista tradicional. Dicho  todo  lo  anterior,  se  hace  imprescindible  ya  abordar  el  problema  de  la  sistematicidad  para  el  conexionismo.  Revisemos  por  tanto  dos  propuestas  evaluando sus potenciales frutos explicativos.    3.‐ Conexionismo y sistematicidad    Hemos visto hasta ahora los aspectos centrales de las perspectivas clásica y  conexionista, destacando los aspectos en que estas últimas ofrecerían un potencial  explicativo  preferencial de  la  inteligencia. No  obstante  al tener  presente  el fuerte  argumento  de  F&P  contra  este  enfoque  cognitivo  se  presenta  la  exigencia  de  ofrecer  modelos  no‐clásicos  plausibles  de  la  sistematicidad  mental.  Analicemos  entonces  las  propuestas  conexionistas  de  Chalmers  (1990,  1993)  y  Smolensky  (1987, 1988) a este problema.      3.1. Transformaciones sintácticas holísticas.    El reto de F&P para el conexionismo consiste en explicar la sistematicidad  del  pensamiento  sin  recurrir  a  LOTH.  La  idea  central  del  ataque  es  que  la  única  manera  de  lograrlo  es  proponer  representaciones  mentales  estructuradas    sobre  elementos  atómicos  concatenados  y  procesos  sintácticos  sensibles  a  dichas  estructuras.  Lo  siguiente  es  que  al  hacerlo,  automáticamente  se  estaría  reproduciendo  un  formalismo  clásico  y  por  tanto  toda  distinción  en  el  modelamiento  de  los  procesos  pertinentes  pasaría  a  un  plano  de  mera  implementación y no de nivel cognitivo. La apuesta de Chalmers (1990, 1993) es  de  ofrecer  pruebas  empíricas  de  que  el  tipo  de  transformaciones  sintácticas  que  permiten modelar la sistematicidad del pensamiento son posibles de instanciar en  un estilo estrictamente conexionista.   En  una  serie  de  experimentos,  utilizando  el  sistema  de  Memoria  Auto‐ Asociativa  Recursiva  (RAAM)  de  Pollak,  logró  entrenar  a  una  red  para  que  esta  tuviera  la  capacidad  de  transformar  oraciones  a  sus  formas  pasivas,  e.g.  de  ‘Juan  ama  a  María’    a  ‘María  es  amada  por  Juan’.  Cada  oración  es  un  representación  distribuida en cuya forma yacen implícitos los constituyentes estructurales. No es  posible identificar y aislar dentro del patrón átomos semánticos individuales que  puedan  extraerse  para  procesos  de  transformación  sintáctica,  lo  que  constituiría  una  rutina  propia  de    un  sistema  clásico.  Mas  bien,  en  los  experimentos  se  instancian procesos que operan directa y holísticamente sobre las representaciones  compuestas  logrando,  después  de  la  etapa  pertinente  de  entrenamiento,  la  pasivización de las oraciones con una generalización del 100%.   

Los  resultados  indicarían  que  las  redes  conexionistas  están  posibilitadas  para  llevar  a  cabo  procesos  de  transformación  sintáctica  sobre  representaciones  distribuidas   que serían conducentes a modelar la sistematicidad del pensamiento  sin  recurrir  a  las  formulaciones  clásicas.  Las  estructuras  de  las  representaciones  poseerían una estructura composicional, tal como es demandado por (1), pero que  sin embargo sería representada de manera implícita y no concatenada, difiriendo  de  la  representación  compuesta  tradicional.  Por  otra  parte,  los  procesos  computacionales  que  operan  sobre  dichas  representaciones  estarían  efectivamente siendo sensibles a las estructuras al lograr operar sobre ellas en el  proceso  de  transformación,  tal  como  se  exige  en  (2).    El  aspecto  esencial  que  destaca  el  autor  como  punto  de  divergencia  con  respecto  a  los  procedimientos  clásicos es la operación directa sobre la representación distribuida, sin pasar por  etapas de descomposición. Esto es consecuente con “el rechazo al símbolo atómico  como  portador  de  sentido”(Chalmers  1993,  p.  309)  que  de  acuerdo  a  Chalmers  representa el espíritu del conexionismo, reforzando la idea de que son los patrones  globales de activación de las redes los que encierran en si mismos su significación.  Así  mismo,  este  tipo  de  operaciones  permitirían  vislumbrar  nuevas  posibilidades  de exploración en el modelamiento de los procesos cognitivos:    Estas  operaciones  holísticas  representan  un  completo  nuevo  rango  de  funciones  posibles  que  pueden  ser  usadas  en  las  representaciones  conexionistas.  Existen  por  tanto  una  distinción  funcional entre los modelos conexionistas y clásicos de composicionalidad, y  es en esta distinción  funcional  que  yace  la  promesa  de  representación  composicional  conexionista.  En  ningún  sentido  pueden  estas  funciones  considerarse  implementaciones  de  las  operaciones  clásicas;  ellas  abren  toda una nueva área de investigación.”  (Chalmers 1990, p. 2) 

  El  investigador  estaría  por  tanto  aplicando  los  criterios  (1)  y  (2)  para  modelar  sistematicidad  pero  de  una  forma  en  que  su  propuesta  no  implicaría  la  presencia  de  un  lenguaje  del  pensamiento.  La  constitución  semántica  y  sintáctica  implícita  y  la  computación  holística  sobre  la  representación  compuesta  estarían  marcando  la  distancia  con  respecto  al  cognitivismo  clásico.  Mas  adelante  dedicaremos tiempo a discutir si estos aspectos efectivamente  son relevantes para  determinar  si  se  está  implementando  una  arquitectura  mental  sin  LOTH.  Por  lo  pronto pasemos a considerar nuestra segunda propuesta conexionista.     3.2. Composicionalidad de las representaciones conexionistas.    La  propuesta  de  Smolensky  (1987,  1988)  también  nos  dice  que  es  posible  acoger  (1)  y  (2)  sin  recurrir  a  LOTH.  La  naturaleza  de  las  representaciones  y  procesos computacionales difiere en tal medida que, así como vimos en Chalmers,  parece  plausible  poder  instanciar  estructuras  de  datos,  formalizadas  no  como  símbolos,  sino  como  entidades  vectoriales,  sobre  las  cuales  a  su  vez  se  apliquen  procesos  matemáticos  de  transformación  que  se  conformen  como  un  nivel  subsimbólico  de  representación  y  con  ello,  de  cognición.  El  autor  es  explícito  en  rechazar  (1) y (2) como ‘la marca’ de la arquitectura clásica:    Afirmar,  como  F&P  explícitamente  lo  hacen,  que  cualquier  arquitectura  cognitiva  que  incorpore  representaciones mentales estructuradas y procesos sensibles a tal estructura es una Arquitectura  Clásica, es inflar la noción de ‘Arquitectura Clásica’ hasta un grado inaceptable. (Smolensky, 1988, p.  3) 

  El  autor  propone  dos  tipos  de  composicionalidad  estructural  que  tendrían  las  representaciones  distribuidas  conexionistas:    débil  y  fuerte.  La  composicionalidad  débil  se  da  de  la  siguiente  manera.  Las  representaciones  mentales son patrones de actividad de la red donde las unidades corresponden a  microcaracterísticas (microfeatures) que bien pueden estar activas o inactivas. En  el ejemplo que proporciona el investigador, la representación mental de ‘café’, es  un patrón global construido a partir de la activación de nodos correspondientes a  microcaracterísticas como por ejemplo  ‘liquido caliente’, ‘olor penetrante’, ´líquido  oscuro  contactando  porcelana’,  etc.  Esta  representación  tendría  una  relación  estructural  con  otras  representaciones  vinculadas  semánticamente  gracias  a  compartir  microcaracterísticas  y  de  manera  mas  relevante,  poder  transformarse  unas en otras a través de operaciones vectoriales simples de adición y sustracción.   Así,  la  representación  ‘café’,  puede  obtenerse  sustrayendo  la  representación  vectorial ‘taza con café’, de la representación ‘taza sin café’, ambas representadas  por  patrones  de  activación  de  unidades  correspondientes  a  microcaracterísticas.  Esta  vinculación  estructural  sería  una  forma  débil  de  composicionalidad  que  no  obstante  satisfaría  los  criterios  para  la  explicación  de  sistematicidad,  evitando  simultáneamente la carga de implementación conexionista de arquitectura clásica.    La composicionalidad fuerte  en cambio no utiliza las microcaracterísticas y   agrega  operaciones  vectoriales  de  superposición  y  multiplicación.  En  términos  generales  la  estrategia  es  definir  nodos  como  roles,  e.g.  segunda  letra  en  una  palabra de cinco, nodos como ‘llenadores’, e.g. la letra ‘f’, productos tensoriales que  vinculan  matemáticamente  la  actividad  de  dichos  nodos  y  superposición  de  vectores  que  codificarían  las  representaciones  complejas  cuya  estructura  estaría  implícita en las operaciones vectoriales sobre las que la representación distribuida  global se edificaría. La representación de ‘Juan’ estaría codificada así en un vector  de  superposición  resultante  de  operaciones  vectoriales  que  mantendrían  la  estructura  sintáctica  de  la  palabra  de  manera  implícita.  Estas  representaciones  podrían a su vez superponerse con otros vectores para dar lugar a representación  de  oraciones  como  ‘Juan  ama  a  María’    que  poseería  de  manera  implícita  su  estructura  vectorial‐composicional‐sintáctica  constituyente.  Estas  estructuras  soportarían  a  su  vez  la  acción  de  operaciones  de  transformación  sintácticas  que  permitirían  modelar  la  sistematicidad  del  pensamiento.    En  resumen,  el  formalismo  conexionista  estaría  posibilitado  de  satisfacer  (1)  y  (2)  sin  utilizar  la  hipótesis de un lenguaje del pensamiento para resolver el problema. El riesgo de  implementación se evitaría al generar representaciones compuestas susceptibles a  transformaciones  sintácticas  y  composicionalidad  semántica  a  partir  de  la  representación  implícita    de  sus  constituyentes  y  fundarse  en  un  nivel  vectorial  representacional y subsimbólico de análisis y modelamiento.     Ambas apuestas conexionistas estarían optando por satisfacer (1) y (2) para  modelar  sistematicidad  pero  con  un  formalismo  no  clásico  justificado   principalmente por fundarse en un dominio no simbólico de representación y a su  vez  por  soportar  representaciones  compuestas  con  estructura  implícita  no‐ concatenada  sobre  las  cual  no  obstante  podrían  operar  transformaciones   sistemáticas.  Pasemos  ahora  a  discutir  con  Aydede  (1997)  quien  sostiene  que  la  manera conexionista de representar estructuras compositivas y procesos sensibles  a estas no los libera del dilema propuesto por F&P y colapsan invariablemente en  el cuerno de la mera implementación conexionista de arquitecturas clásicas. 

  4.‐ La crítica de  Aydede a las propuestas conexionistas.   En  su  artículo  de  1997  titulado  ‘Language  of  Thought:  The  Connectionist  Contribution’ , Murat Aydede pretende desarticular toda esta dimensión del debate  clasicismo/conexionismo  defendiendo  la  tesis  de  que  la  estructuración  concatenada  o  explicita  de  las  representaciones  mentales  no  es  una  condición  necesaria  ni  suficiente  para  que  estas  sean  clásicas,  y  por  ello,  las  propuestas  representacionales  distribuidas  y  vectoriales  con  estructura  implícita  no  significarían  una  divergencia  significativa  con  respecto  a  las  representaciones  propias de las arquitecturas LOTH. El autor nos remite a la especificación que F&P  hacen  de  la  diferencia  entre  los  modelos  clásicos  y  conexionistas,  en  donde  el  aspecto  crucial  es  que,  como  ya  hemos  visto,  los  primeros,  y  no  los  segundos,   postulan un lenguaje del pensamiento, expresado por las clausulas (1) y (2). Pese a  que  el  mismo  Fodor  (Fodor  &  McLaughlin,  1990),  en  la  discusión  con  Smolensky  parece adoptar el requisito de estructuras explicitas/concatenadas para hacer que  una representación sea clásica, Aydede nos recuerda que no hay nada  en (1) y (2)  que nos remita a ello.     Como  sabemos,  de  acuerdo  a  F&P,  satisfacer  (1)  y  (2)  es  la  única  manera  que una teoría de la cognición pueda explicar la sistematicidad del pensamiento y  simultáneamente,  es  lo  que  define  a  un  paradigma  clásico.  Aquí  se  encuentra  la  esencia  del  dilema  que  ofrecen  al  conexionista.  Según  la  perspectiva  de  Aydede  entonces, aun cuando la propuesta de Smolensky y Chalmers pudiese permitir que  los  procesos  de  transformaciones  sintácticas  sean  sensibles  a  las  estructuras  implícitas  de  las  representaciones  conexionistas  y  aún  cuando  los  procesos  composicionales  y  sintácticos  se  realicen  de  maneras  que  disten  considerablemente de las propias de los modelos clásicos, ellos no serían mas que  formas  notablemente  novedosas  y  distintas  de  implementar  la  teoría  clásica.  El  punto de Aydede es que  (1) y (2) efectivamente define a las arquitecturas clásicas  y al ser compatible  con la instanciación de estructuras implícitas no‐concatenadas,  el tema de la concatenación como un criterio de demarcación clásico/conexionista  es  errado.  Mi  parecer  es  que  debe  haber  algo  errado,  no  en  el  criterio  de  la  concatenación, sino en el argumento de Aydede. Mas bien, el punto nos remite a los  mismos F&P.      Como  es  mencionado  por  Aydede,  el  propio  Fodor  (Fodor  &  Maclaughlin,  1991,  en  adelante  F&M)  toma  parte  del  debate  acerca  de  la  posibilidad/imposibilidad  conexionista  de  tener  procesos  sensibles  a  las  estructuras  de  las  representaciones  complejas  en  consideración  de  la  estructuración  implícita/explicita  de  estas.  La  discusión  se  torna  entonces  en  un  debate  acerca  de  la  plausibilidad  empírica  de  que  las  estructuras  de  las  representaciones  conexionistas,  aun  cuando  no  se  compongan  explicita  y  concatenadamente como las representaciones clásicas,  puedan ser afectadas por,  y  afectar  a,  los  procesos  de  transformaciones  sintácticas  requeridos  para  modelar/explicar  fenómenos  como  sistematicidad.  Esta  postura  de  Fodor  tiene  sentido  al  observar  la  manera  en  que  en  el  citado  articulo  F&M  definen  a  un  constituyente  clásico  de  una  representación  compleja.  Una  representación  es  un  constituyente  clásico  de  otra,  “solo  si  la  primera  es  ejemplificada  cada  vez  que  la  segunda es ejemplificada” (Fodor & Maclaughlin, 1991, p. 333). Esto nos remite al  proceso  necesario  de  extracción  de  los  constituyentes  atómicos  de  una 

representación  compleja  en  todo  procesamiento  clásico  de  transformación  sintáctica, que la propuesta de Chalmers enfatiza en evitar. Dichos constituyentes  atómicos  son,  o  pueden  a  su  vez  descomponerse  en,  las  unidades  estructurales  básicas  del sistema representacional, o vocabulario básico del lenguaje simbólico  interno del sistema dentro del paradigma LOTH. Estos átomos semánticos son fijos  y  contexto‐independientes.  Conforman  un  repertorio  determinado  de  elementos  innatos  susceptibles  de  combinarse  y  producir  estructuras  complejas  nuevas,  de  acuerdo  a  reglas  gramaticales  predefinidas.  A  esta  altura  podemos  apreciar  el  contraste  con  la  perspectiva  conexionista  que  rechaza  la  visión  de  la  cognición  como  basada  en  átomos  semánticos  contexto‐independientes  e  innatos  y  por  el  contrario  enfatiza  la  noción  de  representaciones  contexto‐dependientes,  distribuidas, sobre las cuales pueden realizarse operaciones de transformación de  manera  directa  y  holística,  sin  extracción  previa  de  constituyentes.  Estas  operaciones  de  transformación  funcional,  precisamente  por  operar  directamente  sobre las representaciones complejas,  no a través de sus constituyentes, y en un  dominio  distinto  de  relaciones  matemáticas,  primordialmente  vectoriales,  como  indicamos  antes,  “abren  una  completa  nueva  área  de  investigación”  (Chalmers  1990,  p.  3)  para  el  conexionista,  con  lo  cual  resulta  poco  atractiva  la  idea  de  considerarlas meras implementaciones de viajas ideas clásicas, por muy novedosa  que pueda ser la manera en que se hagan.    Volvamos  sobre  los  puntos  (1)  y  (2)  para  derribar  de  raíz  el  punto  de  Aydede,  y  con  ello,  el  dilema  de  F&P.  Nadie  parece  estar  en  desacuerdo  que  la  satisfacción de estos resulta necesaria y suficiente para resolver el problema de la  sistematicidad  del  pensamiento  de  una  manera  naturalista.  No  obstante,  dicha  satisfacción  no  puede  simultáneamente  hacer  colapsar  a  un  modelo  como  el  conexionista,  que  presenta  tantas  diferencias  fundamentales  con  el  paradigma  clásico, en una expresión de este último. Mi perspectiva es que efectivamente los  modelos conexionistas satisfacen (1) y (2) de manera tan disímil al modelo clásico  (en el nivel cognitivo‐representacional), que la acusación de mera implementación  resulta  infundada.  En  los  modelos  conexionistas  que  revisamos  brevemente,  las  representaciones  compuestas  guardan  a  sus  constituyentes  no  una  relación  de  molécula a átomo, como el sistema clásico, sino de, digamos, molécula a molécula.  Entendamos esto en dos sentidos.   Por  una  parte,  una  representación  compuesta,  i.e.  con  estructura  constitutiva como ‘árbol con manzanas’, guarda a su constituyente ‘manzana’, una  relación  molécula‐molécula  en  el  sentido  de  que  ‘manzana’  también  es  una  molécula.  Esto  no  porque  pueda  descomponerse  en  las  letras  que  la  componen  sino por que manzana bien podría tener a ‘fruta de sabor x’ y ‘fruta de textura z’  como partes de su estructura constitutiva. Evidentemente esto parece muy extraño  pero se hace inteligible si tomamos en consideración que justamente los procesos  de  composición  conexionista  son  funcionales  y  no  concatenados.  Al  operar  entre  vectores,  son  diversos  los  procedimientos  matemáticos  que  pueden  usarse  para  originar representaciones a partir de otras, no teniendo porque necesariamente las  ultimas, ser siempre mas ‘simples’ o ‘básicas’ que las primeras. Por otra parte, las  representaciones  tienen  en  su  estructura,    diversas  microcaracterísticas    que  representan  a  su  vez  distintos  aspectos  de  aquello  que  se  esta  representando,  características  que  dependiendo  del  contexto,  se  exaltarán  unas  mas  que  otras.   Así,  ‘manzana’  se  construye  en  relación  a  diversas  microcaracterísticas  que 

podrían  incluir,  dependiendo  del  contexto,  a  ‘cuasi‐esfera  verdosa’  y  ‘olor  dulce’  por ejemplo.    Los ‘átomos’ que de acuerdo a las operaciones computacionales sensitivas a  estructura  propias  de  las  propuestas  conexionistas,  puede  ‘componer’  a  representaciones    ‘moleculares’,  no  comparten  los  atributos  de  las  unidades  semánticas propias de LOT, no poseen un contenido semántico univoco, contexto‐ independiente,  ni  son  necesariamente  mas  simples  que  las  estructuras  que  componen.  No  conforman  por  tanto  un  repertorio  de  unidades  semánticas  a  la  espera  de  combinarse  para  dar  origen  a  estructuras  mas  complejas  en  las  cuales  hagan  típicamente  la  misma  contribución.  No  conforman  por  tanto  un  sistema  simbólico  en  base  al  cuál  se  pueda    explicar  las  relaciones  sistemáticas  entre  pensamientos  compuestos  semánticamente  vinculados.  En  vista  de  esto,  cobra  mucho  mayor  sentido  no  pensar    en  dichas  estructuras  conexionistas  como  formadas  en  un  lenguaje  del  pensamiento.  Esto  cobra  mas  fuerza  al  ver  las  representaciones  mentales  conexionistas  como  patrones  globales  emergentes  auto‐organizados,    contexto‐dependientes  y  afectados  por  la  historia  de  interacciones  pasadas,  que  distan  mucho  de  pertenecer  y  constituirse  a  partir  de  un sistema simbólico fijo predeterminado y atómico.  La  moraleja  es  que  si  bien  (1)  y  (2)    efectivamente  se  aprecian  como  requisitos,    o  al  menos  como  una  vía  segura  para  resolver  el  problema  de  la  sistematicidad, estos puntos no pueden definir a un modelo clásico, ya que harían  caer  bajo  esta  perspectiva  a  propuestas  con  tantas  disimilitudes  fundamentales  con respecto al paradigma LOTH, como las que hemos revisado. Aydede esta en lo  cierto en señalar que nada en (1) y (2) hacen referencia directa a concatenación o  composicionalidad  explicita,  pero  erra  al  afirmar  que  esto  es  irrelevante  para  distinguir  las  arquitecturas.  Podemos  concluir  que  el  formalismo  vectorial  utilizado  para  codificar  y  operar  sobre  las  representaciones  distribuidas  conexionistas  estructuradas  implícitamente  si  es  decisivo  para  justificar  la  divergencia con respecto al cognitivismo clásico y conformarse así como un nuevo  paradigma en ciencia cognitiva. Esto es reforzado por las propuestas efectivas de  solucionar  el  problema  de  la  sistematicidad  del  pensamiento  que,  dada  la  naturaleza  subsimbólica  de  las  representaciones  y  procesos  cognitivos  conexionistas, resultaba un desafío considerable que parece haber sido superado.      Conclusiones.    El  cognitivismo  clásico  con  su  hipótesis  central  de  que  los  procesos  mentales  tienen  lugar  gracias  a  la  existencia  de  un  lenguaje  interno  de  representaciones  mentales  pese  a  tener    un  gran  potencial  explicativo  y  haber  dominado  el  campo  de  la  psicología  cognitiva  e  inteligencia  artificial  durante  décadas,  tiene  no  obstante  sus  limitaciones.  En  este  escrito  se  dio  énfasis  a  la  dificultad  de  tal  perspectiva  de  dar  cuenta  del  aspecto  impredecible  y  adaptativo  de  la  conducta  inteligente,  que  se  nos  muestra  como  una  característica  fundamental de la cognición en un sentido robusto y del cual una teoría psicológica  debe  irremediablemente  dar  cuenta.  Los  modelos  conexionistas,  dada  la  arquitectura  que  les  es  propia  se  encuentran  mejor  posicionados  para  esto.  Patrones de activación emergentes surgidos a partir de la auto‐organización de las  redes  como  respuesta  a  los  estímulos  de  entrada  y  en  función  de  las  tareas  presentadas brindan a las representaciones distribuidas conexionistas una ventaja 

natural  para  modelar  el  carácter  no‐determinista  y  flexible  de  la  inteligencia,  así  como  procesos  cognitivos  como  la  percepción  y  categorización  en  general.  Estas  virtudes  explicativas  tendrían  el  riesgo  de  quedarse  en  el  mero  ámbito  de  lo  posible y de la esperanza de conformarse como un paradigma robusto alternativo  si aspectos como la sistematicidad del pensamiento, que si bien su rol como marca  distintiva de la cognición puede ser cuestionable, parece estar masificada al menos  en la manera en que los seres humanos pensamos y actuamos. El mensaje central  de  este  escrito  fue  demostrar  que  tal  desafío  puede  efectivamente  superarse  por  medios  estrictamente  conexionistas  que  prescindan  de  un  sistema  simbólico  interno de representaciones mentales constituidas a partir de átomos  semánticos  contexto‐independientes  con  reglas  lógicas  definidas  para  el  procesamiento  de  tales representaciones y la consecuente producción de outputs conductuales, y que  en cambio, más bien habiten un dominio subsimbólico donde las representaciones  mentales  son  codificadas    por  medio  de  entidades  matemáticas  vectoriales  que  describen  procesos  dinámicos  auto‐organizativos  de  los  cuales  propiedades  emergentes  globales  e  impredecibles  juegan  un  rol  central.  Podemos  reformular  entonces la afirmación de Fodor que dio inicio a este escrito en una versión que se  ajuste mas apropiadamente al estado actual de las ciencias cognitivas: “el beneficio  de no tener un lenguaje del pensamiento es tener una mejor teoría del pensar”.     Bibliografía    ‐Aydede, M., (1997). “Language of Thought: The Connectionist   Contribution,” Minds and Machines, Vol. 7, No. 1, pp. 57–101.  ‐Aydede, M. & McLaughlin, B., (2010)."The Language of Thought   Hypothesis", The Stanford Encyclopedia of Philosophy (Fall 2010 Edition),  Edward N. Zalta (ed.), URL =  .  ‐Chalmers, D. (1990). “Syntactic Transformations on Distributed   Representations,” Connection Science, 2: 53–62.  ‐Chalmers, D. (1993). “Connectionism and Compositionality: Why Fodor and   Pylyshyn Were Wrong” in Philosophical Psychology 6: 305–319.  ‐Fodor, Jerry A. (1975). The Language of Thought, Cambridge, Massachusetts:   Harvard University Press.  ‐Fodor, Jerry A.  (1987). Psychosemantics: The Problem of Meaning in the Philosophy   of Mind, Cambridge, Massachusetts: MIT Press.  ‐Fodor, J. &. McLaughlin, B. (1990). “Connectionism and the Problem of   Systematicity: Why Smolensky's Solution Doesn't Work,” Cognition 35: 183– 204.  ‐Fodor, J. & Pylyshyn, Z. (1988). “Connectionism and Cognitive Architecture: A   Critical Analysis” in S. Pinker and J. Mehler, eds., Connections and Symbols,  Cambridge, Massachusetts: MIT Press (A Cognition Special Issue).  ‐Garson, J.(2015). "Connectionism", The Stanford Encyclopedia of   Philosophy (Spring 2015 Edition), Edward N. Zalta (ed.), URL =    ‐Horgan, T. & Tienson, J. (eds.), (1991), Connectionism and the Philosophy of   Mind, Dordrecht: Kluwer.  ‐Prigogine, I. (1976). “Order through fluctuation: Self‐organization and social   system”. In Evolution and Consciousness: Human Systems in Transition, ed. E. 

Jantsch and C. Waddington. Reading, MA: Addison‐Wesley.  ‐Smolensky, P. (1987), “The Constituent Structure of Connectionist Mental States:   A Reply to Fodor and Pylyshyn,” The Southern Journal of Philosophy, 26  (Supplement): 137‐161.  ‐Smolensky, P. (1988), 'Connectionism, Constituency and the Language of   Thought', University of Colorado Technical Report; also forthcoming in B.   Loewer, and G. Rey, (eds.), Meaning in Mind: Fodor and His Critics, Oxford,  Blackwell.  ‐Thompson, E. (2007). Mind in Life: Biology, Phenomenology, and the Sciences of   Mind. Harvard University Press.  ‐Varela, F., Thompson, E., and Rosch, E. (1991). The Embodied Mind: Cognitive   Science and Human Experience. MIT Press. 

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.