El juego de los principios. una introducción al método axiomático (Buenos Aires: A-Z Editora, 2013) (Texto completo en PDF).

May 23, 2017 | Autor: Alejandro Cassini | Categoría: Philosophy of Science, Philosophy Of Mathematics
Share Embed


Descripción

JP 001a004-Prel.QXD:0009

19/4/12

10:39

Página 1

El juego de los principios

JP 001a004-Prel.QXD:0009

19/4/12

10:39

Página 2

JP 001a004-Prel.QXD:0009

19/4/12

10:39

Página 3

Alejandro Cassini

El juego de los principios Una introducción al método axiomático

Prólogo de Gregorio Klimovsky

JP 001a004-Prel.QXD:0009

22/3/13

09:55

Página 4

La reproducción total o parcial de este libro –en forma textual o modificada, por fotocopiado, medios informáticos o cualquier otro procedimiento– sin el permiso previo por escrito de la editorial viola derechos reservados, es ilegal y constituye delito.

1.ª edición: julio de 2007 2.ª edición: junio de 2013

© A-Z editora S.A. Paraguay 2351 (C1121ABK) Ciudad Autónoma de Buenos Aires, Argentina Teléfono: (011) 4961-4036 Fax: (011) 4961-0089 Correo electrónico: [email protected] www.az.com.ar Cassini, Alejandro El juego de los principios : una introducción al método axiomático. - 2a ed. - Buenos Aires : AZ, 2012. 220 p. ; 24x17 cm. ISBN 978-987-35-0042-8

A-Z, la editorial argentina orgullosa de ser Marca País.

Libro de edición argentina Hecho el depósito de la ley 11.723 Derechos reservados

1. Enseñanza Universitaria. I. Título CDD 378 Fecha de catalogación: 13/08/2012

JP 005a008-Ind.QXD:0009

22/5/12

10:01

Página 5

Índice general

Lista de símbolos - 7. Prólogo - 9. Introducción a la primera edición - 13. Introducción a la segunda edición - 17. Capítulo 1. Breve historia del método axiomático - 19. 1.1 Introducción - 19. 1.2 La axiomática antigua - 19. 1.3 La axiomática moderna - 29. Capítulo 2. La estructura de un sistema axiomático - 55. 2.1 ¿Qué es un sistema axiomático? - 55. 2.2 Elementos de un sistema axiomático - 57. 2.3 Ejemplo de un sistema axiomático - 62. 2.4 Sistemas equivalentes - 69. 2.5 Lógica de primer orden - 70. 2.6 Teorías de primer orden - 73. Capítulo 3. La interpretación de un sistema axiomático - 81. 3.1 Introducción - 81. 3.2 Los conceptos de interpretación y modelo - 82. 3.3 Interpretaciones y modelos de la teoría de grupos - 85. 3.4 Interpretaciones y modelos de la teoría de los anillos - 89. 3.5 Estructuras y modelos - 91. Capítulo 4. Las propiedades de un sistema axiomático - 95. 4.1 Propiedades de los sistemas axiomáticos en general - 95. 4.2 Propiedades de las teorías formales de primer orden - 112. Capítulo 5. Teorías axiomatizadas - 117. 5.1 Introducción - 117. 5.2 La teoría de conjuntos - 118. 5.3 La topología general - 127.

5

JP 005a008-Ind.QXD:0009

EL

22/5/12

10:01

Página 6

JUEGO DE LOS PRINCIPIOS

5.4 La teoría de la probabilidad - 134. 5.5 La teoría de la medición - 143. Capítulo 6. Ventajas y dificultades del método axiomático - 153. 6.1 Introducción - 153. 6.2 Ventajas generales de la axiomática - 154. 6.3 Dificultades generales de la axiomática - 160. 6.4 El método axiomático en las ciencias formales - 162. 6.5 El método axiomático en las ciencias naturales y sociales - 165. 6.6 Pensamiento axiomático, intuición y certeza - 170. Apéndice 1. Las pruebas de consistencia - 175. Apéndice 2. Axiomas y sistemas axiomáticos: de Aristóteles a Kolmogorov - 183. 2.1 Los tres axiomas de Aristóteles - 183. 2.2 El sistema de Euclides - 184. 2.3 Los axiomas de Arquímedes para la estática - 186. 2.4 La astronomía axiomática de Aristarco - 186. 2.5 La estática de Jordano de Nemora - 187. 2.6 La aritmética axiomática de Jordano de Nemora - 188. 2.7 Los axiomas de la mecánica en Galileo - 189. 2.8 Las leyes del movimiento en Newton - 190. 2.9 La óptica de Newton - 191. 2.10 Los axiomas de Frege para la lógica de primer orden - 193. 2.11 Los axiomas de Peano para la aritmética - 193. 2.12 La axiomática de Hilbert para la geometría euclídea - 194. 2.13 Los axiomas de Huntington para la teoría de las magnitudes continuas - 197. 2.14 Los axiomas de Zermelo para la teoría de conjuntos - 198. 2.15 La topología general de Hausdorff - 199. 2.16 La lógica intuicionista - 199. 2.17 La lógica modal - 201. 2.18 Los axiomas de Kolmogorov para la teoría de la probabilidad - 203. Apéndice 3. El concepto de función - 205. Bibliografía - 209.

6

JP 005a008-Ind.QXD:0009

24/5/12

17:17

Página 7

Lista de símbolos

Lógica

Conjuntos

¬ & v → ↔ ∀ ∃ = ≠ l–

{x: ϕ(x)} ∈ ∉ ∅ U ⊆ ⊂ ∪ ∩ ~ ℘A 〈x, y〉

=

|



Negación Conjunción Disyunción Condicional Bicondicional Cuantificador universal Cuantificador existencial Identidad Diferencia Deducibilidad Consecuencia lógica Conclusión

Abstracción de conjuntos Pertenencia No pertenencia Conjunto vacío Clase universal Inclusión Inclusión propia Unión Intersección Complemento Conjunto potencia Par ordenado

Las definiciones van precedidas por el símbolo ◊, y los metateoremas por el símbolo . El final de una demostración se indica con el símbolo . Cuando se yuxtaponen varios cuantificadores del mismo tipo escribo de manera abreviada ∀(xyz...) en vez de ∀x ∀y ∀z..., y ∃(xyz...) en vez de ∃x ∃y ∃z... Otras variantes de la notación y definiciones de los principales conceptos de la lógica y la teoría de conjuntos pueden encontrarse en el breve diccionario de Detlefsen, McCarty y Bacon (1999). La obra de Mosterín y Torretti (2010) es más amplia y también incluye conceptos matemáticos. Todos los términos matemáticos o lógicos empleados en este libro también se hallan definidos, de manera breve pero precisa, en el diccionario de matemáticas de Borowski y Borwein (2006).

7

JP 005a008-Ind.QXD:0009

22/5/12

10:01

Página 8

JP 009a018-Prol.QXD:0009

6/8/12

15:53

Página 9

Prólogo

os antiguos filósofos y matemáticos griegos advirtieron que en la matemática había algo especial que la diferenciaba de las demás ciencias. En tanto estas últimas se fundamentaban en la experiencia y brindaban un conocimiento aproximado y cambiante, la matemática ofrecía información nítida, eterna y absoluta. Uno de los primeros resultados de la investigación matemática (obtenido por Tales de Mileto a comienzos del siglo VI A.C.) establecía que un diámetro divide a un círculo en dos partes iguales. Si el método matemático fuera igual al de las demás ciencias, lo que en realidad se habría establecido es que “tomando un objeto lo más circular posible y un trazo lo más aproximado que se pudiera a un diámetro, el objeto quedaría dividido en dos partes casi iguales”. Pero eso no era lo que afirmaba el matemático, que mencionaba círculos perfectos, diámetros exactos y partes nítidamente iguales, con la idea de que sobre eso no podría haber cambios y su validez sería eterna. ¿Cuál era la razón por la que el matemático poseía esa perfección? ¿Qué método permitía obtener conocimiento con tales características óptimas? Las respuestas fueron muchas y muy diversas, dependiendo de las convicciones filosóficas de cada pensador que reflexionara sobre esta cuestión. Para Aristóteles (siglo IV A.C.) existían dos fuentes para la obtención de este tipo de conocimiento. La primera era de naturaleza lógica y relacionada con la idea de deducción. Como se sabe, un razonamiento es un salto que va de ciertas premisas a una conclusión. Si el razonamiento es correcto, su estructura es tal que garantiza la transmisión de la verdad de las premisas a la conclusión. Dicho de otro modo, debe quedar garantizado que si todas los premisas son verdaderas, la conclusión es verdadera. Adviértase que no se afirma que las premisas sean verdaderas, sino que si lo son, la conclusión debe serlo también. Un razonamiento correcto suele denominarse una deducción (de las premisas a la conclusión). De acuerdo con esto, una manera de obtener una verdad matemática es deduciéndola de verdades ya obtenidas. Esta es una metodología típica de la matemática, y es por ello que se dice que ésta es una ciencia deductiva. Sin embargo, esto no basta para obtener todas las verdades matemáticas. Aristóteles percibió claramente que si dispusiéramos únicamente de la deducción, se produciría un regreso al infinito. Pues tendríamos el problema de saber que las premisas son verdaderas, para lo cual deberíamos haberlas deducido de otras premisas ya conocidadas como verdaderas, y así repetidamente. Para que

L

9

JP 009a018-Prol.QXD:0009

EL

6/8/12

15:53

Página 10

JUEGO DE LOS PRINCIPIOS

no se produzca este regreso al infinito, deberían existir premisas cuya verdad se conociera de manera no deductiva. Y esta es la segunda fuente del conocimiento matemático. Se trataría de encontrar afirmaciones que por su simplicidad y obviedad pudieran considerarse evidentes. Estas son las que tomaríamos al comienzo. A partir de ellas, por medio de diferentes etapas deductivas, obtendríamos las restantes verdades matemáticas. La metodología pertinente, según Aristóteles, consiste, entonces, en partir de los principios (las afirmaciones evidentes) y luego deducir las demás afirmaciones, que serían los teoremas. El razonamiento complejo que lleva de los principios a los teoremas se llama una demostración. Aristóteles cree, además, que esta metodología es válida para cualquier ciencia, la que estructurada de este modo se llama “ciencia demostrativa”. Actualmente, diríamos que estamos ante un “sistema axiomático clásico” y el método en cuestión sería el “método axiomático clásico”. Cuando se habla de este modo es porque la costumbre nos ha habituado a llamar axiomas a los principios (Aristóteles no usa “axioma” en este sentido general). El método aristotélico se consideró paradigmático durante más de dos milenios. Pero ya durante el siglo XIX se hizo claro que este procedimiento no garantizaba la obtención de conocimiento científico. La dificultad estaba en la condición de “evidencia” para aceptar los principios. La evidencia es un fenómeno psicológico que no asegura la verdad y puede con frecuencia llevar al error. Un cambio prudente fue que para los principios se exigiera únicamente que fueran buenas hipótesis. De este modo, al menos para las ciencias fácticas o empíricas, el método se transformó en “hipotético-deductivo”, y los “sistemas axiomáticos clásicos” cedieron su lugar a los “sistemas hipotético-deductivos”. Pero si bien esta estrategia fue muy oportuna para la física, la química y, en general, para las ciencias naturales, era claro que no podía utilizarse en el campo de la matemática, donde las afirmaciones (principios y teoremas) no pueden ser hipótesis. En la primera mitad del siglo XIX, cuando se descubrieron las geometrías no euclídeas, la aparición de la noción de “sistema axiomático formal” proporcionó una nueva visión de la naturaleza del lenguaje matemático y de la metodología correspondiente. Se trata de entidades pertenecientes a la lógica aplicada cuyas aplicaciones a las investigaciones contemporáneas son tan importantes que justifican el esfuerzo de examinar con detalle su compleja estructura y sus múltiples usos. No abundan en lengua española los libros dedicados al análisis y discusión del método axiomático formal. Alejandro Cassini ha querido proporcionarnos un libro de texto sistemático que sirva, a la vez, como introducción a la historia de esta metodología. Nos ofrece numerosos ejemplos de sistemas de este tipo, pa-

10

JP 009a018-Prol.QXD:0009

6/8/12

15:53

Página 11

PRÓ´LOGO

ra que se pueda apreciar su utilidad en la matemática moderna, y, además, la discusión de diversas cuestiones lógicas y epistemológicas planteadas por este método. Tenemos que agradecer a Cassini haber logrado una exposición de muy alta calidad y de alto valor informativo acerca de la estructura y de las propiedades de los sistemas axiomáticos formales. Su lectura ubicará al lector de un modo claro y completo en el espíritu del estado actual de la ciencia. No cabe duda de que este libro se transformará en poco tiempo en un clásico sobre el tema.

Gregorio Klimovsky Profesor Emérito de la Universidad de Buenos Aires

11

JP 009a018-Prol.QXD:0009

6/8/12

15:53

Página 12

JP 009a018-Prol.QXD:0009

6/8/12

15:53

Página 13

Introducción a la primera edición

ste libro es el producto de una necesidad pedagógica. Hay muy pocos libros específicos dedicados al método axiomático, no sólo en español, sino en cualquier otra lengua, que traten el tema a un nivel relativamente introductorio, pero de manera completa y detallada. Resulta difícil, por consiguiente, encontrar un texto adecuado para un curso dirigido a estudiantes universitarios que se encuentran en los primeros años de su carrera. He escrito este trabajo pensando especialmente en estudiantes de filosofía y de humanidades que asisten a cursos o seminarios de lógica, de epistemología o de filosofía de la ciencia. He presupuesto por parte del potencial lector un conocimiento elemental del lenguaje de la lógica de primer orden y de la teoría intuitiva de conjuntos. No obstante, todos los temas tratados se explican desde el principio, por lo que cualquier persona interesada con alguna aptitud para el pensamiento formal podrá seguir el núcleo de la exposición sin mayores obstáculos. He mantenido de manera deliberada algunas repeticiones con el fin de facilitar la asimilación de ciertas ideas claves. Esta obra no se propone reemplazar a ningún tratado o manual de lógica, sino complementar los libros de texto usuales, que generalmente dedican poco espacio al método axiomático. También puede utilizarse como texto principal o secundario en un curso de filosofía de la matemática. Espero, además, que resulte interesante para todos aquellos que gustan de la matemática y de las ciencias en general. En la presentación de los temas he tratado de lograr un balance entre los elementos históricos, la formulación de sistemas formales lógico-matemáticos y las reflexiones filosóficas o epistemológicas sobre el método axiomático. También he procurado equilibrar el rigor formal con la exposición informal, pero no me propuse alcanzar el grado de precisión propio del lógico o el matemático profesional. He comentado con cierta extensión las propiedades metateóricas de los sistemas formales axiomatizados, pero no he brindado las correspondientes demostraciones, que en general son extensas o difíciles y caen fuera de los objetivos de un libro introductorio como éste. En cambio, he ofrecido numerosos ejemplos de sistemas axiomáticos, casi siempre, aunque no exclusivamente, de primer orden; entre otros, de lógica proposicional y cuantificacional, teoría de grupos y anillos, álgebra de Boole, aritmética de los números naturales, geometría euclídea, teoría de la probabilidad, teoría de conjuntos y muchos otros. También he dado varios ejemplos de demostraciones de teoremas en algunos de estos sistemas. Por último, he traducido numerosos sistemas axiomáticos

E

13

JP 009a018-Prol.QXD:0009

EL

6/8/12

15:53

Página 14

JUEGO DE LOS PRINCIPIOS

que tienen interés histórico como representativos de las diversas etapas en el desarrollo del método axiomático. Al final de cada capítulo he incluido breves comentarios sobre lecturas ulteriores que remiten a la bibliografía final. En dicha bibliografía, que ya es bastante extensa, sólo presento obras generales y colecciones de artículos, pero, salvo excepciones, no incluyo artículos especializados ni fuentes históricas anteriores al siglo XX. Muchos de los libros allí citados tienen un carácter más avanzado que el de esta obra. En ellos pueden encontrarse otras referencias bibliográficas más especializadas. He tratado de tomar en cuenta la bibliografía sobre el tema escrita originalmente en lengua española. Sólo he incluido referencias a traducciones en los casos en los que las he utilizado. Las citas de las fuentes traducidas en el Capítulo 1 y en el Apéndice 2 se indican de manera completa en el lugar correspondiente. Los contenidos del libro son los siguientes. En el Capítulo 1 hago una breve síntesis de la historia del método axiomático, necesariamente esquemática y simplificada, que se complementa con los textos presentados en el Apéndice 2. En el Capítulo 2 analizo la estructura sintáctica de los sistemas axiomáticos formales y presento varios ejemplos de sistemas de primer orden y de demostraciones de teoremas dentro de estos sistemas. En el Capítulo 3 introduzco los elementos esenciales de la semántica de los sistemas formales y los ejemplifico con sistemas axiomáticos de álgebra elemental. El parágrafo final de este capítulo contiene algunas nociones más precisas de teoría de modelos, pero esta exposición dista mucho de ser exhaustiva y no pretende reemplazar a un texto de esta disciplina. En el Capítulo 4 analizo las propiedades metateóricas de los sistemas axiomáticos y enuncio las principales relaciones que existen entre estas propiedades. La presentación de este tema es fundamentalmente informal y no desarrolla cada una de las pruebas metateóricas. En el Capítulo 5 presento cuatro teorías matemáticas axiomatizadas y las analizo con mayor detalle que los ejemplos de los capítulos anteriores. Estas son la teoría de conjuntos, la topología general, la teoría de la probabilidad y la teoría de la medición. Este capítulo tiene un carácter un poco más técnico que los restantes del libro y, en una primera lectura, puede omitirse sin pérdida de continuidad. Finalmente, en el Capítulo 6 ofrezco algunas reflexiones epistemológicas sobre las ventajas y desventajas del método axiomático en las ciencias formales, sobre sus posibles aplicaciones al campo de las ciencias empíricas y sobre los límites del pensamiento axiomático en general. En el Apéndice 1 analizo con algún detalle el tema de las pruebas de consistencia, aunque no brindo ejemplos completos de esta clase de pruebas, que deben buscarse en obras más especializadas. En el Apéndice 2 traduzco las bases axiomáticas de varios sistemas antiguos y modernos que tienen interés histórico. En el Apéndice 3 caracterizo el concepto de función, que es el único concepto matemático presupuesto en el texto. En su

14

JP 009a018-Prol.QXD:0009

11/4/13

13:10

Página 15

INTRODUCCIÓN

A LA PRIMERA EDICIÓN

conjunto, estos capítulos y apéndices ofrecen una síntesis histórica y sistemática sobre el método axiomático. El lector que sólo esté interesado en los aspectos históricos puede leer el Capítulo 1 y el Apéndice 2. El que desee entrar directamente en la axiomática formal moderna puede empezar por el Capítulo 2 y continuar hasta el Apéndice 1. Al escribir este texto he contraído numerosas deudas intelectuales. La mayor es con Gregorio Klimovsky, de quien aprendí mucho sobre el método axiomático, aunque probablemente él no suscribiría todas mis afirmaciones. Estoy especialmente agradecido a Roberto Torretti, que leyó una versión anterior de este libro y me envió por escrito extensos comentarios críticos. Sus observaciones me permitieron no sólo corregir varios errores o imprecisiones conceptuales, sino también mejorar la presentación de diversos temas. Por su parte, el propio Klimovsky leyó la versión final del manuscrito y me ayudó a corregir detalles técnicos y eliminar imprecisiones en algunas definiciones. Por ello también le estoy muy agradecido. El profesor Edward Grant, de la Universidad de Indiana, respondió amablemente a mi pedido de informaciones sobre los textos de Jordano de Nemora que traduzco en el Apéndice 2. Newton C. A. Da Costa y Jesús Mosterín colaboraron involuntariamente con esta obra enviándome, a lo largo de los años, muchos de sus trabajos. También me he beneficiado de conversaciones sostenidas en diferentes momentos de la preparación de este libro con mis colegas de la Universidad de Buenos Aires Javier Legris y Alberto Moretti. Varias estadías en la Universidad de Columbia en Nueva York, entre los años 1999 y 2001, me permitieron el acceso a gran parte de la bibliografía aquí empleada y me proporcionaron el tiempo libre y la tranquilidad necesaria para redactar una buena porción de este trabajo. Desde entonces lo he revisado varias veces agregándole nuevos ejemplos y referencias actualizadas. Durante todo ese tiempo tuve el respaldo decisivo del Consejo Nacional de Investigaciones Científicas y Técnicas de la Argentina, sin el cual difícilmente podría haber concluido este libro. A Eleonora Cresto le debo no sólo la discusión de muchos detalles técnicos, sino también el apoyo necesario para llevar a cabo toda la tarea que demandó esta obra desde sus modestos orígenes como borrador. Finalmente, quiero agradecer a Eduardo Barrio que me alentó a publicarlo. Por supuesto, yo soy el único responsable de los errores que haya en el texto. En todo momento tuve presente que quería escribir el tipo de libro sobre el método axiomático que me hubiera gustado leer y nunca pude encontrar. Espero que los lectores disfruten al leerlo. Alejandro Cassini Buenos Aires, julio de 2007

15

JP 009a018-Prol.QXD:0009

6/8/12

15:53

Página 16

JP 009a018-Prol.QXD:0009

6/8/12

15:53

Página 17

Introducción a la segunda edición

a primera edición de este libro se agotó en poco menos de tres años. Me complace saber que se lo ha utilizado en diversos cursos universitarios para filósofos y humanistas, ya que esa era su finalidad principal. Desde el momento mismo de su aparición fui consciente de que necesitaba revisiones y correcciones, en algunos casos importantes. Tuve, además, la suerte de recibir extensos comentarios, críticas y sugerencias de filósofos, lógicos y matemáticos que me estimularon y me hicieron reflexionar sobre muchos temas. No he podido incorporarlas todas en esta nueva edición, ya que en algunos casos exceden el nivel técnico de la obra o el espacio asignado a cada tema, pero las agradezco sinceramente. La lista de personas que contribuyeron con sus observaciones y discusiones orales o escritas es demasiado larga como para exponerla aquí y, si lo hiciera, seguramente, cometería alguna omisión involuntaria. Quiero, sin embargo, agradecer explícitamente la ayuda que me brindaron Eleonora Cresto, Hernán González, Javier Legris y Diego López Rosende en la revisión del manuscrito y la preparación de las correcciones incorporadas. En esta segunda edición revisada he mantenido la estructura original del libro, sin agregar capítulos nuevos. He corregido todas las erratas detectadas y he reescrito numerosos párrafos de todos los capítulos con el fin tanto de eliminar errores e imprecisiones como de expresar más claramente algunas ideas y conceptos. He actualizado la bibliografía y he agregado al Apéndice 2 un parágrafo nuevo, dedicado a la lógica modal, y he ampliado el parágrafo dedicado a la lógica intuicionista. También he suprimido algunos pasajes que me parecían redundantes o inadecuados a lo largo de toda la obra. Entre los cambios más importantes que presenta esta edición se cuentan los siguientes: he revisado y reescrito, y en algunos casos ampliado considerablemente, los párrafos dedicados a las paradojas de Russell y de Cantor, a los teoremas de Gödel y de Löwenheim y Skolem, a la lógica intuicionista, al axioma de elección de la teoría de conjuntos, a la teoría de la probabilidad y a la extensión y revisión de teorías. Finalmente, he agregado una explicación de los conceptos de consecuencia demostrativa, de decidibilidad formal y de κ-categoricidad, que no aparecían en la primera edición. La obra conserva su carácter introductorio y su enfoque clásico, esto es, privilegia a las teorías de primer orden formuladas en el marco de la lógica cuantificacional clásica. Creo que el conocimiento de este terreno tradicional y ya

L

17

JP 009a018-Prol.QXD:0009

EL

9/4/13

17:23

Página 18

JUEGO DE LOS PRINCIPIOS

bien explorado es una condición indispensable para aventurarse en regiones menos conocidas, como las teorías de segundo orden o las lógicas no clásicas. No se sigue de ello, sin embargo, que considere que la lógica clásica de primer orden sea la única posible, ni tampoco que sea suficiente para la formulación axiomática de todas las teorías matemáticas o empíricas. Seguramente, el conocimiento científico es demasiado amplio y complejo como para expresarlo mediante una sola lógica. Al volver a leer el propio trabajo luego de algún tiempo se siente la tentación de reescribirlo completamente, pero no siempre resulta factible o conveniente hacerlo, pues el resultado no sería una edición revisada, sino un nuevo libro. Por otra parte, la experiencia indica que no es posible satisfacer simultáneamente las expectativas de todos los posibles lectores interesados en un mismo tema general, ya que ellas resultan frecuentemente incompatibles entre sí. En cualquier caso, es seguro que esta edición contiene algunos errores menos que la primera. Los que subsisten son, por supuesto, de mi entera responsabilidad. En abril de 2009, precisamente cuando comenzaba a preparar las primeras revisiones y correcciones para esta edición, se produjo el fallecimiento de Gregorio Klimovsky, quien me hizo el honor de escribir el prólogo para la primera edición de mi libro. A él dedico, entonces, esta segunda edición.

Alejandro Cassini Buenos Aires, junio de 2013

18

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

1

Página 19

Breve historia del método axiomático

1.1 Introducción a historia del método axiomático se extiende desde la antigua Grecia del siglo IV A.C. hasta nuestros días. El relato de este largo proceso, que presenta rupturas significativas pero también continuidades sorprendentes, constituye el tema de todo un libro. Aquí sólo ofreceremos una introducción histórica con el fin de señalar las principales etapas que llevaron a la construcción del método axiomático formal tal como se practica en la actualidad. La exposición es deliberadamente retrospectiva y nos servirá para introducir de manera informal los componentes de un sistema axiomático, que luego se estudian con más detalle en los capítulos posteriores.

L

1.2 La axiomática antigua Aristóteles Las ideas esenciales del método axiomático surgieron en el seno de la civilización griega, asociadas a los problemas suscitados por el concepto de demostración, especialmente en las ciencias matemáticas. Desde los tiempos de los antiguos griegos se consideró que el conocimiento demostrado era el saber más seguro. Pero, ¿qué es una demostración? Esta es una pregunta para la cual todavía no tenemos una respuesta unánime y definitiva. Los griegos tuvieron el mérito de planteársela por primera vez y de sugerir una respuesta que reinó en el pensamiento occidental por más de dos milenios. La demostración de un enunciado o proposición consiste en deducirlo de otros enunciados cuya verdad se conoce previamente. Dado que las inferencias deductivas preservan la verdad de las premisas y la transmiten a la conclusión, las proposiciones deducidas de proposiciones verdaderas, si han sido correctamente deducidas, necesariamente resultarán también verdaderas. Esta idea de demostración tuvo su origen en la matemática griega, especialmente en la práctica de las pruebas geométricas, pero fue Aristóteles, en el siglo IV A.C., el primero en expresarla claramente y presentarla de un modo sistemático. Aristóteles descubrió, además, el hecho fundamental de que las inferencias deductivas correctas preservan la verdad de las

19

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 20

HISTORIA DEL MÉTODO AXIOMÁ´TICO

premisas en razón de la mera forma o estructura de la inferencia. Con ello inició el estudio de la lógica formal. El primer problema que plantea la idea griega de demostración es, sin duda, el de distinguir entre las inferencias deductivas correctas e incorrectas. Platón y su escuela se ocuparon de analizar diferentes tipos de argumentos y clasificarlos según su corrección o incorrección. Pero sólo Aristóteles construyó la primera teoría general de las inferencias formalmente válidas. En su obra Primeros analíticos (aproximadamente 340 A.C.) estudió detenidamente una clase de inferencias deductivas, que hoy llamamos silogismos, y consiguió determinar claramente la forma de las inferencias que preservaban la verdad de las premisas. Además, mostró cuáles eran las formas inválidas de silogismos mediante el método de los contraejemplos. Este consistía en probar que una forma de silogismo era inválida construyendo un ejemplo de esa forma que tuviera premisas verdaderas y conclusión falsa. De esta manera, se descartan una a una las formas de silogismo que no garantizan la transmisión de la verdad de las premisas a la conclusión. Las formas aceptadas son aquellas que no tienen contraejemplos, es decir, aquellas para las cuales no es posible construir un razonamiento que tenga premisas verdaderas y conclusión falsa. ¿Pero cómo podemos saber que esas reglas de inferencia realmente no tienen contraejemplos o no los tendrán en el futuro? Aristóteles nada dice al respecto. Y, en sentido estricto, todavía no lo sabemos, ya que el problema de la justificación de las reglas de inferencia es una cuestión abierta en nuestros días. La segunda dificultad de la idea griega de demostración aparece cuando se pretende que todo conocimiento sea demostrado. En su obra Segundos analíticos (aproximadamente 330 A.C.) Aristóteles se ocupó con todo detalle de este problema, que perturbaba a sus antecesores y contemporáneos. Como vimos, la demostración de un enunciado consiste en deducirlo de otros enunciados previamente conocidos como verdaderos, que operan como premisas de la demostración. Sin embargo, también se puede pedir una demostración de esas premisas, para lo cual será necesario deducirlas de otros enunciados. Es evidente, pensaba Aristóteles, que este procedimiento no puede seguir indefinidamente, pues nos conduce a una regresión al infinito en las demostraciones, formándose una cadena deductiva que no tiene comienzo. Esta situación le pareció inaceptable porque dejaba a toda la secuencia de demostraciones sin un fundamento último y seguro. Pero hay otras posibilidades. Una de ellas consiste en demostrar todos los enunciados deduciéndolos de sí mismos. Aristóteles la llama demostración recíproca y la descarta rápidamente porque la considera trivial. Por cierto, no es objetable desde un punto de vista puramente lógico (por el contrario, actualmente consideramos que el hecho de que todo enunciado se deduce de sí mismo es una propiedad esencial de la relación de consecuencia lógica). Pero sí es epistemológicamente trivial, porque una demostración exige

20

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 21

LA

AXIOMÁ´TICA ANTIGUA:

ARISTÓ´ TELES

partir de premisas conocidas como verdaderas, de modo que para probar deductivamente la verdad de cada enunciado ya deberíamos conocerla de antemano. La tercera posibilidad consiste en aceptar demostraciones circulares (pero no recíprocas), donde las premisas de ciertas demostraciones aparecen como conclusiones de otras y viceversa. Se forman así cadenas deductivas finitas pero cerradas. Aristóteles considera que esto implica un círculo vicioso inadmisible, que nuevamente dejaría sin fundamento, y por tanto sin una razón, a toda la secuencia de demostraciones. La última posibilidad que Aristóteles analiza es la que dará origen a la idea de pensamiento axiomático. Aristóteles pensó que era posible evitar el escepticismo respecto de la demostración aceptando que no todo conocimiento es demostrativo. Toda secuencia de demostraciones debe ser finita y terminar en algún momento en un conjunto de enunciados fundamentales que no se conocen por medio de demostración. Aristóteles los llamó principios, o mejor primeros principios, y los consideró no meramente como enunciados no demostrados, sino en sí mismos indemostrables. Los concibió como verdades necesarias que no pueden ser demostradas. Nunca afirmó explícitamente que fueran verdades evidentes, pero ya los comentadores griegos tardíos lo interpretaron de esa manera, y la idea de que los principios son evidentes se convirtió en un lugar común del aristotelismo medieval y así pasó a la Modernidad. Aristóteles no resolvió claramente el problema de cómo se conocen los principios indemostrables, pero dejó indicaciones muy escuetas de que se trata de un proceso en el que intervienen tanto la generalización inductiva a partir de casos de percepción como la intuición intelectual de los conceptos universales. Los principios son verdades que naturalmente se conocen por sí mismas y, como tales, son el objeto de una forma de conocimiento superior a la ciencia, que Aristóteles llamó nous o intuición intelectual. A partir de estas ideas se forjó la concepción tradicional según la cual los principios de un sistema axiomático son verdades autoevidentes. Se puede considerar a Aristóteles como el padre fundador del método axiomático porque fue él quien presentó por primera vez la idea de sistematización deductiva de una teoría tomando como punto de partida un conjunto reducido de principios, de los cuales se infieren los restantes enunciados de la teoría. Los Segundos analíticos contienen un análisis verdaderamente detallado, aunque no siempre claro, del concepto aristotélico de demostración científica y de las condiciones requeridas para la organización deductiva de una teoría. Aristóteles no llamó axiomas a todos los principios de una teoría, sino únicamente a aquellos que son comunes a todas las ciencias, como los principios lógicos de no contradicción y de tercero excluido, o el principio que afirma que “si de iguales se sustraen iguales, los restos son iguales” (Véase el Apéndice 2.1). A los principios específicos de cada ciencia particular los denominó principios propios, y los concibió como definiciones reales o esenciales acerca de las entidades que

21

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 22

HISTORIA DEL MÉTODO AXIOMÁ´TICO

cada ciencia toma como objeto de estudio. Cada ciencia particular se refiere, en efecto, a un determinado género de entidades reales. Actualmente no hacemos esta distinción y llamamos genéricamente axiomas a todos los enunciados que se aceptan sin demostración y constituyen el punto de partida de las demostraciones en una teoría determinada. Una teoría científica, según Aristóteles, es una estructura ordenada deductivamente formada por los principios o verdades indemostrables y por todos los enunciados deducidos válidamente de tales principios. Esto último supone que se han codificado las reglas de inferencia que permiten realizar deducciones válidas a partir de los principios. Aristóteles creó para ello su teoría del silogismo, que constituye un fragmento pequeño, pero perfectamente válido, de la parte de la lógica formal básica que hoy denominamos lógica cuantificacional. Consecuentemente, exigió que todas las demostraciones científicas tuvieran la forma lógica de un silogismo, más precisamente de uno de la primera figura, el llamado Barbara, al que consideraba el silogismo más perfecto. Desde el punto de vista actual, esta idea constituye una seria limitación, ya que la teoría silogística resulta insuficiente como herramienta lógica para construir un sistema axiomático. Dejando de lado este defecto, podemos advertir que el modelo ideal de ciencia que Aristóteles propone contiene tres elementos esenciales del método axiomático, que hoy denominamos, respectivamente, axiomas, teoremas, y reglas de transformación. Los axiomas corresponden a los primeros principios aristotélicos, que él concibió como enunciados necesariamente verdaderos y en sí mismos indemostrables. Los teoremas, por su parte, corresponden a los enunciados demostrados mediante deducciones que toman a los principios como premisas. Finalmente, la teoría del silogismo proporciona las reglas de transformación, es decir, las reglas de inferencia que permiten deducir los teoremas de los axiomas. Como veremos más adelante, hay otros elementos esenciales de un sistema axiomático que no aparecen en el modelo aristotélico de ciencia, por lo que no puede decirse que Aristóteles haya presentado de modo completo una teoría del método axiomático. No obstante, Aristóteles también tuvo la intuición, aunque no la formuló precisamente, de otra idea fundamental del pensamiento axiomático. Este es el concepto de clausura deductiva de una teoría, según el cual, en una teoría axiomática todos los enunciados deducibles de los axiomas pertenecen a la teoría. Adviértase, sin embargo, que si definimos a una teoría axiomática como el conjunto de todos los enunciados deducibles de los axiomas, esto excluye a los propios axiomas de la teoría dentro del modelo aristotélico. La razón de ello se encuentra en la teoría del silogismo, ya que silogísticamente no es posible deducir un enunciado de sí mismo (en un silogismo ningún enunciado puede aparecer a la vez como premisa y como conclusión). Por consiguiente, ningún axioma se deduce de sí mismo. Esta es una de las limitaciones del

22

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 23

LA

AXIOMÁ´TICA ANTIGUA:

EUCLIDES

silogismo como herramienta lógica para un sistema deductivo. Para ser más precisos, debemos caracterizar a una ciencia aristotélica como la unión de dos conjuntos de enunciados: el de los principios y el de todas las consecuencias lógicas que mediante un silogismo en Barbara se obtienen de los principios.

Euclides Aristóteles representa el comienzo del pensamiento axiomático porque proporciona una teoría de la ciencia que contiene algunos de los elementos esenciales del método axiomático. Con todo, él mismo no construyó ningún sistema axiomático, ni aplicó consecuentemente su teoría de la ciencia en sus investigaciones científicas concretas, por ejemplo, en sus lecciones de física o en sus tratados biológicos. La primera realización del método axiomático corresponde a Euclides, quien en su obra Elementos (aproximadamente 300 A.C.) axiomatizó la geometría de manera más o menos completa y acabada. Esta fue la primera teoría axiomatizada y durante muchos siglos el único ejemplo de una axiomatización verdaderamente satisfactoria. La relación entre los modelos deductivos de Aristóteles y Euclides ha sido muy discutida. Existen al respecto dos hipótesis interpretativas tradicionales que ya no tienen consenso entre los especialistas. La primera es la que afirma que la obra de Euclides es una aplicación de la teoría aristotélica de la ciencia. La segunda sostiene que, a la inversa, la teoría aristotélica está inspirada por la práctica de los geómetras, de la cual la obra de Euclides sería una síntesis. Ambas hipótesis presuponen que las teorías del método axiomático de Aristóteles y Euclides son esencialmente semejantes, pero los estudiosos del tema han revelado diferencias importantes, que aquí sólo podemos indicar someramente. En suma, ninguna de estas dos hipótesis resulta actualmente sostenible y sólo pueden aceptarse ambas como parcialmente verdaderas. Es muy probable que no exista una relación simple y directa entre la teoría aristotélica y la realización euclídea, pero carecemos de las fuentes históricas necesarias como para precisarla. En la obra de Euclides encontramos otro componente esencial de un sistema axiomático, las definiciones nominales de los términos técnicos del sistema, que no estaba explícito en el modelo aristotélico. Euclides comienza sus Elementos introduciendo numerosas definiciones de diversos términos técnicos de la geometría, tales como los de “punto”, “superficie”, “recta”, “figura”, “diámetro” y muchos otros. Reconoce de esta manera que toda teoría científica, y en particular un sistema axiomático, tiene un vocabulario específico que debe ser cuidadosamente explicitado. Nuevamente se presenta aquí una dificultad, ya que si intentamos definir todos los términos del lenguaje de una teoría nos veríamos envueltos, como en el caso de la demostración, en un círculo lógico, o bien en la necesidad de introducir cada vez más términos llegando así a una regresión

23

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 24

HISTORIA DEL MÉTODO AXIOMÁ´TICO

al infinito en las definiciones. La solución de este problema consiste en distinguir dos clases de términos específicos del vocabulario de una teoría axiomática: los términos primitivos o no definidos, que se aceptan sin definición ni explicación aclaratoria alguna, y los términos definidos, que se definen explícitamente por medio de los términos primitivos (empleando además ciertos signos lógicos y de puntuación). Es fácil advertir la analogía que existe entre axiomas y teoremas por un lado, y términos primitivos y definidos por el otro. Aristóteles y Euclides tuvieron clara conciencia de la primera de estas distinciones entre dos tipos de enunciados de la teoría, pero respecto de los términos se expresaron de manera más confusa. En particular, no reconocieron la necesidad de brindar una lista exhaustiva de términos primitivos de cada teoría, algo que es una exigencia indispensable del método axiomático. En los Elementos, Euclides ofrece 132 definiciones de términos geométricos, pero no proporciona una enumeración siquiera parcial de los términos primitivos. Probablemente tomara como no definidos a ciertos términos de su propio lenguaje natural, el griego, cuyo significado considerara suficientemente claro para todo lector de su obra. Ejemplos de sus definiciones son las siguientes: 1. “Punto es lo que no tiene partes”; 2. “Línea es una longitud sin anchura”; y 5. “Superficie es lo que sólo tiene longitud y anchura” (véase el Apéndice 2.2 para una lista completa). Para construir el lenguaje de un sistema axiomático formalizado no basta con especificar los términos que componen el vocabulario, sino que es necesario precisar cómo se han de formar los enunciados que se considerarán bien construidos en el sistema. Este papel lo desempeñan las reglas de formación, que nos indican la manera correcta de construir enunciados con los términos del vocabulario del sistema. Ni Aristóteles ni Euclides incluyeron en sus obras este componente de los sistemas axiomáticos. La razón de esta ausencia es fácilmente explicable. Las teorías axiomáticas de los griegos no eran sistemas formalizados, es decir, no se expresaban en un lenguaje artificial desprovisto de significado y estrictamente regimentado. Empleaban, en cambio, el lenguaje natural que hablaban sus autores, complementado con algunos términos técnicos definidos. El papel de las reglas de formación lo desempeñaban, de manera implícita, las reglas gramaticales de la lengua griega, más precisamente, las reglas sintácticas que indicaban cómo formar oraciones combinando las palabras correctamente. Las reglas de formación de un sistema axiomático formalizado son, en efecto, semejantes a las reglas sintácticas de una lengua natural. La formalización no es un requisito esencial de un sistema axiomático en general. Aunque a veces sea conveniente, no es siempre necesario formular el sistema en un lenguaje artificial regimentado. La geometría de Euclides es a la vez un ejemplo de un sistema axiomático no formalizado y no abstracto o formal, sino concreto o material. Más adelante, cuando estudiemos el surgimiento de la axiomática formal contemporánea, aclararemos estas distinciones.

24

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 25

LA

AXIOMÁ´TICA ANTIGUA:

EUCLIDES

Euclides, a diferencia de Aristóteles, no hizo explícitas las reglas de transformación o de inferencia que podían emplearse en su sistema para realizar las demostraciones geométricas. No utilizó el silogismo aristotélico, pero sus demostraciones muestran una variedad muy amplia de procedimientos inferenciales que presuponen reglas de tipo proposicional. El método de prueba más famoso de Euclides, quien seguramente lo tomó de la práctica de los geómetras de varias generaciones anteriores, es la demostración por el absurdo, que consiste en partir de la negación del enunciado que se quiere probar, deducir de allí una contradicción, y concluir, entonces, con la afirmación del enunciado originalmente negado. La regla de reducción al absurdo es la que permite esta clase de razonamiento: ¬ χ → (ψ & ¬ ψ) / χ (donde χ y ψ son dos proposiciones cualesquiera y el símbolo / indica la conclusión). Aquí encontramos una diferencia importante con las reglas de inferencia aceptadas por Aristóteles, quien sostuvo enfáticamente que toda demostración debía ser afirmativa y directa, y rechazó las pruebas indirectas y negativas como las que emplean la reducción al absurdo. Euclides incluyó en su sistema tres clases de principios: las definiciones, los postulados y los axiomas. La distinción entre postulado y axioma se corresponde, de manera bastante imperfecta, con la distinción aristotélica entre principios propios y principios comunes o axiomas. El criterio de la distinción euclídea es poco claro y ha sido muy discutido. Los postulados son enunciados que se refieren a la construcción de rectas y círculos mediante regla y compás con el objetivo aparente de garantizar la existencia de los correspondientes objetos geométricos. Euclides enuncia cinco postulados, de los cuales citaremos el primero: “Trazar una línea recta desde cualquier punto hasta cualquier punto”, y el célebre quinto, o postulado de las paralelas: “Si una recta que cae sobre otras dos rectas hace a los ángulos interiores de un mismo lado menores que dos rectos, entonces, si las dos rectas se prolongan indefinidamente, se encuentran del lado en el que los ángulos son menores que dos rectos”. El cuarto postulado es diferente de los restantes porque no se refiere a construcciones (véase el Apéndice 2.2). Los axiomas, por su parte, son enunciados muy generales aplicables a diversas disciplinas matemáticas, no sólo a la geometría. Euclides no lista todos sus axiomas al comienzo de su obra, por lo que el número total de ellos ha sido discutido. Hoy se acepta generalmente que dichos axiomas son seis, de los cuales citaremos los cinco primeros, que aparecen en la lista con que empiezan los Elementos: 1. “Las cosas que son iguales a una misma cosa son iguales entre sí”; 2. “Si iguales se añaden a iguales, los totales son iguales”; 3. “Si iguales se sustraen de iguales, los restos son iguales”; 4. “Las cosas que coinciden entre sí son iguales entre sí”; 5. “El todo es mayor que la parte”. Los Elementos contienen 465 demostraciones. Euclides divide a las proposiciones demostradas en dos clases: problemas y teoremas. Ambos se demuestran a partir de los primeros principios, pero los problemas se refieren a la construcción

25

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 26

HISTORIA DEL MÉTODO AXIOMÁ´TICO

de figuras geométricas, mientras que los teoremas establecen las propiedades esenciales de dichas figuras. Por esta razón, los problemas se deducen fundamentalmente de los postulados, mientras que los teoremas se deducen de las definiciones y los axiomas. En la axiomática contemporánea, no se ha mantenido la distinción euclídea entre postulados y axiomas, ni entre problemas y teoremas. Actualmente llamamos simplemente axiomas a los enunciados que se aceptan sin demostración y teoremas a los enunciados demostrados tomando a los axiomas como premisas. Euclides pensó, al igual que Aristóteles, que los axiomas y postulados eran enunciados verdaderos que no necesitaban demostración. La tradición matemática griega también atribuyó el carácter de evidentes a los principios de la geometría euclídea, e inició un largo debate acerca del quinto postulado, cuestionado precisamente por su falta de evidencia. Los restantes principios euclídeos se consideraron como enunciados necesarios que proporcionaban verdades evidentes acerca del espacio físico real. Los teoremas, por su parte, representaban una descripción de las propiedades necesarias del espacio físico. La geometría euclídea fue durante más de dos milenios un ejemplo de conocimiento necesario acerca del mundo real. La creencia de que tal conocimiento era posible se apoyó en la obra de Euclides e influyó decisivamente en los filósofos racionalistas de la Modernidad. El tratado de Euclides fue de hecho la más importante realización concreta del método axiomático legada por la Antigüedad. A la vez, fue la teoría científica más exacta y rigurosa hasta el siglo XIX, constituyendo un canon pedagógico empleado hasta principios del siglo XX. La axiomática euclídea tiene, sin embargo, algunos defectos importantes cuando se la analiza desde el punto de vista actual. En muchos aspectos es incompleta y sus demostraciones no son suficientemente rigurosas. Euclides no ofrece términos primitivos en sentido estricto, sino que intenta definir todos los términos geométricos fundamentales, como “punto”, “recta” y “plano”. Los comentadores de los Elementos han advertido que no se las puede tomar como definiciones precisas, porque como tales serían defectuosas, sino como elucidaciones parciales del significado de estos términos. Por otra parte, hay definiciones explícitas que se enuncian al comienzo de la obra, pero luego no se usan en ninguna demostración. A la inversa, hay demostraciones que emplean como premisas ciertos enunciados no demostrados que no se encuentran en la lista de principios, lo cual constituye un defecto más grave. Finalmente, no hay una caracterización de qué es una demostración ni de cómo reconocerla. Si se suma a ello el hecho de que Euclides no hace explícitas las reglas de inferencia de su sistema, se obtiene la consecuencia de que las pruebas euclídeas resultan casi siempre bastante informales, mucho más que lo admisible en la matemática actual. Cualesquiera sean los defectos de la axiomática antigua, no cabe duda de que Aristóteles y Euclides deben considerarse como los fundadores del método

26

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 27

LA

AXIOMÁ´TICA ANTIGUA: DE

ARISTARCO

A

PROCLO

axiomático. Ambos reconocieron la característica esencial de este método que consiste en postular ciertos enunciados que se aceptan sin demostración y deducir de ellos los restantes enunciados que componen una teoría. Será necesario que pasen muchos siglos para que las realizaciones de los griegos sean perfeccionadas y extendidas a otros dominios.

De Aristarco a Proclo El método axiomático tuvo su mayor logro en el campo de la geometría griega, y la identificación entre ambos llegó hasta tal punto que desde la época helenística se llamó estilo o modo geométrico a la presentación axiomática de cualquier teoría. El método axiomático surgió entre los griegos como una forma de obtener certeza en el conocimiento. Esencialmente fue el resultado de un esfuerzo por encontrar una forma de argumentación rigurosa que pudiera oponerse al discurso meramente persuasivo de la retórica y de la sofística. Visto de esta manera, el método axiomático resulta característico del conocimiento científico en general y lo distingue de otras formas de conocimiento. Que los griegos lo entendieron de esta manera lo prueba el hecho de que intentaron extender la aplicación de este método más allá del campo de la geometría. Ya Aristóteles, por cierto, lo había considerado como el método apropiado para toda ciencia empírica, aunque de hecho no construyera ningún sistema axiomático concreto en ninguna ciencia en particular. Euclides, en cambio, es autor de un breve tratado de óptica escrito al modo axiomático. La Óptica de Euclides emplea 7 postulados y prueba 58 proposiciones. Los postulados aparecen bajo el título de “definiciones”, pero es evidente que no son definiciones. No aparecen listados axiomas ni auténticas definiciones. Se trata, en suma, de una obra mucho menos lograda que los Elementos, pero notable por el hecho de aplicar el método axiomático a cuestiones de óptica que exceden el campo de la pura geometría. Aristarco de Samos nos es conocido principalmente por haber concebido un sistema planetario heliocéntrico precursor del de Copérnico. Sin embargo, la única obra de Aristarco que se ha conservado, el breve tratado Sobre los tamaños y las distancias del Sol y la Luna (escrito probablemente en el primer tercio del siglo III A.C.), consiste en una aplicación del método axiomático a la astronomía. Ello no es inesperado dado que en la antigüedad la astronomía se concebía como una parte de la matemática. Aristarco se propuso demostrar rigurosamente algunas proposiciones acerca de las distancias relativas del Sol, la Luna y la Tierra, tales como, por ejemplo, la siguiente: “La distancia del Sol a la Tierra es mayor que 18 veces, pero menor que 20 veces, la distancia de la Luna ”. Para ello apeló al estilo geométrico enunciando 6 axiomas, a los que llama hipótesis, y demostrando 18 teoremas a partir de tales axiomas

27

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 28

HISTORIA DEL MÉTODO AXIOMÁ´TICO

(véase el Apéndice 2.3). Los resultados de Aristarco son groseramente erróneos desde nuestra perspectiva actual (por ejemplo, la distancia entre la Tierra y el Sol es, según nuestras mediciones, aproximadamente 390 veces mayor que la distancia entre la Tierra y la Luna). Sin embargo, todavía nos resulta sorprendente la audacia de su intención de emplear el método axiomático en un dominio en el que todavía hoy no hemos conseguido aplicarlo. Después de Euclides los mayores aportes al método axiomático los realizó Arquímedes. Arquímedes nació y murió en Siracusa en el siglo II A.C., pero estudió matemáticas en Alejandría, donde evidentemente se formó en la tradición euclídea. En la Antigüedad, y hasta los tiempos modernos, las ciencias matemáticas incluían a la física y a la astronomía, y estos temas se estudiaban conjuntamente. Exceptuando la astronomía, Arquímedes realizó contribuciones importantes en todas las ramas de la matemática de su tiempo. En una serie de tratados, como Sobre la esfera y el cilindro, Sobre la medida del círculo, o Sobre conoides y esferoides, demostró una amplia variedad de teoremas acerca de las superficies y volúmenes de figuras y cuerpos limitados por líneas y superficies curvas. Entre otros, el teorema según el cual “La superficie de una esfera es igual a cuatro veces la del círculo máximo en ella” (que es equivalente a la formulación actual como S = 4 π r2). Hasta donde sabemos, Arquímedes fue el primero en aplicar el método axiomático, incluyendo los métodos geométricos de demostración, a la estática y a la hidrostática. Con todo, es posible que haya tenido anónimos predecesores en el estudio de la mecánica, cuyas obras no nos han llegado. Las obras de Arquímedes Sobre el equilibrio de los planos y Sobre los cuerpos flotantes intentan una presentación axiomática de estas partes de la mecánica general (véase el Apéndice 2.4). El rigor alcanzado en las demostraciones es todavía imperfecto y los axiomas enunciados no resultan suficientes para probar todos los pretendidos teoremas. No obstante, el simple hecho de aplicar la demostración geométrica a problemas de mecánica hace de Arquímedes un precursor de la física matemática moderna. La extensión del método axiomático fuera del dominio de las ciencias matemáticas fue siempre un ideal regulativo del pensamiento griego. En el siglo II D.C., el médico Galeno, que también fue un lógico consumado, recomendó reiteradamente la aplicación del método axiomático (al que llama simplemente “pruebas de estilo geométrico”) a la anatomía y a la medicina. En un opúsculo autobiográfico llamado Mis propios libros, expresó esta idea de una manera que revela cuál era en ese momento el campo de aplicación usual de la axiomática: “He observado la verdad indiscutible que se manifiesta (y no sólo a mí mismo) en las predicciones de los eclipses, en la construcción de relojes de agua y en toda clase de cálculos realizados en el contexto de la arquitectura, y he decidido que este tipo geométrico de prueba es el mejor que ha de emplearse”.

28

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 29

LA

AXIOMÁ´TICA MODERNA: APORTES MEDIEVALES

Galeno se explayó largamente en su obra Las afecciones y errores del alma acerca de cómo aplicar el método axiomático a cuestiones empíricas, pero, hasta donde sabemos, nadie consiguió axiomatizar una teoría médica. El prestigio del método axiomático y su carácter de modelo para la exposición rigurosa de todo conocimiento científico se mantuvieron hasta el final de la Antigüedad. Todavía Proclo, en el siglo V D.C., insiste en su comentario al Timeo de Platón sobre la necesidad de emplear pruebas de estilo geométrico en el dominio de la cosmología, aunque, nuevamente, no sabemos que se haya axiomatizado nunca una teoría cosmológica.

1.3 La axiomática moderna Aportes medievales Durante la Edad Media, a partir del siglo XII, se inicia el proceso de traducción y asimilación en Occidente de las grandes obras de la ciencia griega. Pero el papel desempeñado por los medievales no se limita al comentario de los textos de Aristóteles, Euclides y Arquímedes, sino que incluye desarrollos originales, entre ellos, nuevas aplicaciones del método axiomático a la aritmética y la mecánica. Las obras de Aristóteles, Euclides y Arquímedes fueron bien conocidas y comentadas por los árabes, que aportaron, entre otras cosas, nuevos intentos de demostración del quinto postulado euclídeo. En Occidente su difusión fue más tardía y dependió de un lento proceso de traducción al latín, que se inicia en el siglo XII con las obras de Aristóteles. No podemos dar aquí un relato detallado del complejo itinerario de los textos griegos en el mundo medieval. Señalemos simplemente algunos hitos en la transmisión de los tratados lógicos de Aristóteles, los Elementos de Euclides y las obras de Arquímedes. La primera traducción latina completa de las obras lógicas de Aristóteles la realizó Boecio a principios del siglo VI D.C., pero no se conservó en el Occidente medieval. A comienzos del siglo XII comienzan a traducirse nuevamente. Entre 1130 y 1140 un grupo anónimo de traductores italianos vierte del griego los Segundos analíticos; y alrededor de 1150 se traducen los Primeros analíticos. Unos años después, Gerardo de Cremona traduce del árabe numerosas obras, entre ellas los Segundos analíticos. Pero la traducción de mayor importancia es la Guillermo de Moerbecke, quien, desde la década de 1240 aproximadamente, virtió del griego casi toda la obra de Aristóteles, incluyendo todos los tratados lógicos. Esta traducción fue la que utilizaron Tomás de Aquino y muchos otros escolásticos como base para sus detallados comentarios. Hacia fines del siglo XIII todas las obras de Aristóteles estaban disponibles en latín, junto con numerosas copias, glosas y comentarios. Cuando se publicó en Venecia la primera

29

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 30

HISTORIA DEL MÉTODO AXIOMÁ´TICO

edición impresa del texto griego, la célebre edición Aldina de 1495-1498, el pensamiento de Aristóteles había sido asimilado desde mucho tiempo atrás, y el aristotelismo medieval ya estaba en decadencia. La primera traducción latina de los Elementos se atribuye a Boecio. Era una traducción parcial realizada probablemente a comienzos del siglo VI D.C., pero no se ha conservado. Las primeras traducciones medievales de los Elementos proceden del árabe y no son del todo precisas. Tales son la de Adelardo de Bath en 1142, que tuvo escasa difusión, la más conocida de Gerardo de Cremona hacia 1160 y la más cuidada de Campano de Novara, de alrededor de 1290. Esta última tuvo buena difusión y fue también la primera versión impresa en 1482. En 1505 B. Zamberti publicó una nueva traducción latina hecha sobre el texto griego. La primera edición impresa del texto griego la publicó S. Grynaceus en Basilea en el año 1533. En 1572 F. Commandino realizó la mejor traducción directa del griego de los Elementos. En 1574 el matemático alemán C. Clavius publicó una nueva y autorizada traducción (más bien una paráfrasis del texto) que resultó sumamente exitosa y contribuyó a difundir los estudios de la geometría axiomática. Hacia esa época, los Elementos ya formaban parte de la cultura europea. El texto griego de las obras de Arquímedes se conservó en la cultura bizantina, mientras que parte de su obra se tradujo al árabe. Las primeras traducciones latinas del siglo XII también proceden del árabe. La primera se atribuye a Platón de Tívoli y se considera poco acertada. Mucho más importante fue la traducción de Gerardo de Cremona, después de 1150, de algunas obras matemáticas, que tuvo amplia difusión. En 1269 Guillermo de Moerbecke, tal vez el mayor traductor de la Edad Media, tradujo del griego, utilizando los manuscritos bizantinos, todas las obras conservadas de Arquímedes. La traducción latina de Gerardo alcanzó una sorprendente difusión, pese a la crónica escasez de manuscritos. La primera versión impresa de esta traducción apareció recién en 1503, y luego siguieron otras ediciones, entre ellas, la de N. Tartaglia en 1543. El aporte medieval al método axiomático no se reduce, sin embargo, al mero comentario de los clásicos de la ciencia griega. Podemos mencionar al menos tres desarrollos originales de los matemáticos de la Edad Media. L. Fibonacci (o Leonardo de Pisa) es bien conocido por sus contribuciones a la teoría de los números, entre ellas, el descubrimiento de la famosa secuencia de Fibonacci. En 1220 Leonardo escribió un tratado axiomático titulado La práctica de la geometría, en el que expone muchos de los resultados ya alcanzados por Euclides. Ofrece, no obstante, algunas demostraciones novedosas de teoremas ya conocidos. Además, extiende la clasificación euclídea de los números irracionales, mostrando que era incompleta. También prueba resultados de Arquímedes, como la determinación del número π. En todas sus demostraciones exhibe un notable rigor deductivo y elegancia.

30

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 31

LA

AXIOMÁ´TICA MODERNA: LA REVOLUCIÓ´N CIENTÍ´FICA

Hacia mediados del siglo XIII, Jordano de Nemora (Jordanus Nemorarius), de quien tenemos pocos datos biográficos, realiza el mayor aporte medieval a la axiomática. En su obra Sobre la teoría del peso utiliza 7 postulados para demostrar 45 teoremas (véase el Apéndice 2.5). Por ejemplo, su primer teorema afirma que “Entre cuerpos pesados cualesquiera, las fuerzas son proporcionales a los pesos”; mientras que el quinto sostiene que “Si los brazos de una balanza son desiguales, entonces, si pesos iguales se colocan en sus extremos, la balanza descenderá del lado del brazo más largo”. Esta obra representa un indudable avance sobre la estática de Arquímedes, y entre otras cosas, introduce nuevos dispositivos experimentales para el estudio del equilibrio de los cuerpos. Pero su obra más importante es la Aritmética, escrita alrededor de 1250. Es esta la primera obra en formato axiomático dedicada íntegramente a la aritmética, y sin duda, la obra cumbre de la matemática medieval (véase el Apéndice 2.6). El modelo de sus demostraciones, que frecuentemente usan figuras geométricas, lo proporcionan los libros aritméticos de los Elementos. Jordano utiliza 14 definiciones, 3 postulados y 8 axiomas, y mediante ellos demuestra más de 400 teoremas. Ejemplo de las proposiciones demostradas son el sexto teorema, que dice: “Si la unidad se multiplica por cualquier número, o el mismo número se multiplica por la unidad, se produce a sí mismo” (es decir, a x 1 = 1 x a = a); y el octavo teorema, que dice: “Si se hace una multiplicación alternada de dos números, el mismo número resulta en cada caso” (o sea, a x b = b x a = c). Este tratado axiomático fue sumamente exitoso y se lo adoptó durante mucho tiempo como texto para la enseñanza de la aritmética. Su lenguaje, sin embargo, es bastante oscuro y no se ha conservado en la matemática moderna. Por último, mencionemos la obra de T. Bradwardine, que utilizó el método axiomático no sólo en la matemática y la física, sino también en la teología. En su Tratado sobre las proporciones de las velocidades en los movimientos, publicado en 1328, el método axiomático se aplica por primera vez a la cinemática, el estudio de los cuerpos en movimiento, cosa que, hasta donde sabemos, no había sido realizada en la antigüedad. Este tratado tendrá profunda influencia sobre los mecánicos italianos, influencia que puede detectarse hasta en Galileo. En el Tratado sobre el continuo, escrito hacia 1335, Bradwardine utilizó 24 definiciones y 10 postulados para demostrar 151 teoremas acerca de las magnitudes continuas en matemática y física. Y en su obra teológica, Sobre la causa de Dios, hacia 1340, intentó incluso dar un formato axiomático a las pruebas de la existencia y propiedades de Dios, camino que después seguirían Descartes y Spinoza.

La revolución científica Durante la llamada “revolución científica” el método axiomático se extendió de manera exitosa mucho más allá de las ciencias matemáticas, concretamente,

31

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 32

HISTORIA DEL MÉTODO AXIOMÁ´TICO

a la física en su conjunto y a la filosofía. En todos los casos, como hemos visto, había importantes antecedentes antiguos y medievales, pero en esta época el formato axiomático pasó a ser un ideal para todas las ciencias. Incluso se concibió por primera vez el sueño de un único sistema axiomático unificado que abarcara todo el conocimiento, una idea que nunca se había presentado en el pensamiento griego. La aplicación del método axiomático a las teorías físicas resurge con los mecánicos italianos del siglo XVI, que estudiaron y comentaron las obras de Arquímedes y de Jordano de Nemora. De esta manera se establece una tradición más o menos discontinua, pero nunca extinta, que conecta a autores antiguos medievales y modernos. A los problemas tradicionales de la estática, los mecánicos italianos agregaron otros derivados de la ingeniería y las artes militares. N. Tartaglia presentó en su Ciencia nueva, publicada en Venecia en 1537, un tratamiento axiomático de la mecánica que empleaba una amplia variedad de definiciones, postulados y axiomas. Por ejemplo, sólo en el primer libro de su obra, Tartaglia usó 15 definiciones, 5 postulados y 4 axiomas para demostrar solamente 6 proposiciones o teoremas. Sus demostraciones no sólo apelan a esta base axiomática, sino que frecuentemente recurren a resultados ya establecidos por Euclides. Consecuentemente, el sistema de Tartaglia no resulta demasiado económico. Guidobaldo dal Monte en su Libro de las mecánicas, publicado en Pesaro en 1577, intentó una axiomatización mucho más simple, basada en 1 definición, 3 postulados y 3 axiomas. A partir de ese reducido conjunto de principios, Guidobaldo consiguió demostrar un elevado número de teoremas (algunos de los cuales son problemas) acerca de balanzas, palancas, poleas, ruedas y engranajes. El número de proposiciones demostradas alcanza un total de 53. Esta obra se consideró por mucho tiempo como el mejor tratado de estática. Guidobaldo sostuvo la tesis de que la estática y la dinámica son ciencias que no admiten un tratamiento unificado mediante el mismo conjunto de principios. La obra de Galileo, que fue su discípulo, puede verse como un intento por superar esa posición y construir una mecánica unificada y completa. Ese proyecto de unificación es el que culmina en la obra de Newton. En 1638 aparece la obra cumbre de Galileo, sus Discursos y demostraciones matemáticas en torno a dos ciencias nuevas. La tercera parte de este libro (la “Tercera Jornada”) contiene el tratado denominado Sobre el movimiento local, que es en realidad una obra independiente del resto del libro. En ella Galileo establece los fundamentos de aquella parte de la mecánica que hoy conocemos como cinemática. Por cierto, Galileo tuvo numerosos precursores medievales que escribieron extensamente sobre el movimiento de los cuerpos terrestres y anticiparon algunos de sus resultados. Como hemos visto, no faltaron en la Edad Media escritos sobre mecánica presentados al modo axiomático. Casi con

32

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 33

LA

AXIOMÁ´TICA MODERNA: LA REVOLUCIÓ´N CIENTÍ´FICA

seguridad Galileo conoció algunos de ellos. Todas estas obras reflejan la influencia de Euclides y Arquímedes, ya ampliamente conocidos y comentados en el siglo XVI. Con todo, la influencia más importante es la obra de su maestro Guidobaldo dal Monte. Galileo comienza su obra con definiciones como la siguiente: “Por movimiento igual o uniforme entiendo aquel en el que los espacios recorridos por un móvil en tiempos iguales cualesquiera son iguales entre sí.” Y luego enuncia axiomas como el primero: “En el mismo movimiento uniforme, el espacio recorrido en un tiempo más largo es mayor que el espacio recorrido en un tiempo más breve” (véase el Apéndice 2.7). Finalmente procede a demostrar un total de 44 proposiciones, entre las que diferencia, igual que Euclides, entre teoremas y problemas. Esta obra de Galileo, que influyó decisivamente sobre Newton, tiene los mismos defectos que la de Euclides (carencia de términos primitivos y de reglas de transformación) y resulta mucho menos acabada y completa que los Elementos. Sin embargo, representa un logro considerable, porque avanza en la aplicación del método axiomático a una ciencia empírica como la mecánica. Galileo suponía, siguiendo la concepción tradicional, que los axiomas eran enunciados verdaderos, pero no los considera necesariamente evidentes. Trata incluso de ofrecer ejemplos experimentales que confirmen la verdad de sus axiomas. Afirma explícitamente que las consecuencias que se deducen de los axiomas deben ser verificadas por medio de la experiencia, lo cual aportará una confirmación ulterior de los axiomas. Mediante esta concepción Galileo llega a vislumbrar la idea esencial del método hipotético-deductivo, según el cual los axiomas de una teoría empírica son hipótesis que pueden confirmarse experimentalmente mediante las proposiciones deducidas de ellos. La justificación de los axiomas de un sistema físico ya no se encuentra en su pura evidencia, sino en la verificación de sus consecuencias por medio de la experiencia. La otra novedad importante del siglo XVII es el ensayo de presentar axiomáticamente las teorías metafísicas, en una suerte de intento de hacer de la filosofía una ciencia tan exacta como la geometría. El racionalismo filosófico, desde Descartes hasta Leibniz, pensó que el método axiomático constituía un ideal de rigor y precisión que era deseable, y posible, extender a todo el conocimiento humano. La aplicación de este método a la filosofía primera, la ontología y la teología, representaba también la esperanza de terminar con las permanentes disputas filosóficas sobre los problemas fundamentales. Descartes hizo el primer ensayo de axiomatización de la metafísica. En sus Respuestas a las segundas objeciones a las Meditaciones Metafísicas, publicadas en 1641, presentó en forma axiomática su demostración de la existencia de Dios, que en las Meditaciones Metafísicas había dado de manera bastante informal. La sección axiomática llevaba por título “Razones que prueban la existencia de Dios y la distinción que existe entre el espíritu y el cuerpo humano

33

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 34

HISTORIA DEL MÉTODO AXIOMÁ´TICO

dispuestas de un modo geométrico”. La expresión “modo geométrico” es en esta época, y desde hace siglos, sinónima de “método axiomático”, y la encontramos repetida por muchos autores. Descartes empleó 10 definiciones y 10 axiomas para demostrar sólo 4 proposiciones. Por ejemplo, su primera proposición demostrada afirma que “La existencia de Dios se conoce a partir de la sola consideración de su naturaleza”, mientras que la última es que “La mente y el cuerpo se distinguen realmente”. Un ejemplo característico de sus axiomas es el cuarto: “Toda la realidad o perfección que existe en una cosa se encuentra formalmente, o eminentemente, en su causa primera y total”. Descartes intenta atenerse al estilo euclídeo de demostración, pero el rigor deductivo logrado es evidentemente menor. Por otra parte, sus axiomas no parecen en modo alguno verdades evidentes. Inspirado por el ejemplo cartesiano, Spinoza se propuso reconstruir de manera axiomática toda la filosofía de Descartes. Lo hizo en 1663 en su obra Principios de la filosofía de Descartes, demostrados al modo geométrico, que dejó inconclusa. Evidentemente este fue un ensayo previo a la axiomatización de su propia filosofía, que expuso de manera completa en la Etica, demostrada según el orden geométrico, de 1677. Allí se ofrece un sistema completo de metafísica, deducido de una multitud de axiomas y definiciones. Spinoza enuncia 26 definiciones y 17 axiomas como principios, pero además emplea otros lemas, axiomas y definiciones auxiliares. El resultado es el más importante de los sistemas metafísicos de la historia escrito en forma axiomática. Sin embargo, sus demostraciones no suscitaron el consenso unánime de la geometría euclídea. La razón de ello no se encuentra tanto en la imperfección de sus demostraciones, sino en la naturaleza de sus principios. Spinoza postuló como axiomas enunciados metafísicos como los siguientes: I. IV “El conocimiento del efecto depende del conocimiento de la causa y lo implica”; y I. VI “La idea verdadera debe concordar con lo ideado por ella”. Sus axiomas están lejos de ser claros y precisos, y es verdaderamente difícil sostener que son verdades evidentes. No resultaron claros ni evidentes para los propios contemporáneos de Spinoza. Por otra parte, tampoco son enunciados que tengan consecuencias empíricas, como los axiomas de la física, y que puedan confirmarse por medio de la experiencia. La Etica de Spinoza representa la cumbre y a la vez el último de los grandes intentos de hacer metafísica al modo axiomático. En lo sucesivo, todos los supuestos axiomas metafísicos resultan cuestionados por su falta de precisión y de evidencia. Con toda seguridad, hay un obstáculo en la naturaleza misma del tema que impide aplicar satisfactoriamente el método axiomático a las cuestiones filosóficas. Parece claro que no se puede exigir la misma precisión y rigor demostrativo en todos los temas. Después de Spinoza el método axiomático producirá éxitos significativos en las ciencias físicas y matemáticas, pero nada verdaderamente importante en el campo de la filosofía.

34

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 35

LA

AXIOMÁ´TICA MODERNA: LA REVOLUCIÓ´N CIENTÍ´FICA

Esto es algo que sólo nos resulta claro retrospectivamente. Durante el siglo XVII los racionalistas mantuvieron una confianza total en la universalidad del método axiomático, es decir, en su aplicabilidad a todas las ciencias y a todo conocimiento en general. En su opúsculo Sobre el espíritu geométrico, escrito alrededor de 1656, Pascal elogiaba sin reservas la perfección del método demostrativo de los geómetras considerándolo infalible. En esta obra Pascal advierte que no es posible definir todos los términos del vocabulario de un sistema axiomático, y consiguientemente reconoce la necesidad de introducir términos primitivos. Aquí aparece por primera vez una distinción clara y explícita entre términos definidos y no definidos de un sistema. Pascal concibe a los términos primitivos, en analogía con los axiomas, como incapaces des ser definidos en razón de su extrema evidencia. Así como la verdad de los axiomas se capta inmediatamente, el significado de los términos primitivos se comprende por sí mismo, sin necesidad de ulterior aclaración. En ambos casos sólo se requiere el ejercicio de la luz natural de la razón. Con base en estos supuestos, enunció una serie de reglas metodológicas que resumió de la siguiente manera:

Reglas necesarias para las definiciones: No admitir ninguno de los términos un poco oscuros o equívocos sin definición. No emplear en las definiciones más que términos perfectamente conocidos o ya explicados. Reglas necesarias para los axiomas: No pedir en los axiomas más que cosas perfectamente evidentes. Reglas necesarias para las demostraciones: Probar todas las proposiciones, sin emplear en sus pruebas más que axiomas muy evidentes por sí mismos o proposiciones ya demostradas o aceptadas. (De l’esprit géometrique, Paris, Flammarion, 1985, p. 91)

En 1662, A. Arnauld y P. Nicole, en el muy difundido tratado La lógica o el arte de pensar (la llamada Lógica de Port-Royal), repitieron estas reglas casi al pie de la letra. Desde entonces, esta concepción racionalista del método axiomático gozó de amplia aceptación. En la década de 1670, Leibniz alumbra la idea de una lengua universal, a la que llamó característica universal, y realiza una serie de intentos nunca concluidos de precisar la estructura de ese lenguaje. Su objetivo es disponer de una herramienta simple y exacta para emplear en la formulación de cualquier sistema deductivo de modo tal que las demostraciones resulten claras y fáciles. La meta última del sueño racionalista, bien expresada por Leibniz, es la construcción, jamás intentada siquiera, de un saber universal o mathesis universalis. Este consistiría en un único y gigantesco sistema axiomático, en el cual a partir

35

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 36

HISTORIA DEL MÉTODO AXIOMÁ´TICO

de unos pocos principios evidentes se demostraran todos los conocimientos humanos. En otras palabras, puede decirse que se trataba de un proyecto de unificación de todas las ciencias en un solo sistema deductivo completo y acabado. El ideal de la mathesis universalis excedía lo que Aristóteles y Euclides habían pensado y, además, contenía un aspecto antiaristotélico. Para Aristóteles, en efecto, cada ciencia poseía sus principios propios e indispensables, de modo que no era posible unificar ciencias diferentes. La diversidad de las ciencias es para Aristóteles irreductible porque refleja la multiplicidad de los géneros en que se dividen las entidades del mundo real. Para los racionalistas, en cambio, la fragmentación del saber en diferentes ciencias y disciplinas es meramente transitoria y simple reflejo de la imperfección de nuestro conocimiento. Leibniz, siguiendo ideas ya bastante antiguas de R. Lulio y T. Hobbes, desarrolla también la idea de un método general para mecanizar cualquier razonamiento. Mediante esta ars combinatoria, sería posible realizar automáticamente todas las demostraciones de un sistema axiomático, sin apelar a la intuición o a algún proceso creativo. El proyecto de Leibniz incluía la representación de los términos del lenguaje del sistema mediante números y la realización de operaciones entre números para producir demostraciones. Mediante estas ideas visionarias, nunca concretadas, Leibniz anticipa ideas contemporáneas como la de aritmetización de los lenguajes y la posibilidad de un algoritmo general capaz de resolver cualquier problema matemático. La investigación de los sistemas axiomáticos contemporáneos mostrará, como veremos más adelante, que hay límites insuperables para la realización de ese proyecto. En 1687 se publica la obra cumbre de la ciencia moderna, los Principios matemáticos de la filosofía natural, de I. Newton, que para muchos intérpretes constituye el verdadero final de la imagen antiguo-medieval del cosmos y el comienzo de la imagen moderna. Newton produce por primera vez la unificación de la física terrestre y la física celeste en una teoría simple y poderosa, que transformó profundamente nuestra imagen del universo. Esta obra monumental esta organizada al modo axiomático, siguiendo de cerca el modelo de Euclides. Es evidente, además, que Newton recibió la influencia de los ensayos axiomáticos de Galileo y Descartes. Comienza con 8 definiciones y 3 axiomas, que son seguramente los más conocidos en toda la historia de la ciencia (véase el Apéndice 2.8). También distingue, entre las proposiciones demostradas, entre problemas y teoremas. Las demostraciones ascienden a un total de 193. Newton emplea, además de sus axiomas, un conjunto muy amplio de lemas, hipótesis y datos auxiliares para la realización de sus demostraciones. En conjunto la obra impresiona a primera vista como menos rigurosa que los Elementos euclídeos. Sin embargo, los mejores especialistas contemporáneos han señalado que todas las pruebas de los Principia son concluyentes y difícilmente mejorables con las herramientas matemáticas que Newton tenía a su disposición.

36

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 37

LA

AXIOMÁ´TICA ABSTRACTA O FORMAL

Newton llama leyes a sus axiomas (“axiomas o leyes del movimiento”), y este nombre es síntoma de un cambio en la concepción de los axiomas de una teoría física, cambio ya insinuado en la obra de Galileo. El primero de los axiomas es la ley de inercia, ya vislumbrada por Galileo y enunciada precisamente por Descartes a mediados de la década de 1630. La versión newtoniana dice: “Todo cuerpo persevera en su estado de reposo o de movimiento uniforme en línea recta, a menos que sea compelido a cambiar ese estado por fuerzas impresas”. Difícilmente se podría tomar a este principio como una verdad evidente. Por otra parte, tampoco se lo puede verificar directamente por la experiencia, porque ello supondría observar el movimiento uniforme de todos los cuerpos en todo momento y lugar, cosa manifiestamente imposible. Newton se oponía a llamar “hipótesis” a sus principios, pero desde nuestro punto de vista éstos deben considerarse como hipótesis empíricas que son confirmables o refutables por medio de sus consecuencias observacionales (o, más bien, de las consecuencias observacionales de todo el sistema). Aparece así la idea, todavía implícita, de que la naturaleza de los axiomas de un sistema físico es diferente de la de un sistema puramente matemático. En la Óptica, publicada en 1704, Newton también adoptó el formato axiomático. Presentó 8 definiciones, que explicaban términos tales como “rayo de luz”, “reflexión”, “refracción”, “ángulo de incidencia”, “ángulo de reflexión”, y otros. El concepto fundamental de su teoría era el de rayo de luz, al que definió de la siguiente manera: “Por rayos de luz entiendo sus partes mínimas, tanto las sucesivas en la misma línea como las contemporáneas en diversas líneas”. Luego enunció 8 axiomas, de los cuales transcribiremos aquí solamente los dos primeros: “Los ángulos de reflexión y refracción están en uno y el mismo plano que el ángulo de incidencia.”; “El ángulo de reflexión es igual al ángulo de incidencia” (véase el Apéndice 2.9 para una presentación completa). Newton mantiene la división euclídea de las proposiciones demostradas en teoremas y problemas. Procede, entonces, a demostrar 39 proposiciones, pero en tales demostraciones no emplea generalmente sus axiomas y definiciones. Muchas de las demostraciones son de tipo experimental y se fundan en observaciones y experimentos detalladamente descriptos por Newton, pero no deducibles de sus axiomas.

La axiomática abstracta o formal Desde Aristóteles hasta Newton los sistemas axiomáticos fueron concebidos como teorías verdaderas acerca del mundo real. La geometría euclídea, por ejemplo, se consideraba como una descripción verdadera de las propiedades del espacio físico, mientras que la teoría de Newton, por su parte, se tenía por una descripción igualmente verdadera del movimiento de los cuerpos celestes y terrestres. A veces se denomina axiomática material a esta concepción tradicional

37

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 38

HISTORIA DEL MÉTODO AXIOMÁ´TICO

de los sistemas axiomáticos. Durante el siglo XIX surge y se desarrolla una concepción diferente de la naturaleza de los sistemas axiomáticos. Según esta idea, que denominamos axiomática abstracta o formal, un sistema axiomático es una teoría puramente formal que no se refiere a ningún objeto o entidad real y, por consiguiente, no es por sí misma verdadera ni falsa. En un sistema axiomático formal los términos primitivos no tienen referencia, es decir no nombran o denotan objetos o propiedades determinadas. Por consiguiente, los axiomas de un sistema formal no son verdaderos o falsos hasta que no se asigne un significado o referencia a sus términos primitivos. Lo que hace abstracto a un sistema de esta clase es el hecho de que es posible asignar diferentes significados a los primitivos del sistema. Esto tiene la consecuencia de que el mismo sistema de axiomas puede ser verdadero respecto de determinados conjuntos de objetos y falso respecto de otros. Un sistema axiomático formal o abstracto se diferencia de un sistema axiomático material por el hecho de que no se refiere a un conjunto determinado de objetos, de los cuales se asume que el sistema es verdadero. Un sistema formal no necesita estar formalizado. Un sistema axiomático formalizado es aquel que se formula en un lenguaje artificial (como, por ejemplo, el de la lógica de primer orden) en el cual la formación de expresiones está estrictamente regimentada. Un sistema formalizado es un sistema puramente sintáctico, en el que todos sus términos y expresiones carecen de significado. Todo sistema formalizado es obviamente formal, pero no a la inversa. Un sistema formal no formalizado se formula en una lengua natural enriquecida con algunos términos técnicos primitivos y definidos. La geometría de Hilbert y la teoría de conjuntos de Zermelo son ejemplos de sistemas axiomáticos formales pero no formalizados (véanse los Apéndices 2.12 y 2.14). La lógica de primer orden, tal como se presenta en los textos usuales, es un ejemplo de sistema formalizado (véase el Capítulo 2.5). Todos los sistemas axiomáticos tradicionales, desde Euclides hasta Newton, son sistemas materiales, que, por supuesto, no son formales ni formalizados (véanse los Apéndices 2.2 a 2.9). Más adelante estudiaremos con detalle los componentes de un sistema axiomático formal y la manera en que tales sistemas se interpretan o adquieren significado. Ahora veremos cómo se llegó a concebir a los sistemas axiomáticos de esta manera. La axiomática formal alcanza su realización en la segunda mitad del siglo XIX. Influyen decisivamente en este hecho el surgimiento de las geometrías no euclídeas, de la lógica matemática y de la teoría de conjuntos. Este es un proceso histórico rico y complejo, que aquí ni siquiera podemos esbozar, y del que apenas mencionaremos algunas etapas significativas. La primera de estas etapas es la invención de sistemas geométricos diferentes del de Euclides, que por muchos siglos se tuvo por la única geometría posi-

38

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 39

LA

AXIOMÁ´TICA ABSTRACTA O FORMAL

ble. Algunas de estas nuevas geometrías no rechazan los principios del sistema de Euclides presentado en los Elementos, pero sus teoremas tienen consecuencias antiintuitivas, ya que no son visualizables y no admiten representación gráfica por medio de diagramas y figuras. Un ejemplo importante es el de la geometría proyectiva, que tiene antecedentes desde el Renacimiento, pero que J. Poncelet expuso por primera vez en su Tratado sobre las propiedades proyectivas de las figuras, de 1822. La geometría proyectiva no implica la negación de ninguno de los postulados de Euclides, y por ello se consideró compatible con la geometría euclídea. Sin embargo, los axiomas y postulados de Euclides no son suficientes para axiomatizar a la totalidad de la geometría euclídea, como se verá más adelante. Cuando se considera una axiomatización más satisfactoria, como la de Hilbert, resulta que la geometría proyectiva es incompatible con la euclídea. Las llamadas geometrías no euclídeas, en cambio, son manifiestamente incompatibles con la de Euclides porque toman como punto de partida la negación de alguno de sus cinco postulados. El primer postulado que se rechazó fue, como era de esperar, el quinto, ya cuestionado desde la Antigüedad. Una versión equivalente a este postulado, formulada por J. Playfair en 1795, dice que por un punto exterior a una recta pasa una y sólo una paralela a dicha recta. Muchos matemáticos destacados de todas las épocas intentaron demostrar este postulado deduciéndolo de los otros cuatro. El intento más notable fue el del italiano G. Saccheri en su obra Euclides vindicado de toda mancha, escrita en 1733. Saccheri se propuso probar que el quinto postulado se deducía de los restantes mostrando que si la negación del quinto postulado se agregaba como axioma a los otros cuatro, se obtenía como resultado una contradicción. El método de Saccheri era correcto porque es evidente que si en un sistema axiomático un enunciado χ se deduce de un conjunto de axiomas β, y a β se le agrega como axioma el enunciado ¬ χ, se producirá una contradicción porque ese sistema contendrá a la vez los enunciados χ y ¬ χ. Saccheri dedujo rigurosamente una serie de teoremas no euclídeos, hasta que creyó, erróneamente, encontrar una contradicción. Concluyó, entonces, que el quinto postulado de Euclides era deducible de los otros cuatro, cuando podría haber sospechado que dicho postulado era lógicamente independiente de los restantes. Saccheri construyó la primera geometría no euclídea, pero no logró reconocer que lo había hecho. Un siglo después, N. Lobachevsky en 1829 y J. Bolyai en 1832 construyeron de manera independiente el sistema de geometría que Saccheri había anticipado y que C. F. Gauss ya había desarrollado antes de 1824. Esta es la llamada geometría hiperbólica, que tomaba como axiomas a los cuatro primeros postulados euclídeos más el axioma según el cual por un punto exterior a una recta pasa más de una paralela a dicha recta (una manera de negar el quinto postulado euclídeo). Los teoremas que se deducen de este conjunto de axiomas son claramente inconsistentes con la geometría de Euclides. Entre otras cosas,

39

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 40

HISTORIA DEL MÉTODO AXIOMÁ´TICO

se deduce que la suma de los ángulos interiores de un triángulo es siempre menor que 180 grados; que dicha suma no es invariable sino que decrece cuando el área del triángulo aumenta y que se aproxima a 180 grados cuando el área del triángulo tiende a cero. En la geometría hiperbólica, a diferencia de la euclídea, no existen figuras semejantes, es decir, figuras que tengan la misma forma pero diferente tamaño. Ni Lobachevsky ni Bolyai encontraron contradicción alguna entre los enunciados de este nuevo sistema geométrico. Incluso Lobachevsky consiguió mostrar que su sistema era consistente, dando una prueba relativa de la consistencia de su geometría respecto de la trigonometría esférica euclídea (véase el Apéndice 1). Demostró que si la geometría euclídea es consistente (esto es, está libre de contradicciones), también la geometría hiperbólica es consistente; o, lo que es equivalente, que si la geometría hiperbólica es contradictoria, también la geometría euclídea necesariamente debe serlo. Mediante esta prueba notable, Lobachevsky puso a ambas geometrías en un mismo nivel de legitimidad desde el punto de vista lógico. Poco tiempo después se produjo la extensión del campo de la geometría a espacios de más de tres dimensiones. En 1844 H. Grassmann publicó su obra Teoría de la extensión lineal, en la cual introducía la idea de espacios vectoriales de n número de dimensiones. En 1854 B. Riemann pronunció su conferencia de habilitación en la universidad de Gotinga, “Sobre las hipótesis que yacen en los fundamentos de la geometría”, donde realizó una extensión notable del dominio de la geometría. Riemann generalizó la teoría de las superficies curvas de Gauss extendiéndola a espacios de n dimensiones. Mostró cómo definir la curvatura intrínseca de un espacio de n dimensiones y cómo medir la distancia entre puntos de cualquiera de estos espacios. El resultado de ello fue una generalización de la geometría a una teoría de muy amplio alcance, conocida como de los espacios de Riemann, que contiene como casos especiales a la geometría euclídea y a diversas geometrías no euclídeas. En general, los espacios de Riemann son espacios n-dimensionales de curvatura variable, donde la curvatura K del espacio es diferente de un punto a otro. La geometría euclídea y la hiperbólica de Lobachevsky, entre otras geometrías no euclídeas, son casos especiales de espacios de Riemann en los cuales la curvatura es constante, es decir, la misma en todo punto. La geometría hiperbólica constituye el caso en el que la curvatura es constante y negativa (K < 0). Otras geometrías no euclídeas, como la elíptica, son casos de un espacio de Riemann con curvatura constante y positiva (K > 0). Finalmente, la geometría euclídea es el caso más especial en el que la curvatura del espacio es nula en todo punto (K = 0). El alcance de la teoría de Riemann sólo se comprendió después de la publicación póstuma de su trabajo en 1867. En 1868 E. Beltrami descubrió un modelo euclídeo de una parte de la geometría hiperbólica de Lobachevsky. El modelo permitía representar en el espa-

40

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 41

LA

AXIOMÁ´TICA ABSTRACTA O FORMAL

cio euclídeo diversos teoremas de esta geometría no euclídea. Posteriormente, F. Klein en 1871 y H. Poincaré en 1881 encontraron otros modelos euclídeos para la totalidad de la geometría hiperbólica. La existencia de estos modelos proporcionó otra prueba de consistencia relativa de la geometría hiperbólica respecto de la geometría euclídea (véase el Apéndice 1). Además, demostró que la geometría hiperbólica era traducible a la geometría euclídea, en el sentido de que a todo teorema de la geometría hiperbólica le corresponde un teorema de la geometría euclídea, que representa la traducción de ese teorema en términos euclídeos. La creación de las geometrías no euclídeas y su generalización a espacios ndimensionales tuvo muchas consecuencias importantes. En primer lugar, surgió la idea de que los diferentes espacios caracterizados por las diferentes geometrías eran entidades puramente abstractas sin relación directa con el espacio físico real. Además, se tuvo conciencia de que la evidencia de los axiomas no era un criterio adecuado para la elección de un sistema axiomático. Los hechos mostraban que era perfectamente posible elaborar una geometría consistente partiendo de axiomas que no son evidentes. Había ahora múltiples sistemas de geometría incompatibles entre sí, pero todos ellos aparentemente libres de contradicciones internas. Esta situación sugirió que la determinación de la estructura geométrica del espacio físico no era una cuestión puramente matemática que pudiera decidirse a priori, sino un problema empírico que en principio podría resolverse experimentalmente. La tradición atribuye a C. F. Gauss el origen de esta idea, que luego se encuentra explícita en Bolyai, Lobachevsky y Riemann. Lobachevsky señaló correctamente que la estructura geométrica del espacio físico debería determinarse mediante mediciones astronómicas, e incluso realizó él mismo tal clase de mediciones. Por otra parte, la existencia de geometrías de cualquier número de dimensiones introdujo un concepto abstracto de espacio, desligado del espacio físico real. Con ello estaban dadas las bases para la distinción entre geometría matemática y geometría física, que llevará a concebir a la primera como un sistema puramente formal que no describe la estructura del mundo real. Ya en 1844 H. Grassmann, en su obra Teoría de la extensión lineal, señalaba que la geometría no es una descripción del espacio físico, sino una teoría de la matemática pura, una “doctrina de las formas”. En 1870 H. Von Helmholtz escribió un breve trabajo titulado Sobre el origen y significado de los axiomas geométricos, que puede considerarse como el primer manifiesto de la geometría como ciencia formal. Helmholtz concluía su trabajo señalando que los axiomas de la geometría no representan relaciones entre cosas reales, sino que son como un molde vacío en el que se puede encajar cualquier contenido empírico. Esto vale tanto para los axiomas euclídeos como para los de todas las geometrías no euclídeas. La geometría matemática o formal no es, entonces, un sistema de enunciados o proposiciones capaces de ser verdade-

41

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 42

HISTORIA DEL MÉTODO AXIOMÁ´TICO

ros o falsos respecto del mundo real. Únicamente cuando se hace corresponder a los axiomas ciertos principios físicos (por ejemplo, relativos al comportamiento de los cuerpos rígidos) se obtiene un sistema de proposiciones significativas, una geometría física, cuyos enunciados tienen valor de verdad y se pueden verificar o refutar por la experiencia. Helmholtz anticipaba de este modo la noción de interpretación de un sistema formal, que más adelante estudiaremos con detalle. La situación planteada por la existencia de geometrías alternativas a la de Euclides tuvo también como efecto la revisión más rigurosa del propio sistema euclídeo. A la vez, se planteó la necesidad de axiomatizar las nuevas teorías geométricas. El primer sistema axiomático de una geometría diferente de la de Euclides lo elaboró M. Pasch en su obra Lecciones de geometría moderna, publicada en 1882, donde axiomatizó la geometría proyectiva. Allí ofreció una lista completa de los términos primitivos y de los axiomas que empleaba en su sistema. Pasch, sin embargo, no renunciaba todavía a la idea tradicional según la cual la fuente de la que se obtienen los axiomas de la geometría es la intuición, o incluso la experiencia. Siguiendo esta inclinación empirista, afirmó que los términos primitivos de un sistema geométrico se refieren a la forma, el tamaño y la posición recíproca de los cuerpos. El significado de estos términos no necesita ser definido porque se hace evidente mediante la simple ostensión de los objetos físicos apropiados. Los axiomas, por su parte, enuncian aquello que se ha observado en las figuras más simples. Una vez determinados los axiomas, la intuición no interviene en el proceso de prueba, según Pasch, porque todo el sistema geométrico debe desarrollarse mediante puras inferencias deductivas, independientemente del sentido de los conceptos geométricos del sistema. Algunos años después, en 1899, M. Pieri y D. Hilbert construyeron, de manera independiente uno del otro, dos axiomatizaciones diferentes de la geometría euclídea, en las que intentaban ofrecer una presentación más rigurosa que la de los Elementos de Euclides. Pieri adopta sólo 2 términos primitivos (“punto” y “movimiento”) y 20 axiomas. Hilbert, por su parte, en su gran obra Fundamentos de la geometría, se vale de 8 términos primitivos (entre ellos, “punto”, “recta” y “plano”) y 20 axiomas separados en 5 grupos (axiomas de conexión, orden, congruencia, paralelismo y continuidad). En la segunda edición de su libro, en 1903, Hilbert agrega un nuevo axioma, que eleva el total a 21. Todos los expertos en el tema coinciden en afirmar que la axiomatización de Hilbert es superior a la de Euclides en tanto resulta suficiente para deducir la totalidad de la geometría euclídea sin recurrir a supuestos no explicitados. De hecho, se convirtió enseguida en el paradigma de axiomatización de una teoría matemática (véase el Apéndice 2.12). Pronto aparecieron otros sistemas axiomáticos de geometría euclídea, como el de O. Veblen en 1904 y el de E. V. Huntington en 1913, que utilizaban términos primitivos y axiomas muy diferentes de los de

42

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 43

LA

AXIOMÁ´TICA ABSTRACTA O FORMAL

Hilbert. Con ello quedó claro que el mismo sistema formal se puede presentar mediante distintos conjuntos de axiomas, independientemente del hecho de que éstos sean evidentes o no. Simultáneamente, se produjeron rápidos avances en la axiomatización de otras teorías matemáticas. E. V. Huntington y, de manera independiente, E. H. Moore axiomatizaron en 1902 la teoría de grupos, teoría ya ampliamente desarrollada y utilizada desde mediados del siglo XIX. También la geometría no euclídea se axiomatizó siguiendo el paradigma de Hilbert, cuando G. Halsted en 1904 y G. Hessenberg en 1905 crearon sistemas axiomáticos para la geometría elíptica. En 1914 F. Hausdorff axiomatizó la parte básica de la topología, conocida como topología de conjuntos de puntos (véase el Apéndice 2.15). Durante esta época el método axiomático formal produjo resultados verdaderamente alentadores, no sólo en geometría, sino en ramas muy diferentes de la matemática. El mismo Huntington, por ejemplo, axiomatizó en 1902 la teoría de las magnitudes continuas, base del análisis matemático, mediante 6 axiomas muy simples (véase el Apéndice 2.13). Hilbert no se limitó a presentar axiomáticamente la geometría euclídea construyendo un sistema formal, aunque no formalizado. Además, analizó detalladamente las propiedades de su sistema. Probó que es consistente, es decir libre de contradicciones, relativamente a la teoría de números reales; y demostró también que sus axiomas son independientes, o sea, que ninguno se deduce de los restantes (en el Capítulo 4 estas propiedades se definen con mayor precisión). De esta manera, inauguró la disciplina conocida como metamatemática, que se ocupa del estudio de las propiedades de los sistemas formales. La concepción que Hilbert tiene de los sistemas axiomáticos es esencialmente abstracta. Su idea principal es que los términos primitivos de una teoría axiomática no se refieren a ningún tipo determinado de entidad concreta o abstracta. Los términos “punto, “recta” o “plano” no denotan a algún objeto geométrico en particular, sino a una clase no determinada de objetos cualesquiera. Una consecuencia importante de esta concepción formalista de Hilbert es que un mismo sistema axiomático puede ser verdadero respecto de sistemas de objetos muy diferentes y de distinta naturaleza, sean concretos o abstractos, dependiendo del significado que se asigne a sus términos primitivos. La misma teoría matemática (o el mismo formalismo lógico) admite múltiples realizaciones o modelos (en el Capítulo 3 estudiaremos este punto más de cerca y veremos varios ejemplos). P. Bernays, uno de los principales discípulos de Hilbert, en un artículo de 1922, “El significado de Hilbert para la filosofía de la matemática”, resumía la concepción formal del método axiomático con las siguientes palabras: De acuerdo con esta concepción, los axiomas no son en modo alguno juicios de los que se pueda decir que son verdaderos o falsos; sólo tienen sentido en el

43

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 44

HISTORIA DEL MÉTODO AXIOMÁ´TICO

contexto de todo el sistema de axiomas. E incluso el sistema de axiomas como un todo no constituye el enunciado de una verdad; más bien, la estructura lógica de la geometría axiomática en el sentido de Hilbert, análogamente a la de la teoría abstracta de grupos, es puramente hipotética. Si hay en alguna parte de la realidad tres sistemas de objetos, así como determinadas relaciones entre esos objetos, tales que los axiomas valen respecto de ellos (esto significa que mediante una adecuada asignación de nombres a los objetos y relaciones, los axiomas se convierten en enunciados verdaderos), entonces, todos los teoremas de la geometría también valen respecto de esos objetos y relaciones. Por tanto, el sistema de axiomas mismo no expresa algo fáctico; más bien, presenta solamente una forma posible de un sistema de conexiones que debe investigarse matemáticamente de acuerdo con sus propiedades internas. (Traducido en Mancosu 1998, p. 192.) De acuerdo con la concepción tradicional, los axiomas de la geometría euclídea son proposiciones autoevidentes que expresan verdades acerca del espacio físico, y, en general, los axiomas de un sistema axiomático son proposiciones verdaderas acerca de alguna clase de objetos concretos o abstractos. Para Hilbert, en cambio, los axiomas de la geometría o de cualquier otro sistema axiomático no son verdades evidentes acerca de ninguna especie de objetos o entidades determinadas. Un sistema de axiomas, si es consistente, caracteriza a un cierto tipo de estructura abstracta que puede tener múltiples realizaciones o modelos, es decir, que puede ser verdadera respecto de diferentes sistemas de objetos o entidades determinadas. Los axiomas de la geometría euclídea, por ejemplo, caracterizan la estructura que llamamos espacio euclídeo. El espacio físico real puede ser uno de los modelos de esta estructura, pero los axiomas de la geometría formal no se refieren a este espacio concreto, ni a ningún otro objeto o entidad. En la concepción formalista de Hilbert, la totalidad de los axiomas de un sistema axiomático puede considerarse como una definición explícita del término que se refiere o nombra a una estructura abstracta. Así, por ejemplo, los axiomas de Hilbert para la geometría euclídea definen el término “espacio euclídeo”. Igualmente, los axiomas de la teoría de grupos definen el término “grupo”, el que a su vez se refiere a la estructura abstracta de grupo. Y lo mismo vale para otras estructuras matemáticas caracterizadas axiomáticamente, tales como las de como espacio vectorial, espacio topológico, y muchas otras. Una consecuencia fundamental de la concepción abstracta del método axiomático consistió en el abandono de la evidencia como criterio de elección y justificación de los axiomas de un sistema. Los axiomas de un sistema formal no son enunciados verdaderos y, por consiguiente, no puede decirse que sean verdades evidentes. Todavía en 1902, Huntington distinguía entre postulados y axiomas, considerando que estos últimos eran verdades autoevidentes. Sin embargo, en pocos años esta distinción fue definitivamente abandonada, y la concepción formalista de los axiomas se impuso de manera casi unánime.

44

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 45

LA

AXIOMÁ´TICA ABSTRACTA O FORMAL

El éxito que Hilbert obtuvo con su axiomatización de la geometría euclídea lo llevó a recomendar la aplicación del método axiomático mas allá del campo de la matemática. En el congreso internacional de matemáticos celebrado en París en 1900, Hilbert leyó una célebre comunicación, titulada “Problemas matemáticos”, en la cual presentó una lista de 22 problemas que ejercería una notable influencia en el desarrollo de la investigación matemática. El sexto de esos problemas consistía en ofrecer un “tratamiento matemático de los axiomas de la física”, en primer lugar, sostenía allí Hilbert, “de la teoría de la probabilidad y de la mecánica”. Significativamente, ambas teorías serían axiomatizadas en los años subsiguientes, aunque no de manera inmediata. En 1909 G. Hamel publicó un artículo notable llamado “Sobre los fundamentos de la mecánica”, en el que daba la primera axiomatización precisa de toda la mecánica clásica. Hamel siguió evidentemente el ejemplo de Hilbert y presentó sus axiomas divididos en grupos: axiomas sobre el espacio y el tiempo, los sistemas materiales, el movimiento, las fuerzas externas e internas y otros. En total empleó 16 axiomas divididos en 7 grupos. Después de deducir de sus axiomas algunas de las leyes fundamentales de la mecánica, procedió a demostrar la consistencia de su sistema axiomático y la independencia de todos sus axiomas. Ese mismo año C. Carathéodory publicó su trabajo “Sobre los fundamentos de la termodinámica”, en el que axiomatizó la termodinámica clásica empleando solamente 2 axiomas. La teoría de la probabilidad, por su parte, recién fue axiomatizada por A. Kolmogorov en 1933 (véase el Apéndice 2.18) luego de varios intentos anteriores, no muy satisfactorios, por parte de otros matemáticos. Durante la segunda mitad del siglo XIX se produce otro desarrollo importante relacionado con el método axiomático: la creación de la lógica matemática. Este es un proceso que comienza con la obra de G. Boole El análisis matemático de la lógica, de 1847, y alcanza un primer estadio axiomático en la Conceptografía de G. Frege, publicada en 1879. Esta obra, subtitulada Un lenguaje formal del pensamiento puro copiado del aritmético, introducía el primer lenguaje formalizado para la lógica formal. Frege fue también el primero en presentar un sistema de lógica de manera axiomática. Su sistema era de lógica de segundo orden, pero incluía un conjunto de axiomas suficientes para deducir todas las verdades de la lógica de primer orden con identidad (véase el Apéndice 2.10). La lógica de primer orden de Frege se deducía de 9 axiomas sumamente simples, pero expresados en una notación simbólica difícil de leer, que pronto cayó en desuso. Frege era ya bien consciente de que la elección de los axiomas involucraba aspectos convencionales y de que sería posible construir otro sistema de lógica equivalente al suyo empleando otros axiomas. En su propia selección se guió por el principio heurístico de que era más natural partir de enunciados simples como axiomas y deducir luego los más complicados como teoremas. No obstante, Frege seguía aferrado a la concepción tradicional de los

45

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 46

HISTORIA DEL MÉTODO AXIOMÁ´TICO

axiomas, y los concebía como enunciados verdaderos que no necesitan demostración porque son autoevidentes. Un sistema axiomático es para él un conjunto de enunciados verdaderos y no un mero formalismo sin interpretar. Por consiguiente, no es necesario probar la consistencia de un sistema axiomático, puesto que ésta ya se encuentra asegurada por la verdad de los axiomas. Frege polemizó sin éxito contra la concepción formalista de Hilbert, que en poco tiempo se iba a imponer sobre la suya, de carácter más tradicional. La obra de Frege contenía otro logro destacable, como ya indicamos, la formalización completa del lenguaje en el que se presentaba el sistema. Construía por primera vez un lenguaje completamente formalizado, que él llamó “escritura conceptual”, y que estaba dirigido a reemplazar a los lenguajes naturales en la formulación precisa de las teorías científicas. Frege se propuso caracterizar cuidadosamente todos los símbolos y reglas de este lenguaje: términos primitivos y definidos, reglas de formación y de transformación. Mediante este lenguaje se podía también definir de manera precisa en qué consiste una prueba o demostración de un teorema del sistema. La propiedad esencial de este lenguaje artificial es que posee reglas explícitas que, en un número finito de pasos, permiten determinar lo siguiente: a) si un símbolo es o no un término primitivo de ese lenguaje; b) si un símbolo es o no un término definido; c) si un conjunto de símbolos es o no un enunciado o fórmula de ese lenguaje; y, por último, d) si una secuencia de enunciados o fórmulas es o no una prueba de una fórmula de ese lenguaje. Un lenguaje que tiene estas características es un lenguaje formalizado, y una teoría axiomática expresada por medio de éste es un sistema axiomático formalizado. La Conceptografía de Frege es el primer sistema axiomático formalizado, y, aunque no tuvo influencia alguna hasta dos décadas después de su publicación, sirvió como modelo para otros sistemas posteriores, como la obra monumental de A. N. Whitehead y B. Russell, Principia mathematica, publicada en tres volúmenes entre 1910 y 1913. Mientras tanto, Frege concibió un ambicioso programa de fundamentación de la matemática, luego conocido como logicismo. La tesis fundamental del logicismo de Frege es, según sus propias palabras, que “la aritmética es una rama de la lógica”. De acuerdo con esta idea, todos los conceptos de la aritmética son definibles mediante conceptos puramente lógicos y todas las verdades de la aritmética, que son proposiciones analíticas, son deducibles exclusivamente de leyes lógicas. En su libro Los fundamentos de la aritmética, publicado en 1884, Frege expuso con todo detalle la justificación de su programa logicista (que no extendió a la geometría) y consiguió dar una definición satisfactoria del concepto de número natural en función de términos lógicos. La siguiente etapa del programa consistía en deducir los teoremas fundamentales de la aritmética de un conjunto de axiomas puramente lógicos. Frege dedicó veinte años de su vi-

46

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 47

LA

AXIOMÁ´TICA ABSTRACTA O FORMAL

da a esta empresa, que finalmente resultó un fracaso. En 1893 publicó el primer volumen de Las leyes fundamentales de la aritmética, donde construía un sistema axiomático de lógica de orden superior del cual deducía los principales teoremas de la aritmética de los números naturales. El segundo volumen, publicado en 1903, hacía lo propio con la teoría de los números reales. Sin embargo, para consternación de Frege, B. Russell había descubierto que el sistema era inconsistente. La célebre paradoja de Russell (que comentamos más adelante en este capítulo) mostró que la lógica de Frege implicaba contradicciones. Frege no consiguió encontrar una solución a esa paradoja y en los últimos años de su vida terminó por renunciar a la tesis logicista. Desde fines del siglo XIX hasta la primera mitad del siglo XX se produjeron los mayores progresos en la aplicación del método axiomático, así como en la investigación metateórica de las propiedades de los sistemas axiomáticos. En 1889 G. Peano, adaptando resultados ya obtenidos por R. Dedekind, publicó la primera axiomatización formal de la aritmética elemental, que perfeccionó en 1895, utilizando sólo 5 axiomas específicos (véase el Apéndice 2.11). El sistema resultante era notoriamente simple y brindaba una base axiomática clara y precisa para la aritmética de los números naturales, que durante siglos se había usado de manera puramente intuitiva. Peano introdujo, además, una notación simbólica para el lenguaje formal mucho más clara y sencilla que la de Frege. Con diversas variantes, la notación de Peano se impuso rápidamente y es la que todavía está en uso en la mayoría de los textos de lógica. El mayor logro del método axiomático contemporáneo ha sido, probablemente, la axiomatización de la teoría de conjuntos, que se consideró como la parte más básica y fundamental de la matemática. El desarrollo histórico de esta teoría es algo complicado, por lo que aquí mencionaremos someramente sus tres etapas fundamentales. La primera es la creación de la teoría intuitiva (o “ingenua”) de conjuntos por G. Cantor; la segunda es el descubrimiento de las llamadas antinomias, esto es, el hecho de que la teoría de Cantor implica contradicciones; y la tercera y última es la axiomatización de la teoría con el fin de eliminar las antinomias. Entre los años 1874 y 1897 G. Cantor publicó de manera progresiva todos los principales resultados de la teoría de conjuntos. La exposición de Cantor no seguía el modelo axiomático ni estaba expuesta en un lenguaje formalizado. Por estas razones se la conoce como teoría intuitiva o informal de los conjuntos. Su obra suscitó al comienzo notable oposición entre los matemáticos porque Cantor no sólo introducía los conjuntos infinitos (que contienen un número infinito de elementos) como actualmente existentes, sino que postulaba una jerarquía infinita de conjuntos infinitos de diferente tamaño. Era necesario aceptar que había infinitos mayores que otros infinitos. Esta idea resultó bastante extraña, pero nadie logró al principio probar que fuera contradictoria o implicara contra-

47

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 48

HISTORIA DEL MÉTODO AXIOMÁ´TICO

dicción. Sin embargo, poco antes de fines del siglo XIX, se descubrió que la teoría de Cantor conducía a auténticas contradicciones o antinomias. La primera paradoja se produjo con el conjunto de todos los números ordinales, llamado Ω, puesto que se demostró que Ω + 1 es mayor que Ω y, a la vez, que Ω + 1 no es mayor que Ω. Esta es la llamada paradoja de Burali-Forti, quien fue el primero en publicarla en 1897. Sin embargo, hoy sabemos que Cantor ya la había descubierto en 1895 y se la había comunicado a Hilbert en una carta del año 1896. El propio Cantor encontró en 1899 otra contradicción en su teoría, conocida como paradoja de Cantor, que afecta al conjunto de todos los conjuntos o clase universal U. Previamente, Cantor había demostrado un célebre teorema (luego conocido como teorema de Cantor) según el cual el conjunto de todos los subconjuntos de un conjunto dado A (llamado conjunto potencia de A y simbolizado como ℘A) es mayor que A mismo, es decir, es un conjunto que tiene más elementos que A (si A tiene n elementos, ℘A tiene 2n elementos). El resultado puede expresarse como |℘A| > |A| (esto es, el número cardinal de ℘A es siempre mayor que el de A, por lo que para cualquier cardinal siempre existe uno mayor). En la teoría de conjuntos de Cantor se puede deducir, entonces, tanto que el cardinal de U es menor que el cardinal del conjunto de todos los subconjuntos de U y a la vez que no es menor que él (o sea, |℘U| > |U| y |℘U| ≤ |U|), lo cual es obviamente contradictorio. En efecto, por el teorema de Cantor |℘U| > |U|. Pero, además, dado que U es el conjunto de todos los conjuntos, ℘U debe estar incluido en U, y es evidente, que un subconjunto de un conjunto dado no puede contener más elementos que dicho conjunto (pues, si B ⊆ A, entonces, |B| ≤ |A|). Se sigue, entonces, que |℘U| ≤ |U|, con lo cual queda probado que la teoría de Cantor implica una contradicción. Otra manera de arribar a la paradoja es advertir que todo subconjunto de U debe ser también elemento de U, por lo que la clase universal debe tener al menos tantos elementos como subconjuntos. Sin embargo, el teorema de Cantor implica que U, como cualquier otro conjunto, tiene más subconjuntos que elementos. Finalmente, en 1902 B. Russell halló una paradoja fundamental que involucraba a los conceptos de conjunto y pertenencia de un elemento a un conjunto (que simbolizamos como ∈). La paradoja de Russell afectaba tanto a la teoría de conjuntos de Cantor como a la lógica general de orden superior que Frege había elaborado en su obra Las leyes fundamentales de la aritmética. Russell le comunicó su descubrimiento a Frege en una carta, que éste hizo pública en un apéndice del segundo volumen de Las leyes fundamentales de la aritmética, publicado en 1903. E. Zermelo, por su parte, ya la había descubierto independientemente en 1901, pero no la había publicado. El contenido de la paradoja de Russell se puede resumir así: si designamos como y al conjunto de todos los conjuntos que no son elementos de sí mismos, podemos deducir la siguiente

48

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 49

LA

AXIOMÁ´TICA ABSTRACTA O FORMAL

equivalencia: y ∈ y ↔ y ∉ y. Es decir, el conjunto y pertenece a sí mismo si y sólo si no pertenece a sí mismo, lo cual es evidentemente contradictorio. La explicación de este resultado paradójico es simple, pero no siempre intuitiva. Se sigue simplemente de la definición de y, el llamado conjunto de Russell, como el conjunto de todos los conjuntos que no son elementos de sí mismos. Si y es elemento de sí mismo, por definición no debe serlo; si y no es elemento de sí mismo, por la misma definición debe serlo. El conjunto de Russell es contradictorio y, como tal, no puede existir. Veamos cómo la paradoja se produce en la teoría de conjuntos de Cantor. Cantor había considerado como conjunto a cualquier reunión en un todo de determinados objetos bien distinguidos de nuestra intuición o pensamiento. Podemos suponer, entonces, que dada una propiedad cualquiera ϕ, existe el conjunto correspondiente formado por todas los objetos que tienen esa propiedad, es decir, por la extensión de ϕ. Esta afirmación se conoce como principio de comprensión, y puede formalizarse de la siguiente manera: ∃y ∀x (x ∈ y ↔ ϕx). Este principio es la fuente de las paradojas, pues, si elegimos ϕ = x ∉ x, arribamos a la paradoja de Russell. La deducción se puede presentar así: sea ϕ = x ∉ x, y sea y = {x : ϕx}. Ahora bien, si y ∈ y , entonces, por el principio de comprensión debe valer ϕy, o sea, debe valer y ∉ y. Pero, por otra parte, si y ∉ y, entonces, por el principio de comprensión y la definición de y debe valer y ∈ y. Así llegamos a una contradicción patente. El principio de comprensión implica que el conjunto de Russell es también un conjunto. Y dicho conjunto es contradictorio porque tiene la propiedad de que es un elemento de sí mismo si y sólo si no es un elemento de sí mismo. Sobre este punto es necesario señalar que Cantor no suscribió el principio de comprensión de manera irrestricta, ya que no aceptó como conjuntos a las totalidades de objetos que no pudieran concebirse sin contradicción como existentes. Este es el caso del conjunto de Russell y de otros a los que Cantor llamó, en una carta a R. Dedekind de 1899, “pluralidades absolutamente infinitas o inconsistentes”. Cantor considera conjuntos sólo a las pluralidades consistentes, por consiguiente, el conjunto de Russell no es un conjunto en el sentido cantoriano del término. La propiedad ϕ = x ∉ x no determina un conjunto, contra lo que afirma el principio de comprensión en su formulación irrestricta. En cualquier caso, la paradoja de Russell alcanzaba a la teoría general de las clases y a la lógica de orden superior. Una vez conocida la paradoja de Russell la teoría intuitiva de conjuntos entró en crisis, y esta crisis afectó también a los fundamentos de la matemática en general, puesto que de la teoría de conjuntos se deducen todas las partes básicas de la matemática, como la teoría de los números cardinales y ordinales, los números reales e imaginarios, las funciones y muchas otras. En el año 1908 se propusieron de manera casi simultánea dos intentos de solución para las antinomias de la teoría de conjuntos: la teoría de

49

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 50

HISTORIA DEL MÉTODO AXIOMÁ´TICO

los tipos de B. Russell y la teoría axiomática de conjuntos de E. Zermelo. Ese mismo año, J. E. Brouwer presentó una nueva manera de concebir la matemática, el intuicionismo, que lo llevaría a formular una teoría de conjuntos alternativa a la de Zermelo. Aquí nos ocuparemos especialmente de la solución de Zermelo, que desde el punto de vista histórico fue la que tuvo mayor importancia, pero antes haremos algunas observaciones generales sobre la teoría de los tipos y sobre la matemática intuicionista. La solución propuesta por la teoría de los tipos consiste en estratificar el lenguaje en diferentes niveles. Las reglas de este lenguaje estratificado impiden afirmar proposiciones tales como x ∉ x, las cuales resultan simplemente fórmulas mal formadas. Russell empleó esta solución a las paradojas para proseguir el programa logicista de deducir la aritmética a partir de una lógica libre de contradicciones. En la inmensa Principia mathematica Whitehead y Russell consiguieron demostrar un enorme conjunto de teoremas matemáticos. Pero el costo de esta empresa fue alto porque el sistema lógico del cual se deducía la aritmética era bastante más complicado que el de Frege y las correspondientes demostraciones mucho más laboriosas. Además, fue necesario introducir dos axiomas especiales, el de infinitud y el de reducibilidad, que no parecían ser leyes puramente lógicas y que muchos matemáticos encontraron inaceptables. Debido a su complejidad y a sus dificultades de aplicación, los matemáticos profesionales nunca adoptaron la teoría de los tipos. Desde entonces, el programa logicista ha quedado inconcluso, aunque sus ideas esenciales todavía tienen adeptos. La teoría de los tipos tampoco ha perdido su interés filosófico, a pesar de haberse revelado como un instrumento matemático de escasa utilidad. En 1908, el mismo año en que Zermelo axiomatizó la teoría de conjuntos, J. E. Brouwer publicó su primer trabajo sobre la concepción intuicionista de la matemática, de la cual resultarían una teoría de conjuntos y una lógica alternativas a las clásicas. Para Brouwer las entidades matemáticas no existen por sí mismas, sino que son construcciones mentales del sujeto individual. La existencia de una entidad matemática sólo puede afirmarse cuando se posee una demostración constructiva de tal entidad, esto es, cuando es posible especificar un procedimiento para construirla en un número finito de pasos. Consecuentemente con esta posición, Brouwer rechazó la teoría de conjuntos de Cantor, donde se consideraba a los conjuntos infinitos como entidades completas y actualmente existentes, esto es, como individuos. En particular, rechazó el principio de comprensión, tanto en la versión generalizada atribuida a Cantor, que conducía a paradojas, como en la formulación restringida de Zermelo, que era aparentemente consistente. Sólo una concepción constructiva de los conjuntos, que no les asignara una existencia independiente de los matemáticos, era aceptable para Brouwer como fundamento de la matemática. Esta idea constituyó la base del programa de reconstrucción intuicionista de la matemática, que se pre-

50

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 51

LA

AXIOMÁ´TICA ABSTRACTA O FORMAL

sentó como una alternativa a la matemática clásica y, sobre todo, a la teoría de conjuntos de Zermelo. En la matemática intuicionista, las paradojas de la teoría clásica de conjuntos no podían siquiera formularse, de manera que no había necesidad de procedimientos para evitar las contradicciones, como los empleados por Russell en la teoría de los tipos o por Zermelo en la teoría axiomática de conjuntos. Brouwer desconfió muy tempranamente de la utilidad de los lenguajes formales y del método axiomático formal tal como lo practicaban Hilbert y sus seguidores. Rechazó, por consiguiente los programas formalista y logicista de fundamentación de la matemática. Consideró que la lógica no constituía el fundamento de la matemática, sino que, a la inversa, era una aplicación de ésta. Más precisamente, la lógica sólo surge como resultado de un proceso de abstracción y generalización de los procedimientos matemáticos constructivos. Estos muestran, según Brouwer, que algunos de los principios lógicos clásicos, como el de tercero excluido (χ v ¬ χ) y el de doble negación (¬ ¬χ → χ) no son válidos. Se sigue de ello que la matemática constructiva no debe emplear la demostración por el absurdo, que presupone estas leyes de la lógica clásica. El intuicionismo obliga a abandonar el uso generalizado de las demostraciones por el absurdo, que es práctica usual de los matemáticos desde los tiempos de Euclides. En el intuicionismo la regla del absurdo sólo puede usarse para probar conclusiones negativas, es decir, para refutar proposiciones (la regla adopta, entonces, la forma χ → (ψ & ¬ ψ) / ¬ χ). No resulta aceptable, en cambio, para establecer conclusiones positivas, puesto que en ese caso hace uso de leyes clásicas rechazadas por los intuicionistas (en efecto, la regla ¬ χ → (ψ & ¬ ψ) / χ presupone la ley de doble negación). La lógica intuicionista resulta así un sistema más débil que la lógica clásica, puesto que no hay ningún teorema de la lógica intuicionista que no tenga su contrapartida en la lógica clásica, pero hay muchos teoremas clásicos (de hecho, infinitos) que no son válidos en la lógica intuicionista. En 1930 A. Heyting, discípulo de Brouwer, consiguió axiomatizar la lógica proposicional intuicionista mediante un sistema de axiomas simples y claros (véase el Apéndice 2.16). Desde entonces, la lógica intuicionista quedó constituida como una alternativa o rival de la lógica clásica, y el estudio de sus mutuas relaciones formó parte de las discusiones habituales de lógicos y filósofos. Por su parte, el programa de la matemática intuicionista, lo continuaron Heyting y otros matemáticos constructivistas hasta nuestros días. Sin embargo, su popularidad siempre fue escasa en la comunidad matemática. Los matemáticos profesionales, en su gran mayoría, no se han mostrado dispuestos a aceptar las mutilaciones de la matemática clásica que propone el intuicionismo, tales como el abandono de partes considerables de la teoría de conjuntos. Por otra parte, la matemática intuicionista incluye teoremas que son incompatibles con la matemática clásica. Finalmente, la deducción de las partes de la matemática

51

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 52

HISTORIA DEL MÉTODO AXIOMÁ´TICO

clásica que se conservan en la matemática intuicionista es a menudo más complicada. Por todas estas razones, la matemática intuicionista ha permanecido como una corriente minoritaria dentro de la comunidad de los matemáticos. El intuicionismo ha mantenido, sin embargo, su interés filosófico y sus aplicaciones en el campo de la teoría de la demostración y la metateoría de los sistemas formales. La solución a las paradojas aportada por la teoría axiomática de conjuntos es la que goza de mayor aceptación porque es la que combina la mayor simplicidad con la mayor fertilidad y facilidad de aplicación. Zermelo se propuso reformular rigurosamente la teoría de conjuntos de modo tal que no se produjeran paradojas y a la vez se conservara la mayor parte posible de la teoría intuitiva de Cantor. Para ello presentó un sistema de 7 axiomas, que se reveló insuficiente para deducir ciertas partes de la aritmética de los números ordinales. En 1922 A. Fraenkel completó el sistema de Zermelo con un nuevo axioma, llamado axioma de reemplazo, que es un esquema de axioma (véanse los Capítulos 2.3 y 5.2). Ese mismo año, Th. Skolem propuso, de manera independiente, el mismo axioma. En 1930 Zermelo presentó una nueva versión de su sistema en la que modificaba uno de sus 7 axiomas originales, excluía otro, adoptaba el axioma de reemplazo de Fraenkel e introducía un nuevo axioma (el de fundamentación o regularidad). El sistema completo de 9 axiomas (Zermelo-Fraenkel o ZF) resultó adecuado y sin contradicciones aparentes. A partir de dicho sistema, todos los resultados fundamentales de la matemática clásica se pueden deducir con relativa facilidad (véase el Apéndice 2.14 para la formulación original de Zermelo y el Capítulo 5.2 para mayores detalles sobre el sistema ZF). Este sistema utilizaba sólo 2 términos primitivos: el predicado monádico “conjunto” y el predicado diádico “pertenece” (∈). Zermelo empleó como primer axioma un principio ya utilizado por Cantor, según el cual dos conjuntos son idénticos cuando tienen todos sus elementos en común. Este se conoce como axioma de extensionalidad y tiene la siguiente forma: ∀(xy) (∀z (z ∈ x ↔ z ∈ y) → x = y). Luego, postuló como axioma (el tercero en su lista) a una versión modificada del principio de comprensión. Se lo denomina axioma de separación (o de subconjuntos) y se lo escribe así: ∀z ∃y ∀x (x ∈ y ↔ (x ∈ z & ϕx)). La idea fundamental de este axioma (en realidad, un esquema de axioma) es limitar la formación de conjuntos, de manera tal que no ocurra que para toda propiedad exista un conjunto que es su extensión. La restricción de Zermelo consiste en requerir que el nuevo conjunto determinado por la propiedad ϕ sea un subconjunto de un conjunto ya dado. Esto se expresa en el axioma mediante la condición de que todos los elementos del conjunto y, determinado por la propiedad ϕ, sean elementos de otro conjunto previamente existente z. Esta condición impide que puedan formarse conjuntos “demasiado grandes”, que son los que originan paradojas. Los restantes axiomas son, a su vez, modificaciones del axio-

52

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 53

LA

AXIOMÁ´TICA ABSTRACTA O FORMAL

ma de comprensión que limitan la formación de conjuntos, pero permiten tratar con conjuntos infinitos. En el sistema de Zermelo-Fraenkel no existen, por ejemplo, ni la clase universal U, ni conjuntos que sean elementos de sí mismos. Por consiguiente, no se producen las paradojas de Cantor y de Russell. Posteriormente se construyeron diversos sistemas axiomáticos de la teoría de conjuntos diferentes del de Zermelo-Fraenkel. En 1925 J. Von Neumann presentó, bajo la forma de una teoría de las funciones, otra teoría axiomática de conjuntos, que luego fue perfeccionada por P. Bernays y por K. Gödel, y se conoce como Von Neumann-Bernays-Gödel (VNBG). En 1937, W. Quine propuso un sistema muy sencillo, conocido como NF (New Foundations), que empleaba sólo 2 axiomas. En 1955 A. Morse creó otra axiomatización diferente de las anteriores. Las relaciones entre estos diferentes sistemas axiomáticos han sido estudiadas con detalle, pero no pueden exponerse aquí. Digamos simplemente que no son sistemas equivalentes (en el sentido preciso que se define en el Capítulo 2.4). Además, el concepto de conjunto que se emplea en cada uno de ellos es en parte diferente, y los conjuntos construibles en cada sistema no son los mismos (por ejemplo, en los sistemas de Von Neumann-Bernays-Gödel, de Quine y de Morse existe la clase universal, pero no en el de Zermelo-Fraenkel). Por último todos los sistemas axiomáticos de teoría de conjuntos tienen en común el hecho de que no se ha demostrado la consistencia absoluta de ninguno de ellos. Hasta el momento no se han presentado contradicciones en estos sistemas, pero no hay garantía de que en el futuro no aparezcan antinomias (para más detalles véase el Capítulo 5.2). Los éxitos obtenidos por la axiomatización de teorías matemáticas a comienzos del siglo XX hicieron crecer el optimismo sobre la aplicabilidad del método axiomático. En su artículo “Pensamiento axiomático”, publicado en 1918, Hilbert consideraba que toda la matemática debía axiomatizarse y que el método axiomático podía extenderse también a las ciencias físicas, o al menos a todas las teorías de la física en las que la matemática desempeñara un papel importante. El llamado “programa de Hilbert” era el proyecto de axiomatizar todas las teorías de la matemática en un lenguaje completamente formalizado, y demostrar que los sistemas resultantes eran consistentes. Las pruebas de consistencia debían ser absolutas y realizadas por medios estrictamente finitarios (véase el Apéndice 1), esto es, que pudieran verificarse concluyentemente en un número finito de pasos. El ideal de Hilbert consistía en obtener para cada rama de la matemática un sistema axiomático formalizado que fuera a la vez consistente y completo. El célebre teorema de incompletitud, descubierto por K. Gödel en 1931, demostró que este ideal era irrealizable. Gödel probó que cualquier sistema axiomático formalizado que fuera lo suficientemente rico como para incluir a la aritmética elemental, es necesariamente incompleto (e incompletable), dado el su-

53

JP 019a056-Cap1.QXD:0009

BREVE

22/5/12

11:39

Página 54

HISTORIA DEL MÉTODO AXIOMÁ´TICO

puesto de que es consistente. Como corolario de este resultado, demostró también que si un sistema axiomático de este tipo es consistente, su consistencia no puede ser probada dentro del propio sistema. Estos dos resultados afectaban severamente al programa de Hilbert, al menos en su formulación original, porque mostraban que los sistemas axiomáticos formales tienen limitaciones internas insuperables. No se sigue de ello, sin embargo, que el método axiomático sea inaplicable o carezca de utilidad. Por el contrario, el empleo de este método mismo fue el que hizo posible el descubrimiento de sus propias limitaciones (véase el Capítulo 4 y especialmente el Apéndice 1, para mayores detalles y una exposición más matizada del tema). Con los teoremas de Gödel comienza una nueva etapa del método axiomático, caracterizada por la investigación metateórica rigurosa de las propiedades de los sistemas formales, así como por el replanteo de los métodos de prueba admisibles en la metateoría de tales sistemas. Esta etapa llega hasta nuestros días, por lo que parece conveniente terminar en este punto nuestra breve historia del método axiomático.

Notas bibliográficas No se ha escrito todavía, hasta donde conozco, una obra dedicada exclusivamente a la historia del método axiomático. Se pueden encontrar informaciones en las obras generales de historia de la lógica, sobre todo la de Kneale (1984), y de la matemática: Collette (1973-1979); Rey Pastor y Babini (1985); DahanDalmedico y Peiffer (1986), Boyer y Merzbach (1989); Wussing (1989); Kline (1990), y Gratan-Guinness (1994) y (1997). Son obras con enfoques muy diferentes, que no siempre reservan el espacio merecido al método axiomático. También son útiles Bourbaki (1974), Kline (1980) y especialmente Eves (1990), que es la obra que más se aproxima a un esbozo de historia del método axiomático. La amplia obra filosófica de Suppes (2002) también contiene información histórica sobre la axiomática. Benacerraf y Putnam (1983) y Tymoczko (1998) son dos amplias antologías de trabajos originales sobre la filosofía de la matemática en el siglo XX. Shapiro (2000a) es una introducción histórica a la filosofía de la matemática que también incluye una exposición detallada de la situación actual. Mueller (1981) es el estudio moderno más completo sobre los Elementos de Euclides. Beaney (1997) contiene una traducción de casi todos los escritos importantes de Frege. Ferreirós (2006) es una traducción comentada de trabajos y correspondencia de Cantor. Hilbert (1930) es la realización clásica de la axiomática formal. Kolmogorov (1933) es otra obra clásica. Garciadiego (1992) es un estudio histórico detallado de la paradoja de Russell. La presentación original de la teoría de los tipos está contenida en Russell (1956). Los Principia de Whitehead

54

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 55

NOTAS

BIBLIOGRÁFICAS

y Russell (1910-1913) son posiblemente el tratado de lógica más extenso y difícil que se haya escrito, pero los primeros capítulos del primer volumen, que contienen la presentación axiomática de la lógica, todavía resultan muy legibles. Sobre la historia de la geometría no euclídea Gray (1989) presenta un esquema general y Torretti (1978) un tratamiento detallado del desarrollo axiomático. Bonola (1955) es una obra clásica, ya antigua, pero todavía útil (la edición inglesa, pero no la española, contiene como apéndices traducciones de las memorias originales de Bolyai y Lobachevsky). Torretti (1998), Mosterín (2000) y Grattan-Guinness (2000) ofrecen mucha información sobre el desarrollo de la lógica, la teoría de conjuntos y la fundamentación de la matemática en los siglos XIX y XX. Sobre ese tema también son útiles Tiles (1989) y (1991) y Gray (2000). Van Heijenoort (1967), Ewald (1996) y Mancosu (1998) contienen numerosas traducciones de textos fundamentales de la historia de la lógica y la matemática.

55

JP 019a056-Cap1.QXD:0009

22/5/12

11:39

Página 56

JP 057a082-Cap2.QXD:0009

22/5/12

2

10:26

Página 57

La estructura de un sistema axiomático

2.1 ¿Qué es un sistema axiomático? n sistema axiomático es una teoría organizada axiomáticamente. Las teorías, por su parte, están formadas por enunciados o proposiciones (aquí tomaremos enunciado y proposición como sinónimos). Una teoría es, como primera aproximación, un conjunto de proposiciones organizadas sistemáticamente. A veces se llama teoría, en un sentido un poco vago, a cualquier conjunto de proposiciones que tratan acerca de un tema o dominio determinado. Sin embargo, desde un punto de vista lógico, la característica esencial de una teoría consiste en que ésta es un conjunto de proposiciones cerradas respecto de la relación de consecuencia lógica, esto es, toda proposición que sea consecuencia lógica de una teoría también pertenece a esa teoría (en el parágrafo 2.6 de este capítulo trataremos con más detalle el concepto de teoría). Por cierto, no toda teoría es una teoría axiomática. Para obtener una teoría axiomática es necesario determinar un subconjunto A de las proposiciones de una teoría tal que todas las proposiciones de la teoría sean consecuencias lógicas de A. El conjunto A es el conjunto de los axiomas de la teoría. Con estos elementos ya podemos dar una definición de sistema axiomático: ◊ Un sistema axiomático S es un conjunto de proposiciones en el cual se distingue un subconjunto A (los axiomas), tal que toda proposición que pertenece a S es consecuencia lógica de A, y toda proposición que es consecuencia lógica de A pertenece a S.

U

Esta definición vale para cualquier sistema axiomático, como los Elementos de Euclides, que esté compuesto por proposiciones o aseveraciones, es decir, oraciones significativas que tienen valor de verdad y, por consiguiente, son verdaderas o falsas. Sin embargo, aquí nos interesa tratar con sistemas axiomáticos formales, que no son conjuntos de proposiciones, sino de proposiciones formales. Una proposición formal es una expresión que contiene uno o más términos carentes de significado. Como consecuencia de ello, no tiene valor de verdad, no es verdadera ni falsa hasta que no se otorgue significado a dichos términos. Cuando se asigna un significado determinado a todos los términos de una proposición formal, ésta se convierte en una proposición. Así, por ejemplo, la expresión 1) “Hay al menos cuatro puntos que no están en un mismo plano”, es una

57

JP 057a082-Cap2.QXD:0009

22/5/12

ESTRUCTURA

10:26

Página 58

DE UN SISTEMA AXIOMÁ´TICO

proposición (que además es verdadera respecto del espacio de Euclides). En cambio, la expresión 1’) “Hay al menos cuatro F que no están en un mismo G” es una proposición formal, porque contiene los términos F y G, cuyo significado no está determinado. Por consiguiente, no es verdadera ni falsa. Si convenimos en que el término F signifique “punto” y el término G signifique “recta”, la proposición formal 1’) se transforma en la proposición 1). Por otra parte, si asignamos otros significados a F y G, por ejemplo, “libro” y “biblioteca”, 1’) se convierte en la proposición 2) “Hay al menos cuatro libros que no están en la misma biblioteca” (la cual es falsa respecto de la oficina de mi padre, que guarda todos sus libros en la misma biblioteca, pero verdadera respecto de mi departamento, que tiene varias bibliotecas, además de libros dispersos por todas partes). Un sistema axiomático formal es, entonces, una teoría axiomática compuesta por proposiciones formales conectadas entre sí por la relación de deducibilidad. ◊ Un sistema axiomático formal S es un conjunto de proposiciones formales en el cual se distingue un subconjunto A (los axiomas), tal que todas las proposiciones formales que pertenecen a S son deducibles de A, y toda proposición formal deducible de A pertenece a S. Un sistema formal puede formularse en una lengua natural no formalizada, como el español o el inglés, siempre que todos sus axiomas sean proposiciones formales, es decir, contengan al menos un término carente de significado. Estos términos sin un significado determinado pueden ser tanto palabras del lenguaje corriente a las que se ha despojado de todo sentido usual (como, por ejemplo, “punto”, “recta” y “plano” en la axiomatización de Hilbert de la geometría euclídea expuesta en el Apéndice 2.12), como signos especiales introducidos en el lenguaje natural (por ejemplo, F, G y H en vez de “punto”, “recta” y “plano”). Este último procedimiento es preferible porque evita las connotaciones significativas que puedan conservar los términos de las lenguas naturales. En un sistema formal no formalizado la construcción de proposiciones formales se encuentra implícitamente regulada por la gramática de la lengua natural en la cual se expresa ese sistema. Por otra parte, la manera de transformar unas proposiciones formales en otras (la deducción correcta de unas a partir de otras) no está determinada por reglas explícitas, sino que se realiza de un modo intuitivo. Los sistemas formales formalizados se expresan en un lenguaje artificial, como el de la lógica, la matemática o la computación. En un sistema formalizado los signos que lo componen se relacionan entre sí mediante reglas de tipo sintáctico, pero no tienen significado alguno en el sentido preciso de que no se refieren a ningún objeto o entidad. En esta clase de sistemas la manera de combinar los signos para construir proposiciones formales, y la manera de transformar unas proposiciones formales en otras (la deducción correcta de unas a par-

58

JP 057a082-Cap2.QXD:0009

22/5/12

10:26

Página 59

ELEMENTOS

DE UN SISTEMA AXIOMÁ´TICO

tir de otras) están especificadas explícitamente por reglas sintácticas (las reglas de formación y transformación, respectivamente). A veces se emplea la expresión “sistema axiomático material” para caracterizar a los sistemas no formales constituidos por proposiciones significativas y diferenciarlos de los sistemas axiomáticos formales compuestos de proposiciones formales sin significado. En este trabajo preferiremos evitar esta terminología. Llamaremos simplemente sistemas axiomáticos no formales a los que están compuestos por proposiciones, y sistemas axiomáticos formales a los que están compuestos por proposiciones formales. Los sistemas axiomáticos formales, a su vez, pueden ser formalizados o no formalizados, según se expresen en un lenguaje artificial regimentado o en una lengua natural enriquecida con algunos términos técnicos. De aquí en adelante nos ocuparemos de la estructura, interpretación y aplicación de los sistemas formales. En el Apéndice 2 incluimos la traducción de diversos sistemas axiomáticos no formales, desde Aristóteles hasta Newton, así como de algunos de los primeros sistemas axiomáticos formales, que tienen especial importancia histórica. Comenzaremos por analizar detenidamente cómo es la estructura de un sistema axiomático formal, esto es, cuáles son los elementos que lo componen y cómo se relacionan entre sí estos diferentes elementos.

2.2 Elementos de un sistema axiomático 0) Lógica subyacente. Todo sistema axiomático se formula en el marco de una determinada lógica, que en la mayoría de los casos es alguna porción de la lógica clásica. La lógica subyacente puede estar meramente supuesta y no hacerse explícita dentro del sistema. Esto es lo que sucede en la mayoría de los sistemas axiomáticos de matemática. Por su parte, la lógica subyacente también puede estar axiomatizada, aunque generalmente se prefiere, por razones de simplicidad y utilidad, emplear una lógica no axiomatizada. Si el sistema axiomático que se construye es un sistema de lógica elemental, usualmente no tendrá una lógica subyacente, pues, él mismo es un sistema de lógica. En los sistemas matemáticos, la lógica de primer orden constituye el requisito mínimo para una lógica subyacente. Hay, sin embargo, muchas teorías matemáticas que no se pueden axiomatizar mediante la lógica de primer orden porque requieren herramientas lógicas más potentes. En esos casos se emplea como lógica subyacente a la teoría de conjuntos o bien a una lógica de segundo orden o incluso de orden superior. Los matemáticos casi siempre prefieren a la teoría informal de conjuntos como lógica subyacente por su mayor simplicidad y facilidad de aplicación. Sin embargo, cuando se trabaja en temas de fundamentación de las teorías matemáticas la teoría axiomática de conjuntos resulta preferible, ya que

59

JP 057a082-Cap2.QXD:0009

22/5/12

ESTRUCTURA

10:26

Página 60

DE UN SISTEMA AXIOMÁ´TICO

minimiza los riesgos de que se produzcan paradojas, aunque no los elimina totalmente. Puede decirse que, en cierto sentido, la lógica de primer orden es la lógica subyacente fundamental de todo sistema axiomático. En efecto las lógicas más potentes, como la teoría de conjuntos y las lógicas de orden superior se pueden presentar a su vez como sistemas axiomáticos que tienen a la lógica de primer orden como lógica subyacente. Por su parte, la lógica de primer orden también se puede emplear de manera axiomatizada, pero un sistema axiomático de lógica de primer orden no tiene a su vez una lógica subyacente presupuesta. 1) Vocabulario. Es el conjunto de todos los símbolos mediante los cuales se construyen las cadenas y fórmulas que componen el lenguaje del sistema. El vocabulario de un sistema axiomático contiene diferentes clases y categorías de símbolos. Daremos aquí un esquema básico de clasificación con la advertencia explícita de que la terminología varía mucho de un autor a otro, sin que haya un consenso unánime entre los lógicos y matemáticos sobre cómo llamar a cada clase de símbolo. 1a) Símbolos lógicos: son las conectivas lógicas, los cuantificadores y los signos de puntuación, como los paréntesis y corchetes. Se toman del lenguaje de la lógica subyacente al sistema. 1b) Símbolos no lógicos: genéricamente se los denomina términos o términos descriptivos. Son aquellos símbolos que pueden usarse para denotar individuos, propiedades o relaciones y funciones. Pertenecen a esta clase las variables proposicionales y predicativas, así como las constantes individuales y predicativas, los operadores y funtores. En un sistema axiomático formal ninguno de estos términos tiene significado. Pero cada uno de ellos pertenece a una categoría gramatical bien determinada. Por ejemplo, las constantes predicativas (y variables, si las hubiera) se distinguen por su grado: predicados monádicos, diádicos, triádicos, etc., según se apliquen a uno, dos o tres individuos. En general, el número de símbolos no lógicos de un sistema axiomático es infinito. Entre los términos descriptivos del sistema se eligen algunos que forman el vocabulario específico del sistema axiomático del que se trate. Estos son los términos técnicos del sistema, que se dividen en dos clases fundamentales: 1b1) Términos primitivos: son los términos no definidos que se introducen especificando únicamente la categoría gramatical a la que pertenecen. Por ejemplo, si las constantes predicativas P y Q son los primitivos de un sistema, es necesario indicar si son predicados monádicos, diádicos o del grado que fuere. La elección de los términos primitivos de un sistema axiomático es completamente convencional; se realiza sobre la

60

JP 057a082-Cap2.QXD:0009

22/5/12

10:26

Página 61

ELEMENTOS

DE UN SISTEMA AXIOMÁ´TICO

base de criterios de simplicidad, utilidad, o elegancia estética. En principio, se procura introducir la menor cantidad posible de primitivos o de clases de ellos, pero este criterio no es absoluto. Frecuentemente, por razones de facilidad de uso, se prefiere introducir una mayor cantidad de primitivos que lo que sería estrictamente necesario. En el caso de un sistema axiomático de lógica, la totalidad de su vocabulario está constituido por símbolos lógicos (incluyendo entre estos a las variables), de modo que la distinción entre términos primitivos y definidos se establece entre los propios símbolos lógicos del sistema. 1b2) Términos definidos: son los términos que se definen mediante los primitivos (junto con los símbolos lógicos que sean necesarios). Las definiciones son estrictamente nominales y tienen la forma: t = def ti...tk, donde t es un término definido y ti...tk es una lista finita de términos primitivos (junto con símbolos lógicos). La presencia de términos definidos en un sistema axiomático no es imprescindible. Todas las expresiones del lenguaje del sistema pueden construirse empleando solamente términos primitivos y símbolos lógicos. Los términos definidos se introducen con el fin de simplificar el lenguaje del sistema y hacerlo más claro e inteligible. No obstante, siempre se los puede eliminar reemplazándoselos por su correspondiente definición en función de los términos primitivos. Las definiciones de un sistema formal deben satisfacer dos condiciones: i) eliminabilidad y ii) no creatividad. Las definiciones son eliminables cuando cualquier expresión de un sistema axiomático que contiene términos definidos se puede reemplazar por otra expresión equivalente que sólo contiene términos primitivos y símbolos lógicos, pero ningún término definido. Por otra parte, las definiciones son no creativas cuando no permiten probar como teoremas expresiones que no son demostrables exclusivamente a partir de los axiomas, cuando se han eliminado de ellas los términos definidos. Esto significa que si tenemos como teorema una expresión χ que emplea el término definido t, y en la prueba de χ se ha utilizado la definición de t, es posible demostrar sólo a partir de los axiomas una expresión equivalente χ’ que no contiene términos definidos. Estas dos condiciones establecen que las definiciones son meras estipulaciones o abreviaciones terminológicas, y por consiguiente, no dan lugar a la demostración de nuevos teoremas. En caso contrario, tendrían el carácter de axiomas. 2) Reglas de formación. Son reglas de tipo sintáctico o gramatical que indican cómo combinar los símbolos del vocabulario de un sistema para obtener proposiciones formales bien construidas. Todo sistema axiomático requiere de un número finito de reglas de formación. Cualquier secuencia finita de símbo-

61

JP 057a082-Cap2.QXD:0009

22/5/12

ESTRUCTURA

10:26

Página 62

DE UN SISTEMA AXIOMÁ´TICO

los de un sistema es una cadena. En un sistema axiomático generalmente hay infinitas cadenas. Pero no todo elemento de este conjunto será aceptable como una proposición formal, porque no cualquier cadena se considerará como una fórmula bien construida. Llamamos fórmula bien formada (fbf), o simplemente fórmula, a toda cadena obtenida mediante la aplicación de una o más reglas de formación del sistema a los símbolos del vocabulario. Las reglas de formación son las que permiten diferenciar dentro de un sistema las cadenas de símbolos que son fórmulas bien formadas de aquellas que no lo son. El conjunto de las fbf de un sistema generalmente también es infinito. Las fbf de un sistema axiomático formal son meras proposiciones formales que no tienen significado, y, por consiguiente, carecen de valor de verdad. No son verdaderas ni falsas hasta tanto no demos una interpretación de ese sistema. 3) Reglas de transformación. Son reglas lógicas que indican cómo obtener una fbf a partir de otra u otras fbf. Más precisamente, establecen que una fbf es inmediatamente deducible como conclusión a partir de un conjunto finito de fbf tomadas como premisas. Las reglas de transformación, son, en suma, reglas lógicas de inferencia. Frecuentemente no se las enuncia de manera explícita, sino que están presupuestas como reglas completas de primer orden. En el caso de un sistema axiomático de lógica elemental, es necesario especificarlas explícitamente. La elección de las reglas de transformación también es convencional y se guía por criterios pragmáticos. Todo sistema axiomático necesita al menos una regla de transformación, pero no hay un límite superior para el número de reglas con tal de que éste sea finito. Una sola regla resulta suficiente (por ejemplo, la regla de separación o modus ponens, que se formula en el Capítulo 2.3), pero generalmente se emplea más de una con el fin de hacer que las demostraciones sean más simples y breves. Todas las reglas de transformación deben satisfacer el requisito de corrección, que consiste en la conservación de la verdad de las premisas a las que se aplican. Esto es, una regla de inferencia es correcta cuando a partir de proposiciones verdaderas sólo permite inferir proposiciones verdaderas. Una regla de inferencia correcta garantiza, en razón de la mera forma lógica de la inferencia, la transmisión de la verdad de las premisas a la conclusión. En general, un sistema axiomático es correcto cuando todas las fórmulas deducibles de los axiomas son también consecuencia lógica de los axiomas, es decir, si A es el conjunto de los axiomas y χ es una fórmula cualquiera, entonces, si A l− χ, entonces, A l= χ. La corrección de las reglas de transformación de un sistema axiomático nos asegura que, cuando interpretemos ese sistema, si los axiomas resultan verdaderos, también los teoremas serán verdaderos.

62

JP 057a082-Cap2.QXD:0009

22/5/12

10:26

Página 63

ELEMENTOS

DE UN SISTEMA AXIOMÁ´TICO

4) Axiomas. Constituyen un subconjunto de las fbf de un sistema axiomático. Son las proposiciones formales no demostradas que se adoptan sin prueba o justificación alguna. También se eligen convencionalmente, pero no sería adecuado decir que su elección es totalmente arbitraria. Los axiomas deben ser lo suficientemente fructíferos como para poder deducir de ellos todas las fórmulas que constituyen el sistema en cuestión. Por ejemplo, no cualquier conjunto de fbf de la lógica proposicional es adecuado como base axiomática para un sistema de lógica de este tipo, porque no cualquier conjunto de fbf permite deducir todas las tautologías de la lógica proposicional. Existe, con todo, una amplia libertad de elección para los axiomas de un sistema. Por esta razón es posible construir, como veremos más adelante, sistemas equivalentes a partir de diferentes conjuntos de axiomas. Por ejemplo, hay muchos sistemas equivalentes de lógica proposicional tales que ciertas fbf que aparecen como axiomas en un sistema, son teoremas en otro sistema y viceversa. Esto nos muestra la relatividad de la noción de axioma. Una determinada proposición formal es axioma respecto de un determinado sistema axiomático, pero puede no ser axioma, y generalmente no lo es, en otro sistema equivalente (o no) al primero. Los axiomas, como cualquier otra fbf de un sistema formal, no tienen significado ni valor de verdad. En particular, no son enunciados verdaderos y, por tanto, no se los elige por su evidencia, por el hecho de que sean verdades autoevidentes. Son meras proposiciones formales de las cuales se deducen otras proposiciones formales mediante la aplicación de las reglas de transformación del sistema. El conjunto de los axiomas de un sistema axiomático no necesariamente debe ser finito. Como veremos luego, hay teorías que no son axiomatizables mediante un número finito de axiomas y requieren un número infinito de ellos. Si el número de axiomas es finito se los puede presentar mediante una lista, una secuencia numerada de ellos. En cambio, si un sistema tiene infinitos axiomas, evidentemente no es posible dar una lista de ellos. En ese caso debe proporcionarse un medio efectivo para identificar si una fbf cualquiera del sistema es o no un axioma. Un sistema de este tipo se presenta mediante esquemas de axioma, formulados con metavariables, cada uno de los cuales comprende como casos a infinitos axiomas. Por ejemplo, si A → A se toma como axioma esquema, p → p; (p v q) → (p v q); y otras infinitas fbf serán casos de sustitución de ese esquema. Toda fbf que se obtenga sustituyendo de manera uniforme las metavariables de un axioma esquema por cualquier fbf será, entonces, un axioma del sistema. Por supuesto, el número de esquemas de axioma debe ser finito. Idealmente, en la construcción de un sistema axiomático se tiende a reducir el número de axiomas o de esquemas de axioma al mínimo posible. Pero éste tampoco es un requisito irrevocable. Con frecuencia se emplean más axiomas que los estrictamente necesarios con el fin de que éstos resulten más breves y

63

JP 057a082-Cap2.QXD:0009

22/5/12

ESTRUCTURA

10:26

Página 64

DE UN SISTEMA AXIOMÁ´TICO

sencillos y las demostraciones a partir de ellos sean más fáciles. Más adelante nos encontraremos con ejemplos de esta situación. 5) Teoremas. Son las fbf de un sistema que se deducen de los axiomas mediante la aplicación de alguna regla de transformación. Los axiomas se consideran fbf deducibles de sí mismas (pues la reflexividad es una propiedad esencial de la relación de deducibilidad: toda fórmula se deduce de sí misma). Luego, todo axioma es también teorema. Así, el conjunto de los axiomas de un sistema está incluido en el de los teoremas; y a su vez el conjunto de los teoremas está incluido en el conjunto de las fbf de ese sistema. Casi siempre el conjunto de los teoremas de un sistema axiomático es infinito. Por supuesto, en la práctica no podemos conocerlos a todos, sino que nos limitamos siempre a un conjunto finito de teoremas efectivamente demostrados. Una vez que hemos descripto todos los elementos que componen un sistema axiomático podemos caracterizar las nociones de demostración formal y de deducción en un sistema axiomático. ◊ Una demostración formal en un sistema axiomático S es una secuencia finita de fbf de S, tales que cada una de ellas o bien es un axioma, o bien es una fbf inmediatamente deducible de algunas de las fbf que la preceden en la secuencia. En una demostración formal toda fórmula deducida de los axiomas debe obtenerse por medio de la aplicación de alguna regla de transformación del sistema a los axiomas. La última fbf de la secuencia es la conclusión o teorema demostrado. ◊ Una deducción a partir del conjunto G de premisas en un sistema axiomático S es una secuencia finita de fbf, tales que cada una de ellas es un axioma, o un miembro de G, o es una fbf inmediatamente deducible de algunas de las fbf que la preceden en la secuencia. La última fbf de la secuencia se denomina teorema deducible del conjunto de premisas G. De estas dos definiciones la segunda es más general y abarca a la primera. En efecto, una demostración formal es un caso particular de deducción: es una deducción en la que el conjunto G de premisas es vacío.

2.3 Ejemplo de un sistema axiomático Veremos ahora cómo se construye un sistema axiomático simple y daremos algunos ejemplos de demostración de teoremas dentro de ese sistema. Con ello

64

JP 057a082-Cap2.QXD:0009

22/5/12

10:26

Página 65

EJEMPLO

DE UN SISTEMA AXIOMÁ´TICO

se aclararán muchos de los conceptos que acabamos de caracterizar de una manera abstracta. Presentaremos, en una versión ligeramente modernizada, un sistema axiomático de lógica proposicional que fue creado por el lógico polaco J. Lukasiewicz en 1929 (traducido en Lukasiewicz 1963). Introduciremos uno por uno los diferentes elementos y los iremos comentando. Los sistemas axiomáticos de lógica fundamental representan un caso ligeramente atípico dentro de los sistemas axiomáticos formales. Ante todo, esta clase de sistemas no tiene una lógica subyacente presupuesta que sea diferente del sistema mismo. Dado que se trata sistemas de lógica básica, la lógica subyacente está dada por el propio sistema, el cual puede usarse a su vez como lógica subyacente para otras teorías axiomáticas. Sin embargo, la mayoría de los sistemas axiomáticos formales tiene una lógica subyacente que no está axiomatizada. El ejemplo de la lógica proposicional es particularmente simple y, además, nos resulta útil para introducir la estructura de un lenguaje formalizado y para conocer la manera en que se demuestran teoremas dentro de un sistema formal. Más adelante (en el Capítulo 2.6) presentaremos otros ejemplos de sistemas axiomáticos formalizados, la aritmética de Peano y la geometría elemental de Tarski, que representan casos más típicos de empleo del método axiomático en las ciencias formales. Lógica proposicional (Łukasiewicz 1929) 1) Términos primitivos a) Símbolos lógicos Constantes lógicas: ¬ , → Signos de puntuación: ( ) b) Símbolos no lógicos Variables proposicionales: p, q, r, ...p1, q1, r1 ... 2) Reglas de formación Las letras mayúsculas A, B, C..., que emplearemos en las reglas de formación y transformación, son en realidad metavariables que representan a cualquier fórmula del sistema. Así, por ejemplo, A puede representar a un símbolo proposicional p, pero también a la fórmula p → q o a cualquier otra de cualquier extensión. RF1. Toda variable proposicional es una fórmula bien formada (fbf). RF2. Si A y B son fbfs, entonces, ¬ A y (A → B) son fbfs.

65

JP 057a082-Cap2.QXD:0009

22/5/12

ESTRUCTURA

10:26

Página 66

DE UN SISTEMA AXIOMÁ´TICO

RF3. Sólo son fbfs las cadenas de símbolos que resultan de la aplicación (posiblemente reiterada) de RF1 y RF2. Estas son todas las reglas de formación del sistema. Todas las reglas se enuncian en un nivel metalingüístico. Estas reglas nos permiten construir un número infinito de fórmulas bien formadas de cualquier extensión finita. Por ejemplo, p, y q son fbf por RF1; (p → q) es una fbf por RF2; ¬ (p → q) es una fbf por RF2; (¬ (p → q)) → (¬ (p → q)) es una fbf por RF2, y así sucesivamente. La oración final es una cláusula de cierre, que se emplea para excluir la posibilidad de que se agreguen nuevas reglas de formación o se las suponga tácitamente. Para simplificar la notación y eliminar el uso de paréntesis adoptaremos la convención de suprimir los paréntesis externos de cada fórmula. De este modo, escribiremos A → B en vez de (A → B); y (A → B) → C en vez de ((A → B) → C)). También escribiremos ¬ A en vez de ¬ (A) cuando la fórmula A no contenga otras constantes lógicas. 3) Términos definidos

Definición de “v”: A v B ↔def ¬ A → B. Definición de “&”: A & B ↔def ¬ (A → ¬ B). Definición de “↔”: A ↔ B ↔def ¬ ((A → B) → (¬ (B → A))).

Los términos definidos no son necesarios dentro del sistema, ya que todas las fbf de la lógica proposicional pueden escribirse solamente con las conectivas de negación y condicional. Se los introduce por razones prácticas para simplificar la escritura y para traducir al lenguaje del sistema otras formulaciones de la lógica proposicional. 4) Reglas de transformación RT1. Dadas las fbf A y A → B, la fbf B se deduce inmediatamente de ambas. RT2. Dado un teorema A, se deduce inmediatamente otro teorema B sustituyendo en A una cualquiera de sus variables, en todas sus apariciones, por una misma fbf cualquiera. Estas son todas las reglas de transformación del sistema.

66

JP 057a082-Cap2.QXD:0009

22/5/12

10:26

Página 67

EJEMPLO

DE UN SISTEMA AXIOMÁ´TICO

La regla RT1 es la regla de separación o modus ponens: A, (A → B) / B, conocida ya por los antiguos griegos. La regla RT2 es la regla de sustitución uniforme de variables, que en este sistema se aplica sólo a los símbolos proposicionales. A veces, para simplificar las demostraciones, se introducen reglas derivadas de inferencia, pero aquí no lo haremos. 5) Axiomas Ax1. (p → q) → ((q → r) → (p → r)).

Ax2. (¬ p → p) → p.

Ax3. p → (¬ p → q).

Ninguna otra fórmula es un axioma. Por razones de elegancia, casi siempre se prefiere utilizar sólo términos primitivos en la formulación de los axiomas, como ocurre en este caso, aunque ello no es indispensable. 6) Teoremas T1. (((q → r) → (p → r)) → s) → ((p → q) → s). Demostración: 1. (p → q) → ((q → r) → (p → r))

[Axioma 1]

2. ((p → q) → ((q → r) → (p → r))) → ((((q → r) → (p → r)) → s) → ((p → q) → s)) [De 1 por RT2, sustituyendo p por (p → q); q por (q → r) → (p → r); y r por s]

3. (((q → r) → (p → r)) → s) → ((p → q) → s) [De 1 y 2 por RT1]

Todo teorema demostrado se puede usar a su vez como axioma de las siguientes demostraciones. T2. (p → (q → r)) → ((s → q) → (p → (s → r))). Demostración: 1. (((q → r) → (p → r)) → s) → ((p → q) → s)

[Teorema 1]

67

JP 057a082-Cap2.QXD:0009

22/5/12

ESTRUCTURA

10:26

Página 68

DE UN SISTEMA AXIOMÁ´TICO

2. ((((q → r) → (s → r)) → (p → (s → r))) → ((s → q) → (p →(s → r)))) → ((p → (q → r)) → ((s → q) → (p → (s → r))))

[De 1 por RT2, sustituyendo q por (q → r); r por (s → r); y s por ((s → q) → (p → (s → r)))]

3. (((q → r) → (s → r)) → (p → (s → r))) → ((s → q) → (p → (s → r))) [De 1 por RT2, sustituyendo p por s; y s por p → (s → r)]

4. (p → (q → r)) → ((s → q) → (p → (s → r))) [De 2 y 3 por RT1] •

Estos dos teoremas se deducen del Axioma 1 exclusivamente. Veamos ahora una demostración que emplea los tres axiomas conjuntamente. T3. p → p Demostración: 1. (p → q) → ((q → r) → (p → r))

[Axioma 1]

2. (p → (¬ p → q)) → (((¬ p → q) → r) → (p → r)) [De 1 por RT2, sustituyendo q por (¬ p → q)]

3. p → (¬ p → q)

[Axioma 3]

4. ((¬ p → q) → r) → (p → r)

[De 2 y 3 por RT1]

5. ((¬ p → p) → p) → (p → p)

[De 4 por RT2, sustituyendo q por p; y r por p]

6. (¬ p → p) → p

[Axioma 2]

7. p → p

[De 5 y 6 por RT1]

Observemos que cada una de estas secuencias de fórmulas es una demostración porque satisface las condiciones enunciadas antes: cada línea es un axioma o una fórmula que se deduce de alguna línea precedente por medio de la aplicación de una regla de transformación. La clave para encontrar una prueba de un teorema cualquiera está en hallar la sustitución adecuada para cada uno de los símbolos proposicionales p, q y r, que aparecen en los axiomas. La única res-

68

JP 057a082-Cap2.QXD:0009

22/5/12

10:26

Página 69

EJEMPLO

DE UN SISTEMA AXIOMÁ´TICO

tricción para este procedimiento es que la sustitución debe ser uniforme en cada línea, o sea, que si, por ejemplo, en el Axioma 2 el símbolo p se reemplaza por la fórmula r → q, todas las apariciones de p en ese axioma deben reemplazarse por r → q. Ello no impide que en otra línea de la demostración p sea remplazada uniformemente, en cualquier axioma, por otra fórmula cualquiera. Actualmente se prefiere formular los sistemas axiomáticos de lógica mediante esquemas de axiomas. El número de axiomas del sistema se vuelve, entonces, infinito, porque cada esquema representa a un número infinito de axiomas. Este hecho no constituye un problema porque comparando la forma lógica de los esquemas de axiomas con la forma lógica de cualquier fbf, podemos determinar si esa fbf es o no es un axioma. Por otra parte, este procedimiento tiene varias ventajas: se puede prescindir de la regla de sustitución, las demostraciones se vuelven más simples y los resultados obtenidos son más generales. La idea de emplear esquemas de axiomas la introdujo J. Von Neumann en 1927, pero el procedimiento sólo se generalizó años más tarde. Un ejemplo de esta clase de formulación es el sistema de lógica proposicional que A. Church presentó en 1956, inspirado en otro sistema de lógica proposicional de J. Łukasiewicz. El sistema emplea los mismos términos primitivos, reglas de formación y términos definidos; una sola regla de transformación, el modus ponens (RT1), y los siguientes axiomas: 5’) Axiomas Ax1. A → (B → A).

Ax2. (A → (B → C)) → ((A → B) → (A → C)).

Ax3. (¬ A → ¬ B) → (B → A).

Ninguna otra fórmula es un axioma. Estos axiomas son en realidad esquemas de axiomas formulados con metavariables. Las letras A, B, C,..., representan fórmulas cualesquiera, no necesariamente distintas entre sí. Cada esquema de axioma tiene un número infinito de casos de sustitución, por lo que cada uno de ellos representa a infinitos axiomas. Así, por ejemplo, las tres siguientes fórmulas: p → (q → p); (p → q) → (q → (p → q)); y ¬ p → (¬ p → ¬ p), son todos axiomas obtenidos por sustitución del esquema de axioma Ax1. Veamos dos ejemplos de demostración en este sistema.

69

JP 057a082-Cap2.QXD:0009

22/5/12

ESTRUCTURA

10:26

Página 70

DE UN SISTEMA AXIOMÁ´TICO

6’) Teoremas T1. A → A. Demostración: 1. A → ((A → A) → A)

[Axioma 1]

3. (A → (A → A)) → (A → A)

[De 1 y 2 por RT1]

2. A → ((A → A) → A)) → (((A → (A → A)) → (A → A)) [Axioma 2] 4. A → (A → A)

5. A → A

[Axioma 1] [De 3 y 4 por RT1]

Hemos probado un teorema de la lógica proposicional que puede identificarse con el clásico principio de identidad. Pero, puesto que hemos usado esquemas de axiomas, hemos demostrado en realidad un esquema de proposición formal que representa a infinitos teoremas de la misma forma, por ejemplo: p → p; q → q; (p → q) → (p → q); etc. T2. ¬ A → (A → B). Demostración: 1. (¬ B → ¬ A) → (A → B)

2. ((¬ B → ¬ A) → (A → B)) → (¬ A → ((¬ B → ¬ A) → (A → B)))

3. ¬ A → ((¬ B → ¬ A) → (A → B))

4. (¬ A → ((¬ B → ¬ A) → (A → B))) → ((¬ A → (¬ B → ¬ A)) → (¬ A → (A → B)))

5. (¬ A → (¬ B → ¬ A)) → (¬ A → (A → B))

6. ¬ A → (¬ B → ¬ A)

7. ¬ A → (A → B)

70

[Axioma 3]

[Axioma 1] [De 1 y 2 por RT1]

[Axioma 2] [De 3 y 4 por RT1] [Axioma 1] [De 5 y 6 por RT1]

JP 057a082-Cap2.QXD:0009

22/5/12

10:26

Página 71

SISTEMAS

EQUIVALENTES

2.4 Sistemas equivalentes Se dice que dos sistemas axiomáticos son equivalentes (o equipolentes) cuando permiten demostrar el mismo conjunto de teoremas. Por ejemplo, dos sistemas de lógica proposicional serán equivalentes si en ambos se prueban como teoremas todas las tautologías de la lógica proposicional. La equivalencia entre dos sistemas axiomáticos se determina definiendo los términos primitivos de uno mediante los del otro, y demostrando que los axiomas de cada uno son teoremas en el otro sistema. Más precisamente, los sistemas S1 y S2 son equivalentes si y sólo si, i) los términos primitivos de S1 son términos definibles en S2 y los primitivos de S2 son definibles en S1; y ii) los axiomas de S1 son teoremas en S2 y los axiomas de S2 son teoremas en S1. Cuando se cumplen estas dos condiciones decimos que S1 y S2 no son dos teorías diferentes, sino dos formulaciones diferentes de la misma teoría. Existen numerosos sistemas axiomáticos de lógica proposicional que son equivalentes entre sí. Por ejemplo, el sistema elaborado por D. Hilbert y W. Ackermann en 1928 emplea en los axiomas las conectivas lógicas de disyunción (v) y condicional (→), aunque esta última es un término definido, como regla de transformación al modus ponens, y como axiomas a las siguientes fórmulas: Ax1. (A v A) → A.

Ax2. A → (B v A).

Ax3. (A v B) → (B v A).

Ax4. (A → B) → ((C v A) → (C v B)). Este sistema es equivalente al de J. Lukasiewicz de 1929, que expusimos antes. Para probarlo hay que proceder en dos pasos. Primero traducimos los axiomas de Hilbert y Ackermann al lenguaje del sistema de Lukasiewicz, reemplazando de manera uniforme el término lógico “v” por su definición mediante “→” y “¬”. El primer axioma se traduce, entonces, como: (¬ A → A) → A. Los restantes axiomas puede reescribirlos el lector. Luego se demuestra cada uno de los cuatro axiomas traducidos a partir de los tres axiomas del sistema de Lukasiewicz. Las pruebas correspondientes también quedan como ejercicio para el lector. Con ello se ha probado que el sistema de Lukasiewicz implica al de Hilbert y Ackermann, pero para probar la equivalencia entre ambos sistemas hay que demostrar que la implicación se da en sentido inverso. Ahora es necesario traducir los axiomas de Lukasiewicz al lenguaje del sistema de Hilbert y Ackermann y luego deducirlos de los cuatro axiomas de este sistema. Cuando dos sistemas axiomáticos emplean reglas de inferencia diferentes la deducción de los axiomas debe hacerse empleando las reglas propias de cada

71

JP 057a082-Cap2.QXD:0009

22/5/12

ESTRUCTURA

10:26

Página 72

DE UN SISTEMA AXIOMÁ´TICO

uno. Por ejemplo, el sistema de lógica proposicional que H. Reichenbach construyó en 1953 emplea como términos primitivos a las conectivas de negación (¬) y disyunción (v); pero en vez del modus ponens usa como regla de inferencia la regla del silogismo disyuntivo: A v B, ¬ A / B. Los axiomas de ese sistema son los siguientes: Ax1. ¬ ¬ (A v (¬ A v B)).

Ax2. ¬ ¬ (¬ (A v B) v (¬ (¬ B v A) v A)).

Ax3. ¬ ¬ (¬ (A v B) v (¬ (¬ B v C) v (A v C))).

Ax4. ¬ A v A.

Ax5. ¬ (A v B) v (A v ¬ ¬ B). Para probar la equivalencia de este sistema con cualquiera de los dos anteriores es necesario traducir los axiomas de éstos al lenguaje del sistema de Reichenbach y luego demostrarlos a partir de sus cinco axiomas empleando sólo la regla del silogismo disyuntivo. Después hay que traducir los axiomas de Reichenbach a los lenguajes de cada uno de los otros dos sistemas y demostrarlos a partir de los axiomas de cada uno de ellos usando sólo la regla del modus ponens. Aquí tiene el lector un ejercicio más largo y complicado que le demandará, probablemente, más tiempo de trabajo.

2.5 Lógica de primer orden El sistema axiomático de lógica proposicional que presentamos antes se puede ampliar hasta obtener un sistema completo de lógica de primer orden con identidad. Para ello es necesario incorporar nuevos términos primitivos y definidos, reglas de formación y de transformación, y una serie de nuevos axiomas. El sistema que expondremos es, con variantes de detalle, el que A. Church construyó en 1956, uno de los más conocidos y utilizados en los subsiguientes tratados de lógica. Su estructura es la siguiente: Lógica de primer orden con identidad (Church 1956). 1) Términos primitivos a) Símbolos lógicos Conectivas lógicas: ¬ ; → Cuantificador universal: ∀ Símbolo de identidad: = Signos de puntuación: ( )

72

JP 057a082-Cap2.QXD:0009

22/5/12

10:26

Página 73

LÓ´GICA

DEL PRIMER ORDEN

b) Símbolos no lógicos Variables proposicionales: p, q, r, ...p1, q1, r1 ... Constantes predicativas: P1, Q1, R1, ... P2, Q2, R2, ... P3, Q3, R3, … (el superíndice indica el grado del predicado). Funtores:

f 11, f 12, f 13, ... f 21, f 22, f 23, … f n1, f n2, f n3, ... (el superíndice indica el grado del funtor).

Constantes individuales: a, b, c, ... Variables individuales: x, y, z, ... El vocabulario incluye un número infinito contable de variables proposicionales, predicados, funtores, constantes individuales, variables individuales y signos de puntuación. 2) Reglas de formación Definición de término: i) una constante individual es un término; ii) una variable individual es un término; iii) un funtor n-ádico seguido de n-términos es un término; iv) ninguna otra fórmula es un término. Variables libres y ligadas: una variable individual se llama ligada cuando cae bajo el alcance de un cuantificador. Una variable no cuantificada se llama libre. Así, en la fórmula ∀x (Fxy), x está ligada, pero y está libre. RF1: Toda variable proposicional es una fórmula bien formada (fbf). RF2: Si P n es una constante predicativa n-ádica y t 1…t n son términos, entonces, Pn t1…tn es una fbf. RF3: Si A es una fbf y u es una variable individual, entonces, ∀u A es una fbf.

RF4: Si A y B son fbfs, entonces, ¬ A y (A → B) son fbfs. RF5: Si t1 y t2 son términos, entonces, t1 = t2 es una fbf.

RF6: Sólo son fbfs las cadenas de símbolos que resultan de la aplicación (posiblemente reiterada) de RF1-RF5. Estas son todas las reglas de formación del sistema.

73

JP 057a082-Cap2.QXD:0009

22/5/12

ESTRUCTURA

10:26

Página 74

DE UN SISTEMA AXIOMÁ´TICO

3) Términos definidos Definición de “v”: A v B ↔def ¬ A → B.

Definición de “&”: A & B ↔def ¬ (A → ¬ B).

Definición de “↔”: A ↔ B ↔def ¬ ((A → B) → (¬ (B → A))).

Definición de “∃”: ∃u A ↔def ¬ ∀u ¬ A.

Un lenguaje L construido mediante el vocabulario y las reglas de formación que acabamos de enunciar es un lenguaje de primer orden. 4) Reglas de transformación RT1. A, A → B / B [Modus ponens].

RT2. A → Pu / A → ∀u Pu (u no aparece libre en A.) [Generalización universal]. 5) Axiomas Ax1. A → (B → A).

Ax2. (A → (B → C)) → ((A → B) → (A → C)).

Ax3. (¬ A → ¬ B) → (B → A).

Ax4. (A → Pa) → (A → (∀u) Pu) [a no aparece libre en A]. Ax5: ∀u (Pu → Pa).

Ax6: ∀u (u = u).

Ax7: ∀u ∀w ((u = w) → (Pu → Pw)). 6) Teoremas Entre otras, son teoremas las siguientes fórmulas: T1. ¬ (A & ¬ A).

T2. (A & ¬ A) → B.

T3. A v ¬ A.

T4. A ↔ ¬ ¬ A.

T5. (A → B) ↔ (¬ A v B).

74

JP 057a082-Cap2.QXD:0009

22/5/12

10:26

Página 75

TEORÍ´AS

DE PRIMER ORDEN

T6. (A v B) ↔ ¬ (¬ A & ¬ B).

T7. (A & B) ↔ ¬ (¬ A v ¬ B).

T8. (¬ A → B) → (¬ B → A).

T9. ((A → B) → A) → A.

T10. ∀u A ↔ ¬ ∃u ¬ A.

T11. ∃u A ↔ ¬ ∀u ¬ A.

No daremos la demostración de estos teoremas, que el lector puede intentar por sí mismo. Todos estos teoremas son característicos de la lógica clásica. Los tres primeros son, respectivamente, el principio de no contradicción, el principio fuerte de Pseudo Escoto y el principio de tercero excluido. El hecho de que estas tres fórmulas sean demostrables nos asegura que el sistema no es una lógica no clásica de tipo paraconsistente o paracompleta, en las cuales algunas de estas fórmulas, o todas ellas, no son teoremas. El cuarto teorema es la ley fuerte de doble negación, cuya demostrabilidad asegura que el sistema en cuestión no es una lógica no clásica disminuida, como la lógica minimal o la intuicionista. Tampoco T3, el tercero excluido, es demostrable en ninguna de estas dos lógicas; mientras que T2, el principio fuerte de Pseudo Escoto, es demostrable en la lógica intuicionista, pero no en la minimal. Los restantes teoremas T5 - T11, expresan leyes clásicas de tipo fuerte que no son teoremas en la lógica minimal ni en la intuicionista.

2.6 Teorías de primer orden El sistema axiomático de lógica de primer orden que hemos expuesto, o cualquier otro equivalente, es apto para emplearse como lógica subyacente de una amplia variedad de teorías matemáticas. Toda teoría se formula en un determinado lenguaje L. Cualquier teoría formulada en el lenguaje de la lógica de primer orden con identidad se llama en general teoría de primer orden. Aquí nos interesa caracterizar en particular a las teorías axiomáticas de primer orden. Antes de poder hacerlo es necesario definir las nociones de teoría y de teoría axiomatizable. Ante todo, caracterizaremos la noción de procedimiento efectivo, que será empleada en las definiciones. Un procedimiento efectivo es una receta o conjunto de instrucciones que provee un método mecánico para obtener en un número finito de pasos la respuesta a una pregunta de tipo determinado. En ninguno de los pasos deben aparecer procedimientos aleatorios o azarosos de decisión, tales como arrojar una moneda o cualquier otro de este tipo. Las tablas de verdad en la lógica proposicional, por ejemplo, constituyen un método efectivo

75

JP 057a082-Cap2.QXD:0009

22/5/12

ESTRUCTURA

10:26

Página 76

DE UN SISTEMA AXIOMÁ´TICO

para responder si una fórmula bien formada cualquiera del lenguaje proposicional es una tautología o no lo es. La respuesta concluyente, por sí o por no, se puede obtener siempre en un número finito de pasos, esto es, realizando un número finito de operaciones. En principio, una máquina adecuadamente programada siempre puede ejecutar las operaciones indicadas en un procedimiento efectivo. Al comienzo de este capítulo caracterizamos a una teoría como un conjunto de proposiciones cerrado respecto de la relación de consecuencia lógica. Ahora tenemos que precisar esta idea. En primer lugar, dado un lenguaje formal L, decimos que una teoría formulada en ese lenguaje es una L-teoría. Llamamos (Prop)L al conjunto de todas las proposiciones de L (es decir, fbf que no contienen variables libres). Luego definimos la clausura lógica de un conjunto de proposiciones de la siguiente manera: si G es un conjunto cualquiera de proposiciones de L (es decir, G ⊆ (Prop)L), llamamos clausura lógica de G al conjunto de todas las proposiciones de L que son consecuencia lógica de G. Esto es: Cn(G) =def {χ ∈ (Prop)L : G |= χ}. Ahora podemos dar la siguiente definición de teoría: ◊ Sea L un lenguaje formal. T es una L-teoría si y sólo si T ⊆ (Prop)L y para toda proposición χ ∈ (Prop)L, se cumple que χ ∈ T si y sólo si T |= χ. Utilizando la noción de clausura lógica podemos dar otra definición equivalente: una L-teoría es un conjunto T ⊆ (Prop)L tal que T = Cn(T ). En ambas definiciones expresamos la idea de que una teoría es un conjunto de proposiciones cerrado respecto de la relación de consecuencia lógica. Nos interesa ahora definir una cierta clase de teorías, las teorías axiomatizables: ◊ Una teoría T es axiomatizable si y sólo si cumple con las siguientes condiciones: 1. Hay un subconjunto A de axiomas que está incluido en T (A ⊆ T). 2. El conjunto de las consecuencias lógicas de A es igual a T (Cn(A) = T ). 3. A es decidible. La teoría se dice finitamente axiomatizable, si el conjunto A es finito. De lo contrario, decimos que es infinitamente axiomatizable. En este caso, se debe garantizar independientemente que A sea decidible, es decir, que sea posible deter-

76

JP 057a082-Cap2.QXD:0009

22/5/12

10:26

Página 77

TEORÍ´AS

DE PRIMER ORDEN

minar si una fbf cualquiera χ es o no es un axioma de la teoría T (véase el Capítulo 4.1 para una caracterización más precisa de la decidibilidad). Tal garantía no es necesaria en el primer caso, puesto que siempre se puede decidir en un número finito de pasos si una cierta fbf χ está incluida o no en una lista finita A. S. Kleene probó en 1952 que una clase importante de teorías de primer orden (aquellas que no tienen modelos finitos) siempre son finitamente axiomatizables, si se enriquece adecuadamente su vocabulario original. No obstante, por razones de simplicidad y utilidad, se prefiere con frecuencia presentar a los sistemas axiomáticos de primer orden mediante esquemas de axiomas, o sea, de una manera no finitamente axiomatizable. Ya lo hemos hecho al exponer la lógica de primer orden. En general, si el conjunto de esquemas de axiomas es reducido, no presenta ninguna desventaja respecto de una axiomatización finita de la misma teoría. Una teoría axiomática de primer orden se compone de un número infinito de fórmulas, cada una de las cuales es una secuencia finita de símbolos. Los símbolos y fórmulas de esta clase de teorías deben satisfacer cuatro condiciones de efectividad: a) La noción de símbolo es efectiva, o sea, hay un procedimiento efectivo para decidir si un símbolo cualquiera es o no es un símbolo del lenguaje de la teoría. b) La noción de fórmula bien formada es efectiva, o sea, hay un procedimiento efectivo para decidir si una secuencia finita cualquiera de símbolos es o no una fórmula bien formada. c) La noción de axioma es efectiva, o sea, hay un procedimiento efectivo para decidir si una fórmula cualquiera es o no un axioma. d) La noción de inferencia es efectiva, o sea, hay un procedimiento efectivo para decidir, dada una secuencia finita cualquiera de fórmulas, si cada miembro de la secuencia se puede inferir o no de los precedentes. Para decidir si un símbolo pertenece al lenguaje de una teoría determinada, debemos recurrir a la lista de símbolos que especifica el vocabulario de la teoría y comprobar si ese símbolo pertenece o no a la lista. Para decidir si una secuencia finita de símbolos del lenguaje de la teoría es o no una fórmula bien formada de la teoría, debemos apelar a las reglas de transformación y verificar que esa secuencia de símbolos se puede construir aplicando exclusivamente dichas reglas. Para decidir si una fórmula bien formada de la teoría es un axioma de esa teoría debemos consultar la lista de los axiomas y comprobar si dicha fórmula tiene la misma forma lógica que alguno de los axiomas o esquemas de axiomas. Consultando esta lista podemos decidir siempre si una fórmula bien formada es o no un axioma del sistema. Finalmente, las reglas de transforma-

77

JP 057a082-Cap2.QXD:0009

22/5/12

ESTRUCTURA

10:26

Página 78

DE UN SISTEMA AXIOMÁ´TICO

ción proporcionan un método efectivo para las inferencias (deducciones o demostraciones en el sistema). Dada cualquier secuencia de fórmulas bien formadas siempre es posible decidir si una fórmula se infiere de las precedentes, y, por tanto, si la secuencia constituye una deducción o una demostración de la última fórmula. Todos estos procedimientos se pueden realizar en un número finito de pasos no azarosos y, por tanto, proporcionan métodos efectivos para decidir acerca de los signos, fórmulas, axiomas y teoremas de la teoría. En la práctica usual de los matemáticos la formulación de un sistema axiomático formal en la mayoría de los casos no se hace en un lenguaje formalizado. Cuando el lenguaje es efectivamente formalizado, generalmente no se hace explícito todo su vocabulario y sus reglas de formación, sino que se las presupone conocidas. La parte explícita del sistema axiomático consiste fundamentalmente en una lista de términos primitivos descriptivos específicos del sistema, junto con una lista de axiomas o esquemas de axiomas. Como primer ejemplo de una teoría axiomática de primer orden presentaremos la aritmética de los números naturales de Peano en una versión ligeramente modificada (para la presentación del sistema original, que no incluye el número 0, véase el Apéndice 2.11). La aritmética elemental (Peano 1889). El lenguaje en que se formaliza la teoría es el de la lógica de primer orden con identidad. La lógica subyacente del sistema es la teoría intuitiva de conjuntos. Los términos primitivos específicos son: la constante individual 0 (cero), el predicado monádico N (número natural), y el funtor unario Sx (sucesor de x). Los axiomas del sistema son los siguientes: Ax1. N(0). [Cero es un número natural]. Ax2. ∀x (N(x) → N(Sx)). [El sucesor de un número natural es un número natural]. Ax3. ¬ ∃x (N(x) & 0 = Sx). [Cero no es el sucesor de un número natural]. Ax4. ∀(xy) ((N(x) & N(y) & Sx = Sy) → x = y). [Si dos números naturales tienen el mismo sucesor, entonces, son el mismo número].

78

TEORÍ´AS

Ax5. (ϕ(0) & ∀x (ϕ(x) → ϕ(Sx))) → ∀x ϕ(x).

DE PRIMER ORDEN

[Donde x es la única variable libre que aparece en la fórmula ϕ].

Adviértase que este último axioma es un esquema de axioma. Por consiguiente, la aritmética de Peano no es finitamente axiomatizable cuando se la formula como teoría de primer orden. Si se quiere obtener una axiomatización finita de esta teoría es necesario formularla en un lenguaje de segundo orden, donde se cuantifica el predicado ϕ. El último axioma debe, entonces, reemplazarse por el siguiente: Ax5’. ∀P ((P(0) & ∀x (P(x) → P(Sx))) → ∀x P(x)). La aritmética de Peano es, así, finitamente axiomatizable cuando se la formula como una teoría de segundo orden (Ax1-Ax5’), pero no lo es cuando se la formula como teoría de primer orden (Ax1-Ax5). Tomaremos como segundo ejemplo de teoría axiomática de primer orden a la teoría de la geometría elemental axiomatizada por A. Tarski en 1959 y presentada en su artículo “¿Qué es la geometría elemental?” (en Henkin, Suppes y Tarski 1959). Se trata de un sistema axiomático simple y elegante que permite deducir un fragmento de la geometría euclídea tradicionalmente identificado como geometría elemental. Tarski considera elemental a aquella parte de la geometría euclídea que puede formalizarse y desarrollarse sin apelar a recursos de la teoría de conjuntos. La geometría elemental (Tarski 1959). La lógica subyacente del sistema es la lógica de predicados de primer orden con identidad. Las variables individuales del sistema, x, y, z,… recorren elementos de un conjunto fijo, el espacio, que se denominan puntos. Los términos primitivos específicos de la teoría, las constantes descriptivas, son dos predicados relacionales: el predicado triádico β que denota la relación de ‘estar entre’, y el predicado tetrádico δ que denota la relación de equidistancia entre puntos. Empleando estos símbolos son fórmulas bien formadas del sistema β(xyz), que se lee como ‘y está entre x y z’, y δ(xyuz), que se lee como ‘x es tan distante de y como u de z’. Los axiomas del sistema son los siguientes:

79

JP 057a082-Cap2.QXD:0009

22/5/12

ESTRUCTURA

10:26

Página 80

DE UN SISTEMA AXIOMÁ´TICO

Ax1. Axioma de identidad para estar entre: ∀(xy) (β(xyx) → (x = y)). Ax2. Axioma de transitividad para estar entre: ∀(xyzu) (β(xyu) & β(yzu) → β(xyz)). Ax3. Axioma de conectividad para estar entre:

∀(xyzu) (β(xyz) & β(xyu) & (x ≠ y) → β(xzu) v β(xuz)).

Ax4. Axioma de reflexividad para la equidistancia: ∀(xy) ((δ(xyyx)). Ax5. Axioma de identidad para la equidistancia: ∀(xyz) (δ(xyzz) → (x = y)). Ax6. Axioma de transitividad para la equidistancia: ∀(xyzuvw) (δ(xyzu) & δ(xyvw) → δ(zuvw)). Ax7. Axioma de Pasch: ∀(txyzu) ∃(v) (β(xtu) & β(yuz) → β(xvy) & β(ztv)). Ax8. Axioma de Euclides: ∀(txyzu) ∃(vw) (β(xut) & β(yuz) & (x ≠ u) → β(xzv) & β(xyw) & β(vtw)). Ax9. Axioma de los cinco segmentos: ∀(xx’yy’zz’uu’) (δ(xyx’y’) & δ(yzy’z’) & δ(xux’u’) & δ(yuy’u’) & β(xyz) & β(x’y’z’) & (x ≠ y) → δ(zuz’u’)). Ax10. Axioma de construcción del segmento: ∀(xyuv) ∃(z) (β(xyz) & δ(yzuv)). Ax11. Axioma de la dimensión inferior: ∃(xyz) (¬β(xyz) & ¬β(yzx) & ¬β(zxy)).

80

JP 057a082-Cap2.QXD:0009

22/5/12

10:26

Página 81

TEORÍ´AS

DE PRIMER ORDEN

Ax12. Axioma de la dimensión superior:

∀(xyzuv) (δ(xuxv) & δ(yuyv) & δ(zuzv) & (u ≠ v) → β(xyz) v β(yzx) v β(zxy)).

Ax13. Axioma esquema de continuidad elemental: ∀(vw…) (∃(z) ∀(xy) (χ & ψ → β(zxy)) → ∃(u) ∀(xy) (χ & ψ → β(xuy))). [Donde χ representa una fórmula cualquiera en la cual las variables x, v, w,… aparecen libres, pero y, z, u no aparecen libres; y lo mismo para ψ, con x e y intercambiadas.] En el trabajo donde expone estos axiomas, Tarski también demuestra que su sistema de geometría elemental es consistente, completo y decidible, pero no finitamente axiomatizable, puesto que emplea un esquema de axioma. Existen muchas teorías matemáticas importantes que se pueden axiomatizar en el lenguaje de la lógica de primer orden. Hay que tener en cuenta, sin embargo, dos limitaciones importantes del proceso de axiomatización: 1. No toda teoría matemática axiomatizable se puede axiomatizar mediante la lógica de primer orden, algunas requieren el uso de lógica de segundo orden o de órdenes superiores. 2. No toda teoría axiomatizable en primer orden es finitamente axiomatizable, algunas teorías de primer orden sólo se pueden axiomatizar mediante esquemas de axiomas, es decir, empleando un número infinito de axiomas. Toda teoría contiene un número infinito de proposiciones (en particular, toda teoría contiene a todas las tautologías de la lógica de primer orden, que son deducibles del conjunto vacío). La definición de teoría axiomatizable que hemos ofrecido admite el caso en el cual A = T, esto es, el conjunto de los axiomas de la teoría es idéntico al de sus teoremas. Esta clase de axiomatización no es necesariamente trivial, porque, en ese caso, la teoría debería ser decidible (dado que la base axiomática A debe ser decidible). De todos modos, una teoría así axiomatizada no es particularmente útil. Las axiomatizaciones razonablemente útiles de una teoría son aquellas en las que A ⊂ T. Entre ellas, son especialmente interesantes aquellas en las que A es finito, y más aun, aquellas en las que A consta de un número muy reducido de proposiciones. En el caso ideal, A contiene un único axioma que es simple y fácilmente intuible. Un conjunto finito y reducido de axiomas simples y suficientes para axiomatizar una teoría proporciona la máxima economía de pensamiento en un sistema axiomático. Pero, como hemos de ver, sabemos que este ideal no siempre es realizable.

81

JP 057a082-Cap2.QXD:0009

22/5/12

ESTRUCTURA

10:26

Página 82

DE UN SISTEMA AXIOMÁ´TICO

Por lo demás, a menudo no se sabe cómo axiomatizar una teoría previamente disponible de manera no axiomática. La axiomatización eficaz y simple de una teoría ya conocida es siempre un descubrimiento científico notable.

Notas bibliográficas Descripciones breves del método axiomático, con distinto grado de tecnicidad y a veces con terminologías diferentes, se pueden encontrar en: Carnap (1958); Church (1956); Mates (1972); Tarski (1994); Torretti (1993) y Wang (1962). Mayores detalles y ejemplos en: Beth (1965); Schoenfield (1967); Stoll (1979) y Wilder (1965). Klimovsky y Boido (2005) ofrecen una presentación no técnica muy clara y amplia. Blanché (1955) y De Lorenzo (1980) son dos obras dedicadas al método axiomático que incluyen diferentes reflexiones filosóficas. Cavaillès (1938) es más avanzado y todavía útil, pero ya desactualizado. Hilbert y Ackermann (1959) y Lukasiewicz (1963) son ejemplos clásicos del enfoque axiomático de la lógica de primer orden. Dopp (1965) incluye una colección enciclopédica de más de 50 sistemas axiomáticos de lógica proposicional formulados hasta 1965. Epstein (1995) hace lo propio con una amplia variedad de lógicas no clásicas: modales, intuicionistas, polivalentes, paraconsistentes y otras. Sobre lógicas no clásicas debe consultarse también la obra de Priest (2001).

82

JP 083a096-Cap3.QXD:0009

22/5/12

10:32

3

Página 83

La interpretación de un sistema axiomático

3.1 Introducción n sistema axiomático formal no es un conjunto de enunciados significativos, sino de proposiciones formales que carecen de significado. Cuando se da significado a los términos de un sistema axiomático formal se dice que se ofrece una interpretación de ese sistema. El sistema pasa a ser, entonces, un sistema semántico o interpretado. Un sistema formal no interpretado es puramente sintáctico. Establece meras relaciones entre símbolos que no tienen significado, sino que sólo pertenecen a ciertas categorías lógicas o gramaticales. Por consiguiente, no se refiere a ningún tipo de objetos ni hace afirmación alguna acerca de la realidad. Las proposiciones formales que lo componen no son verdaderas ni falsas, simplemente carecen de valor de verdad. Un sistema interpretado, en cambio, se compone de proposiciones significativas que se refieren a un determinado ámbito de objetos concretos o abstractos. Las proposiciones de dicho sistema hacen afirmaciones acerca de esos objetos y tales afirmaciones tienen un valor de verdad, son verdaderas o falsas respecto de esos mismos objetos. Las proposiciones formales de un sistema formal pueden resultar proposiciones verdaderas o falsas cuando se da una determinada interpretación de ese sistema. Un mismo sistema formal admite muchas interpretaciones. Sólo algunas de estas interpretaciones tendrán la característica de que todos los teoremas del sistema resulten verdaderos en esa interpretación. A esta clase de interpretaciones se las denomina modelos. En el caso de los sistemas axiomáticos, los modelos de un sistema son las interpretaciones bajo las cuales resultan verdaderos todos los axiomas del sistema (y, en consecuencia, también todos los teoremas). Un sistema formal interpretado que tiene un modelo se puede considerar como una teoría (provisoriamente) verdadera acerca de un ámbito de la realidad. Un sistema formal no interpretado, en cambio, no es por sí mismo una teoría fáctica que haga afirmaciones acerca de la realidad.

U

Consideremos con más detalle estas nociones.

83

JP 083a096-Cap3.QXD:0009

22/5/12

INTERPRETACIÓ´N

10:32

Página 84

DE UN SISTEMA AXIOMÁ´TICO

3.2 Los conceptos de interpretación y modelo Comencemos por caracterizar de manera informal el concepto de interpretación. ◊ Una interpretación de un sistema axiomático S es una asignación de significado a los términos primitivos de S. Esta es una caracterización muy vaga hasta tanto no se precise el concepto de significado. Ante todo, por significado de un término entenderemos exclusivamente la referencia o denotación de ese término. Así, el significado de un término dado será la entidad o conjunto de entidades a los cuales se aplica dicho término. Una interpretación, pues, fija la extensión de cada término primitivo de un sistema axiomático. La manera de asignar significado a los términos de un sistema formal consiste en introducir una función interpretación (a la que llamaremos I). La interpretación es una función que asigna un solo significado a cada término primitivo de un sistema S. No es posible asignar dos o más significados a un mismo término primitivo, ni tampoco, en el marco de la semántica clásica, dejar a alguno de ellos sin significado. Además, cada significado debe estar asignado de manera precisa, de modo que el significado de cada término primitivo se distinga claramente del significado de los restantes primitivos. Es posible, sin embargo, que una interpretación asigne el mismo significado a dos o más términos diferentes (o sea, la interpretación admite que haya términos que son sinónimos). Una vez que se ha dado significado a los términos primitivos de un sistema, automáticamente adquieren significado todos los restantes términos y fórmulas del sistema, que no son otra cosa que agrupaciones de términos primitivos conectados entre sí por símbolos lógicos y de puntuación. Cuando se interpreta un sistema axiomático formal sus axiomas y teoremas dejan de ser proposiciones formales y se convierten en proposiciones significativas, que como tales tienen valor de verdad. En un sistema interpretado cada proposición es verdadera o falsa. En cambio las proposiciones formales de un sistema formal carecen de significado y por consiguiente no tienen valor de verdad, esto es, no pueden ser verdaderas ni falsas. Un sistema interpretado deja de ser un sistema puramente sintáctico y se convierte en un sistema semántico o significativo. Para fijar la extensión de los términos de un sistema formal se delimita un dominio de objetos o entidades, el conjunto no vacío D, y se determina la referencia de cada término primitivo de S respecto de los objetos del dominio D. Esto es precisamente lo que hace la función interpretación I. La asignación de significado debe respetar la categoría lógica y gramatical de los términos primitivos de S. De este modo, la interpretación hace corresponder individuos u ob-

84

JP 083a096-Cap3.QXD:0009

22/5/12

10:32

Página 85

LOS

CONCEPTOS DE INTERPRETACIÓ´N Y MODELO

jetos singulares a los términos singulares, propiedades a los predicados monádicos, relaciones a los predicados poliádicos y funciones a los funtores. Una interpretación de un sistema formal puede verse como un diccionario que establece los significados para cada uno de los términos primitivos del sistema. Es importante insistir en el hecho de que toda interpretación es extensional y, por tanto, determina solamente una de las dimensiones del significado, la referencia o extensión de los términos. La extensión de un término está constituida por todos los objetos a los que se aplica ese término. En el caso de los lenguajes formales la categoría lógico-gramatical de cada término determinará diferentes tipos de extensiones. Así, la extensión de cada término singular será un individuo u objeto; la extensión de cada predicado monádico será un conjuntos de objetos; la de cada predicado díadico será un conjunto de pares ordenados de objetos; y, en general, la de cada predicado n-ádico será un conjunto de n-tuplas (un conjunto ordenado) de objetos. Por último, la extensión de cada funtor de grado n será un conjunto de pares ordenados de n-tuplas de objetos y un objeto del dominio. Podemos, entonces, definir más precisamente a la interpretación de un sistema formal de la siguiente manera: ◊ Una interpretación de un sistema axiomático S es un conjunto ordenado 〈D, I 〉, donde el dominio D es un conjunto no vacío de objetos cualesquiera, y la función interpretación I es una función tal que: 1. I asigna a cada símbolo proposicional del lenguaje de S un valor veritativo (verdadero o falso, pero no ambos). 2. I asigna a cada constante individual del lenguaje de S un objeto del dominio D. 3. I asigna a cada predicado n-ádico del lenguaje de S una relación n-ádica definida sobre objetos del dominio D (un conjunto de n-tuplas de objetos del dominio D). 4. I asigna a cada funtor del lenguaje de S una función que tenga argumentos y valores en el dominio D (pares ordenados de objetos 〈a,b〉, si es un funtor de grado 1; pares ordenados de pares ordenados de objetos y objetos 〈〈a,b〉, c〉, si es un funtor de grado 2; y, en general, pares ordenados de n-tuplas de objetos y objetos, si es un funtor de grado n). Las conectivas lógicas reciben su significado habitual en la lógica clásica, y también los cuantificadores, que se consideran referidos exclusivamente al dominio de interpretación D. Aquí no consideraremos fórmulas con variables libres, cuyo procedimiento de interpretación es más complicado y se basa en la

85

JP 083a096-Cap3.QXD:0009

22/5/12

INTERPRETACIÓ´N

10:32

Página 86

DE UN SISTEMA AXIOMÁ´TICO

noción de satisfacción de una fórmula por una secuencia contable de objetos. El procedimiento completo se puede encontrar en los textos corrientes de lógica y teoría de modelos, como los que se citan al final del capítulo. La interpretación de un sistema formal proporciona un conjunto de proposiciones significativas, cuyos términos carecen de toda ambigüedad y vaguedad, características de los lenguajes naturales. La función interpretación asigna a cada término primitivo del sistema un único significado, eliminando de este modo cualquier ambigüedad. Además, este significado está precisamente determinado, por lo que para cualquier objeto del dominio se puede decidir concluyentemente si tiene o no una cierta propiedad o relación con otros objetos, es decir, si se le aplica o no un cierto predicado del lenguaje del sistema. De esta manera, desaparece toda posible vaguedad del significado de los términos. Esta es la diferencia esencial que el lenguaje de un sistema formal interpretado tiene sobre los lenguajes naturales. Para los fines del conocimiento científico, esto constituye también una importante ventaja. Caractericemos ahora el concepto de modelo. ◊ Un modelo de un sistema axiomático S es una interpretación de S respecto de la cual todos los axiomas de S son verdaderos. El hecho de que los axiomas sean verdaderos en un modelo garantiza que también todos los teoremas serán verdaderos en ese modelo, ya que éstos son proposiciones que se deducen de los axiomas, y la deducción asegura la transmisión de la verdad de las premisas a la conclusión. No toda interpretación de un sistema es un modelo de ese sistema. Algunas interpretaciones no hacen verdaderos a todos los axiomas. Basta que un solo axioma de S no sea verdadero bajo una interpretación I para establecer que I no es un modelo de S. La noción de modelo se emplea habitualmente para definir el concepto de consecuencia lógica entre oraciones. ◊ Una oración Φ es consecuencia lógica de un conjunto de oraciones Γ si y sólo si Φ es verdadera en todo modelo de Γ. Este es el llamado concepto modelo-teórico de consecuencia lógica, que se aplica, en sentido estricto, a proposiciones. Otra manera usual de expresar la misma idea consiste en decir que Φ es consecuencia lógica de Γ si y sólo si todo modelo de Γ es también un modelo de Φ. En el caso de un sistema axio86

JP 083a096-Cap3.QXD:0009

22/5/12

10:32

Página 87

INTERPRETACIONES

Y MODELOS DE LA TEORÍ´A DE GRUPOS

mático, la definición afirma que una proposición Φ, que pertenece a un sistema S, es consecuencia lógica de los axiomas de S si y sólo si Φ verdadera en todo modelo de S. Si las reglas de transformación empleadas en un sistema son correctas, todos los teoremas deducidos de los axiomas serán consecuencia lógica de ellos. Así, los teoremas de un sistema axiomático S resultan proposiciones verdaderas en todo modelo de S. Por consiguiente, si encontramos alguna proposición del lenguaje de S que no es verdadera en al menos algún modelo de S, sabemos, entonces, que esa proposición no es un teorema en S. Existe otro concepto de consecuencia lógica, llamado consecuencia demostrativa, que se aplica a las fórmulas de un sistema formal y que, por tanto, no emplea la noción de modelo. ◊ Si S es un sistema axiomático formal formulado en un lenguaje L, Γ es un conjunto de fórmulas bien formadas de L, y Φ es una fórmula bien formada de L, entonces, Φ es una consecuencia lógica de Γ si Φ es deducible de Γ en S, esto es, si es posible inferir Φ de Γ mediante las reglas de transformación del sistema S. En un sistema axiomático formal S las consecuencias lógicas del sistema son, pues, todas las fórmulas bien formadas que son deducibles de los axiomas de S, esto es, todos los teoremas demostrables en S. En principio, los conceptos demostrativo y modelo-teórico de consecuencia lógica son independientes entre sí. Para un sistema axiomático formal no interpretado, es necesario apelar al concepto de consecuencia demostrativa; para los sistemas interpretados, en cambio, podemos emplear también el concepto modelo-teórico, o semántico, de consecuencia.

3.3 Interpretaciones y modelos de la teoría de grupos La existencia de diferentes interpretaciones para un sistema axiomático formal se puede ejemplificar de manera muy adecuada mediante la teoría de grupos, una teoría de álgebra abstracta con numerosas aplicaciones tanto en la matemática como en la física. Un grupo está constituido por un conjunto C de objetos cualesquiera, en el que se ha distinguido un elemento neutro y se ha definido una operación binaria que a cada par ordenado 〈a, b〉 de elementos de C le asigna un elemento de C, llamado el producto de a y b (habitualmente, esto se escribe como: C x C → C). El elemento neutro y la operación binaria deben cumplir las condiciones enunciadas en los axiomas. Todo esto se puede expresar en el lenguaje formalizado de la lógica de primer orden con identidad. Es

87

JP 083a096-Cap3.QXD:0009

22/5/12

INTERPRETACIÓ´N

10:32

Página 88

DE UN SISTEMA AXIOMÁ´TICO

necesario elegir una constante individual (por ejemplo, e) para designar al elemento neutro y un funtor de grado 2 (por ejemplo, ƒ1) para nombrar a la operación binaria. Para facilitar la lectura, designaré al elemento neutro con el símbolo “n” y escribiré “x * y”, en vez de “ƒ1 xy”. Podemos ahora definir el concepto de grupo de la siguiente manera: ◊ Dado un conjunto de elementos cualesquiera C, una operación binaria * sobre los elementos de C, y un elemento distinguido de C (el elemento neutro n), G = 〈C, *, n〉 es un grupo si y sólo si satisface los siguientes axiomas: Ax1. ∀(xy) ∃z (x * y = z)

[Clausura de la operación *].

Ax2. ∀(xyz) (((x * y) * z) = (x * (y * z)))

[Asociatividad de la operación *].

Ax3. ∀x ((x * n = x) & (n * x = x))

[Existencia de un elemento neutro].

Ax4. ∀x ∃y ((x * y = n) & (y * x = n))

[Existencia de un elemento inverso para cada elemento de C].

A partir de estos axiomas se puede demostrar un teorema que afirma que el inverso de cada elemento, cuya existencia se postula en el Ax4, es único. Un grupo se llama conmutativo o abeliano si además satisface el siguiente axioma: Ax5. ∀(xy) ((x * y) = (y * x))

[Conmutatividad de la operación *].

Una manera más económica de definir un grupo, usada habitualmente en los textos de lógica, permite emplear menos términos primitivos y axiomas. ◊ Dado un conjunto de elementos cualesquiera C y una operación binaria * sobre los elementos de C, G = 〈C, *〉 es un grupo si y sólo si, satisface los siguientes axiomas: Ax1. ∀(xyz) (((x * y) * z) = (x * (y * z))). Ax2. ∀(xy) ∃z ((x * z = y)). Ax3. ∀(xy) ∃z ((z * x = y)).

88

JP 083a096-Cap3.QXD:0009

22/5/12

10:32

Página 89

INTERPRETACIONES

Y MODELOS DE LA TEORÍ´A DE GRUPOS

Si se adopta esta axiomatización, es necesario probar como teoremas la existencia del elemento neutro n y del elemento inverso único para cada elemento. Ambas axiomatizaciones son equivalentes, pero en nuestros ejemplos de interpretaciones de la teoría de grupos emplearemos la primera, que es la más común en los libros de texto de álgebra. Cualquier estructura que satisfaga los axiomas Ax1-Ax4 es un grupo. Es sencillo dar una interpretación de este sistema axiomático, pues solamente hay que dar significado a los términos primitivos C, *, y n, es decir, hay que designar un conjunto de elementos como referente de C, una operación binaria como referente de * y un elemento distinguido de C como referente del elemento neutro n. Ofreceremos tres interpretaciones diferentes de este sistema y verificaremos en cada caso si los axiomas resultan verdaderos bajo cada una de las interpretaciones. Interpretación 1: En primer lugar, designamos como referente de C al conjunto ⺞ de los números naturales (los enteros positivos) incluyendo el cero, de modo que ⺞ = {0, 1, 2, 3,...}. Luego establecemos como referente de * a la operación de suma (+) entre números naturales. Finalmente, designamos al número 0 como referente del elemento neutro. Nuestra primera interpretación es entonces I1 = 〈⺞, +, 0〉. Podemos verificar que I1 no es un modelo de la teoría de grupos porque no hace verdaderos a todos los axiomas simultáneamente. Ax1, Ax2 y Ax3 resultan verdaderos: la suma entre dos números naturales siempre es otro número natural (Ax1); la suma entre números naturales es asociativa (Ax2); y existe un elemento neutro, el cero, tal que sumado a cualquier número el resultado es igual a ese número (Ax3). Sin embargo, Ax4, el último axioma, no es verdadero en esta interpretación, porque los números naturales no tienen inverso. No hay para cada número natural otro número natural tal que sumado a éste el resultado sea cero, el elemento neutro. Esta interpretación no es un modelo de la teoría de grupos y, por consiguiente los números naturales con la operación suma no forman un grupo. Interpretación 2: I2 = 〈⺞, –, 0〉, o sea, el conjunto de los números naturales con la operación resta y el número cero. I2 tampoco es un modelo de la teoría de grupos porque no hace verdadero a Ax1, el primer axioma. En efecto, la resta entre números naturales no cumple con la clausura o cierre, porque el resultado de restar dos números naturales no siempre es un número natural. Si restamos 3 – 5, el resultado es -2 que no es un número natural, sino un número negativo. Basta que un solo axioma de un sistema no sea verdadero bajo una interpretación para probar que dicha interpretación no es un modelo de ese sistema. El lector puede comprobar por su cuenta cuáles de los restantes axiomas

89

JP 083a096-Cap3.QXD:0009

22/5/12

INTERPRETACIÓ´N

10:32

Página 90

DE UN SISTEMA AXIOMÁ´TICO

Ax2 - Ax4 resultan falsos dada la interpretación I2. Interpretación 3: I3 = 〈⺪, +, 0〉. C tiene ahora como referente al conjunto de los números enteros, es decir ⺪ = {0, 1, -1, 2, -2,...}. Esta interpretación hace verdaderos a todos los axiomas de la teoría de grupos, y constituye por consiguiente un modelo de dicha teoría. La suma entre números enteros es cerrada (Ax1); es asociativa (Ax2); existe un elemento neutro, el cero, (Ax3); y, por último, también hay en el conjunto de los enteros un elemento inverso para cada número entero (Ax4). El inverso de cada entero es el correspondiente número entero con el signo opuesto, el de 4 es -4; el de -99 es 99, y así sucesivamente. Se puede comprobar fácilmente, por ejemplo, que 4 + (-4) = -4 + 4 = 0. Los números enteros con la operación suma forman un grupo que constituye un modelo de la teoría de grupos. Observemos que también forman un grupo abeliano, porque la operación suma es conmutativa (Ax5). La teoría de los grupos es una rama del álgebra abstracta que tiene amplias aplicaciones en el campo de la física. Constituye la estructura matemática subyacente del concepto de simetría, el cual es uno de los conceptos claves para comprender las leyes físicas. No debe pensarse que los axiomas de la teoría de grupos se pueden interpretar solamente en el ámbito de las teorías matemáticas. El conjunto C contiene elementos cualesquiera que no tienen por qué ser números u objetos matemáticos, ni la operación * una operación entre este tipo de objetos. La teoría de grupos admite diversas interpretaciones físicas, en las cuales el dominio de la interpretación es un conjunto de objetos físicos y la operación * se refiere a alguna transformación aplicada a esos objetos físicos. Esta clase de interpretación es especialmente importante en la física de partículas elementales, donde la teoría de grupos permitió el descubrimiento de muchas leyes físicas novedosas. La teoría de grupos también tiene muchos otros modelos físicos, como ocurre, por ejemplo, en los campos de la cristalografía y la espectroscopía. Todo esto nos muestra las múltiples posibilidades de interpretación de un sistema axiomático. Las interpretaciones pueden referirse a objetos de muy diferente naturaleza, abstractos o concretos, físicos o no físicos. Algunas interpretaciones que sean modelos de un sistema axiomático ya conocido pueden ser completamente inesperadas, como ocurrió en el caso de la aplicación de la teoría de grupos a la física de partículas. Un sistema formal que tiene un modelo tiene en general infinitos modelos, concretos y abstractos, pero ello no implica que podemos conocerlos (nada nos garantiza que podamos hallar siquiera uno de ellos), ni que sea fácil descubrir modelos interesantes de una teoría. Por esta razón, el hecho de encontrar un nuevo modelo de una teoría formal constituye por sí mismo un auténtico descubrimiento científico.

90

JP 083a096-Cap3.QXD:0009

22/5/12

10:32

Página 91

INTERPRETACIONES

Y MODELOS DE LA TEORÍ´A DE LOS ANILLOS

3.4 Interpretaciones y modelos de la teoría de los anillos Otra teoría algebraica axiomatizada es la teoría de los anillos, que puede concebirse como una extensión de la teoría de grupos. En efecto, la teoría de los anillos se obtiene agregando nuevos axiomas a los de la teoría de grupos. Aquí tenemos como términos primitivos a un conjunto C de elementos cualesquiera, a dos funtores que denotan operaciones binarias * y # entre los elementos de C, y a dos elementos distinguidos de C, n y m, que son dos elementos neutros diferentes. La lógica subyacente será también la lógica de primer orden con identidad, y emplearemos las mismas convenciones de notación que utilizamos para la teoría de grupos. Una definición de anillo es la siguiente: ◊ Dado un conjunto de elementos cualesquiera C, dos operaciones binarias * y # sobre los elementos de C y dos elementos distinguidos de C, n y m, A = 〈C, *, #, n, m〉 es un anillo si y sólo si satisface los siguientes axiomas: Ax1. ∀(xy) ∃z (x * y = z)

[Clausura de la operación *].

Ax2. ∀(xyz) (((x * y) * z) = (x * (y * z)))

[Asociatividad de la operación *].

Ax3. ∀x ((x * n = x) & (n * x = x)) Ax4. ∀x ∃y ((x * y = n) & (y * x = n)) Ax5. ∀(xy) ((x * y) = (y * x))

[Existencia de un elemento neutro para la operación *]. [Existencia de un elemento inverso para cada elemento de C]. [Conmutatividad de la operación *].

Ax6. ∀(xy) ∃z (x # y = z)

[Clausura de la operación #].

Ax7. ∀(xyz) (((x # y) # z) = (x # (y # z)))

[Asociatividad de la operación #].

Ax8. ∀x ((x # m = x) & (m # x = x)) Ax9. ∀(xyz) (((x # (y * z)) = = ((x # y) * (x # z))) & (((y * z) # x) = = ((y # x) * (z # x))))

[Existencia de un elemento neutro para la operación #]. [Distributividad de la operación # respecto de la operación *].

91

JP 083a096-Cap3.QXD:0009

22/5/12

INTERPRETACIÓ´N

10:32

Página 92

DE UN SISTEMA AXIOMÁ´TICO

Los primeros cuatro axiomas son los de la teoría de grupos. Ax5 establece que la operación * es conmutativa, y por tanto, que se trata de una teoría de grupos abelianos. Los axiomas Ax6 y Ax7 introducen la nueva operación # determinando que es cerrada y asociativa. Ax8 afirma la existencia del elemento neutro. El axioma Ax9 enuncia la propiedad distributiva de la operación # respecto de la operación *. Este axioma tiene dos partes porque la teoría de los anillos no establece que la operación # sea conmutativa, por tanto, la operación # por la izquierda no es la misma que la operación # por la derecha. Un anillo se llama anillo conmutativo si además satisface el siguiente axioma: Ax10. ∀(xy) ((x # y) = (y # x))

[Conmutatividad de la operación #].

La interpretación de la teoría de los anillos también es simple. En este caso tenemos que asignar referentes al conjunto C, a las dos operaciones * y # y a los dos elementos distinguidos n y m. Daremos dos interpretaciones diferentes de esta teoría y comprobaremos si constituyen o no modelos. Interpretación 1: I1 = 〈⺞, +, x, 0, 1〉. Aquí C es el conjunto de los números naturales y las dos operaciones son la suma y la multiplicación, respectivamente. Los elementos distinguidos son el número cero y el número uno. Podemos comprobar fácilmente que esta interpretación no es un modelo del sistema axiomático de los anillos porque no hace verdaderos a todos los axiomas. El axioma Ax4 resulta falso. Todos los restantes son verdaderos bajo esta interpretación. Interpretación 2: I2 = 〈⺪, +, x, 0, 1〉. C es ahora el conjunto de los números enteros, las dos operaciones la suma y la multiplicación, y los dos elementos distinguidos el número cero y el número uno. El lector podrá verificar que bajo esta interpretación todos los axiomas de la teoría de los anillos son verdaderos. Tenemos por consiguiente un modelo de este sistema formal abstracto. Los números enteros con las operaciones de suma y multiplicación forman, pues, un modelo de la teoría de los anillos. También el axioma Ax10 resulta verdadero, por lo que el sistema es un anillo conmutativo. Si observamos los axiomas de las teorías de grupos, de grupos abelianos y de anillos, advertiremos que todo anillo es un grupo abeliano, y que todo grupo abeliano es un grupo. Las relaciones inversas no son válidas, pues no todo grupo es un grupo abeliano, ni todo grupo abeliano es un anillo. Teniendo en cuenta estas relaciones podemos deducir que si una interpretación no constituye un modelo de la teoría de grupos, tampoco lo será de la teoría de los ani-

92

JP 083a096-Cap3.QXD:0009

22/5/12

10:32

Página 93

ESTRUCTURAS

Y MODELOS

llos. Este es el caso de I1 en nuestros ejemplos de interpretación de la teoría de grupos y de anillos.

3.5 Estructuras y modelos Definiremos ahora el concepto de isomorfismo entre modelos. Para ello es necesario definir primero el concepto de estructura. El término estructura tiene muchos significados diferentes, incluso dentro del ámbito de la lógica o la matemática. Aquí sólo nos interesa uno de esos sentidos, según el cual se llama estructura a un conjunto ordenado que consta de los siguientes elementos: i) un conjunto no vacío de elementos cualesquiera, al que denominaremos D; ii) una familia de relaciones definidas sobre los elementos de D; iii) una familia de funciones definidas sobre los elementos de D; y iv) algunos individuos distinguidos del conjunto D. El conjunto de objetos D es el dominio o universo de la estructura. Una estructura puede tener más de un dominio, pero aquí no consideraremos ese caso. Cualquier subconjunto de elementos de D es una propiedad o relación monádica en el dominio D. En general, cualquier subconjunto de D x D x D x...x D (o sea, cualquier conjunto de n-tuplas de elementos de D) es una relación nádica en D. Además, cualquier aplicación de D en D (D → D) es una función en D. Finalmente, cualesquiera elementos de D que distingamos son individuos distinguidos en D. Una estructura E estará formada, entonces, por todas las relaciones, R1...Rn, distinguidas en el dominio D, todas las funciones ƒ1... ƒn distinguidas en D, y todos los individuos a1...al distinguidos en D. Por cierto, no todos estos elementos deben estar conjuntamente presentes en toda estructura. Una estructura requiere al menos un dominio y al menos una relación o función o individuo distinguido en ese dominio. Podemos ahora dar una definición formal de estructura: ◊ E = 〈D, R1...Rn, ƒ1... ƒm, a1...al〉 es una estructura si y sólo si: 1. D ≠ ∅.

2. Ri ⊆ Dr (donde 1 ≤ i ≤ n, y r es un número entero positivo que depende de i). 3. ƒj : Ds → D (donde 1 ≤ j ≤ m, y s es un número entero positivo que depende de j). 4. ak ∈ D (donde 1 ≤ k ≤ l).

93

JP 083a096-Cap3.QXD:0009

22/5/12

INTERPRETACIÓ´N

10:32

Página 94

DE UN SISTEMA AXIOMÁ´TICO

Caractericemos ahora el concepto de isomorfismo entre estructuras. El isomorfismo es una relación que se da entre estructuras que son similares entre sí. Decimos que dos estructuras son similares cuando tienen el mismo número de dominios, relaciones n-ádicas, funciones n-ádicas e individuos distinguidos. Por ejemplo, las estructuras E1 = 〈D1, R2〉 y E2 = 〈D2, S2〉 son similares porque ambas tienen un solo dominio, una relación binaria (el grado de la relación lo indica el superíndice) y no tienen funciones ni individuos distinguidos. En cambio, las estructuras E3 = 〈D3, R2, ƒ3〉 y E4 = 〈D4, S2 h2, b〉 no son similares porque una posee una función ternaria (el grado de la función lo indica el superíndice) y no tiene individuos distinguidos, mientras que la otra posee una función binaria y un elemento distinguido. Si dos estructuras no son similares, no pueden ser isomorfas. Pero no todo par de estructuras similares son isomorfas. Dos estructuras similares son isomorfas si además cumplen ciertas condiciones: ◊ Dos estructuras similares E1 = 〈D1, R1...Rn, ƒ1... ƒm, a1...al〉 y E2 = 〈D2, S1...Sn, h1... hm, b1...bl〉 son isomorfas si y solo si hay una función f tal que: 1. f es una función biyectiva de D1 en D2 (f: D1 → D2).

2. Para todo x1...xr ∈ D1: 〈x1...xr〉 ∈ Ri si y sólo si 〈f (x1)... f (xr)〉 ∈ Si (donde 1 ≤ i ≥ n, y r es el número ario de Ri).

3. Para todo x1...xr ∈ D1: f (ƒj (x1...xr)) = hj (f (x1)... f (xr)) (donde 1 ≤ j ≤ m, y r es el número ario de ƒj). 4. f (ak) = bk (donde 1 ≤ k ≤ l).

 La relación de isomorfismo entre estructuras es una relación de equivalencia, o sea, es reflexiva, simétrica y transitiva. El concepto de isomorfismo entre estructuras, que hemos definido antes de manera general, se aplica igualmente a todas las interpretaciones y modelos de un sistema axiomático, ya que éstos no son más que cierta clase de estructuras. Un modelo M de un sistema axiomático S es una estructura respecto de la cual todos los axiomas de S son verdaderos. Dos modelos M1 y M2 de un sistema axiomático S son isomorfos cuando existe una aplicación biyectiva entre sus dominios y todo enunciado de S es verdadero en M1 si y sólo si es verdadero en M2. Observemos que toda estructura, y por consiguiente todo modelo, es un conjunto, es decir, una entidad abstracta. El homomorfismo es una relación más débil entre estructuras o modelos. Satisface las mismas condiciones que el isomorfismo, con excepción de la primera, ya que la función f: D1 → D2 no necesita ser biyectiva. Así, todo isomorfismo es también un homomorfismo, pero no a la inversa. 94

JP 083a096-Cap3.QXD:0009

22/5/12

10:32

Página 95

ESTRUCTURAS

Y MODELOS

La teoría de los modelos constituye una de las ramas más desarrolladas y técnicas de la lógica contemporánea. Muchos de los resultados que se han obtenido en este campo tienen importantes aplicaciones en la metateoría de la lógica y de la matemática, así como interesantes consecuencias epistemológicas y filosóficas. Aquí no podemos exponer con detalle estos temas (el lector interesado puede consultar las obras citadas en la nota bibliográfica al final de este capítulo). Nos limitaremos a mencionar dos metateoremas especialmente importantes. El primer resultado fundamental es el llamado teorema de Löwenheim-Skolem, cuya demostración tiene una larga historia. L. Löwenheim en 1915 y Th. Skolem en 1919 demostraron versiones de este teorema para el cálculo de predicados de primer orden, sin emplear el concepto de modelo, que A. Tarski definió recién en 1928. Al propio Tarski se debe la versión corriente de este teorema:  Teorema de Löwenheim-Skolem: Si una teoría de primer orden tiene un modelo, entonces, también tiene un modelo contable. Para aclarar el significado de este teorema debemos definir antes algunos términos matemáticos. Un conjunto es infinito si tiene n elementos (donde n es algún número natural) y es infinito si y sólo si no es finito. Un conjunto se llama contable si es biyectable con el conjunto de los números naturales o con algún subconjunto propio de éste. Todo conjunto finito es contable, pero no todo conjunto infinito lo es. Un conjunto infinito que no es contable se denomina incontable. Así, por ejemplo, como lo demostró G. Cantor, tanto el conjunto de los números enteros como el de los racionales son contables, pero el conjunto de los números reales es incontable. Un modelo se llama finito si su dominio es un conjunto finito y se llama infinito si dicho dominio es un conjunto infinito. El teorema de Löwenheim y Skolem afirma, entonces, que todo sistema axiomático formulado en un lenguaje de primer orden que tenga modelos tiene un modelo que es finito o infinito contable. Esto es, el sistema no tiene únicamente modelos infinitos que sean incontables. Puede tener sólo modelos finitos, pero si tiene modelos infinitos, entonces, tiene al menos uno que es contable, es decir, cuyos elementos no son más que los números naturales. Este último resultado se conoce como la versión descendente del teorema de Löwenheim y Skolem y se formula habitualmente de la siguiente manera:  Versión descendente del teorema de Löwenheim-Skolem: Si una teoría de primer orden tiene modelos infinitos, entonces, tiene un modelo infinito contable. Este teorema origina la llamada paradoja de Skolem, la cual consiste en el hecho de que las teorías matemáticas que tratan, o pretenden tratar, acerca de dominios incontables de objetos, como la teoría de los números reales y com-

95

JP 083a096-Cap3.QXD:0009

22/5/12

INTERPRETACIÓ´N

10:32

Página 96

DE UN SISTEMA AXIOMÁ´TICO

plejos o la teoría de conjuntos, si son satisfacibles, deben tener un modelo contable, por ejemplo, en el dominio de los números naturales. Otro resultado fundamental de la teoría de modelos es la llamada versión ascendente del teorema de Löwenheim y Skolem, que A. Tarski demostró en 1928 y constituye un teorema aparte:  Versión ascendente del teorema de Löwenheim-Skolem: Si una teoría de primer orden tiene un modelo infinito, entonces, tiene modelos de cualquier cardinalidad infinita. Este teorema establece que toda teoría de primer orden que tenga algún modelo infinito, tiene modelos infinitos incontables de todas las cardinalidades. Intuitivamente, se trata de conjuntos más grandes que el de los números naturales. Los modelos contables e incontables, evidentemente, no pueden ser isomorfos entre sí, por lo que este teorema implica, entonces, que cualquier teoría de primer orden que tenga modelos infinitos, es polimórfica, es decir, tiene modelos no isomorfos. Se llama modelos no standard a los modelos de una teoría que no son isomorfos con el modelo que se pretende construir. Por ejemplo, la aritmética de Peano de primer orden pretende tener modelos contables, en el dominio de los números naturales, pero si los tiene, también debe tener modelos incontables. En síntesis, toda teoría de primer orden que tenga algún modelo infinito necesariamente tiene también modelos no standard. Esta es una consecuencia inevitable del teorema de Löwenheim y Skolem. Por consiguiente, ninguna teoría matemática de primer orden puede caracterizar de manera unívoca una determinada estructura matemática.

Notas bibliográficas Los conceptos de interpretación y modelo de una teoría formal se exponen en la mayoría de los textos de lógica matemática de nivel intermedio, entre ellos: Boolos, Burgess y Jeffrey (2007); Enderton (2001); Enderton (1972); Hamilton (1988); Kleene (1967); Margaris (1990); Mates (1972) y Zalabardo (2002). Para una introducción a la teoría de modelos véase Bridge (1977); y para un tratado más amplio Manzano (1989). Hodges (1997) es un texto avanzado de teoría de modelos con un enfoque matemático. Tarski (1956) recopila algunos de sus trabajos pioneros sobre teoría de modelos, que todavía pueden leerse con provecho. Stoll (1979) y Stewart y Tall (1979) tratan la teoría de grupos y anillos desde el punto de vista axiomático. Durbin (1992) contiene mayores detalles y ejemplos de estructuras algebraicas. Rosen (1995) muestra la aplicación de la teoría de grupos a diversos campos de las ciencias físicas.

96

JP 097a118-Cap4.QXD:0009

22/5/12

4

10:38

Página 97

Propiedades de un sistema axiomático

4.1 Propiedades de los sistemas axiomáticos en general os sistemas formales y los axiomáticos en particular se caracterizan por ciertas propiedades importantes que expresan atributos del sistema como un todo. En este capítulo analizaremos las seis propiedades fundamentales de todo sistema axiomático, que son las siguientes: la consistencia, la completitud, la decidibilidad, la satisfacibilidad, la categoricidad y la independencia de los términos primitivos y axiomas. Todo sistema axiomático formal necesariamente tiene o no tiene cada una de estas propiedades. Es consistente o no lo es (en cuyo caso se llama inconsistente), es completo o no lo es (entonces es incompleto), es decidible o no lo es (entonces se llama indecidible), es satisfacible o no (en ese caso es insatisfacible), y lo mismo con las restantes propiedades. No se sigue de este hecho que siempre podamos conocer cuáles de estas propiedades posee un sistema axiomático determinado y cuáles no. Como veremos enseguida, en muchos casos no podemos conocerlas y, por tanto, no estamos en condiciones de afirmar, por ejemplo, si un sistema dado es consistente o inconsistente. La demostración de que un determinado sistema axiomático posee o no posee cada una de estas propiedades corresponde al campo de una disciplina conocida como metamatemática. Esta toma a los sistemas formales como objeto de estudio y se desenvuelve entonces en un plano metateórico; es una teoría acerca de teorías. En el ámbito que nos interesa aquí es una teoría acerca de sistemas axiomáticos formales. En el caso de que el sistema estudiado sea un sistema lógico se adopta el nombre de metalógica, la cual constituye una rama de la metamatemática en general. La investigación metateórica de los sistemas formales ha descubierto que las seis propiedades que acabamos de enunciar no son todas independientes entre sí. Existen importantes relaciones de implicación y de incompatibilidad entre ellas para determinados tipos de sistemas formales. En el transcurso de nuestra exposición mencionaremos algunas de estas relaciones, pero no ofreceremos ninguna prueba de ellas. Por lo general, las demostraciones metamatemáticas no son sencillas y exceden el nivel de esta obra. Nos limitaremos, entonces, a señalar las propiedades de algunos sistemas formales y

L

97

JP 097a118-Cap4.QXD:0009

22/5/12

PROPIEDADES

10:38

Página 98

DE UN SISTEMA AXIOMÁ´TICO

a mencionar a modo de ejemplo ciertos resultados metamatemáticos. El lector que desee conocer la justificación de esas afirmaciones puede dirigirse a las obras citadas en la nota bibliográfica que cierra este capítulo. Definiremos ahora cada una de las propiedades de un sistema axiomático formal.

1. Consistencia La propiedad de consistencia de un sistema se relaciona con el hecho de que no haya contradicciones dentro de ese sistema, y, por consiguiente, no se produzcan en él antinomias o paradojas de ningún tipo. Definiremos dos conceptos de consistencia, el de no contradictoriedad y el de consistencia generalizada. ◊ a) No contradictoriedad. Un sistema axiomático S es consistente si y sólo si no existe en S una fbf χ tal que χ y ¬ χ sean ambas teoremas en S. ◊ b) Consistencia generalizada. Un sistema axiomático S es consistente si y sólo si al menos una fbf de S no es teorema en S. Empleamos dos definiciones de consistencia porque un sistema formal podría no contener un símbolo para la negación en su lenguaje. Todo sistema formal cuyo lenguaje no contiene negación es (vacuamente) no contradictorio, por lo que la definición a) no permite, en estos casos, discriminar entre sistemas consistentes y no consistentes. Si un sistema no es consistente, en cualquiera de los dos sentidos, se dice que es inconsistente. Las definiciones de inconsistencia son, pues, la negación de las definiciones de consistencia. ◊ a) Contradictoriedad. Un sistema axiomático S es inconsistente si y sólo si, existe en S al menos una fbf χ tal que χ y ¬ χ sean ambas teoremas en S. ◊ b) Inconsistencia generalizada. Un sistema axiomático S es inconsistente si y sólo si, toda fbf de S es teorema en S. Los sistemas que carecen de negación sólo pueden ser inconsistentes en el sentido b) de consistencia generalizada, ya que su lenguaje no admite la formación de contradicciones. Si un sistema dotado de negación es inconsistente en el sentido a) de consistencia, también lo es en el sentido b). La implicación inversa también es verdadera. Podemos expresar esta relación diciendo que un sistema formal S cuyo lenguaje incluye negación admite como teoremas una fórmula

98

JP 097a118-Cap4.QXD:0009

22/5/12

10:38

Página 99

PROPIEDADES

DE LOS SISTEMAS AXIOMÁ´TICOS EN GENERAL

χ y su negación ¬ χ si y sólo si, toda fórmula bien formada de S es teorema en S. La implicación de (b) hacia (a) es evidente, pues si toda fórmula bien formada de un sistema con negación es teorema en el sistema, también serán teoremas una fórmula cualquiera χ y su negación ¬ χ, ya que ambas son fórmulas bien formadas del sistema. Probemos ahora la implicación en la dirección contraria, o sea, que si un sistema S es inconsistente en el sentido (a), también lo es en el (b). Esta relación está expresada en el principio de la lógica tradicional llamado ex contradictione sequitur quodlibet (literalmente “de una contradicción se sigue cualquier cosa”) o ley del Pseudo Escoto: (χ & ¬ χ) → ψ (donde χ y ψ son fórmulas cualesquiera), una ley de la lógica clásica cuya demostración, que sólo emplea lógica proposicional, es así: 1. χ & ¬ χ

2. χ

3. χ ∨ ψ 4. ¬ χ 5. ψ

6. (χ & ¬ χ) → ψ

[premisa] [de 1 por simplificación] [de 2 por adición] [de 1 por simplificación] [de 3 y 4 por silogismo disyuntivo] [cancelación de la premisa 1] 

Una demostración de esta ley, no formalizada pero exactamente igual a la que hemos dado, la realizó un lógico del siglo XIV conocido como Pseudo Escoto (llamado así por el hecho de habérselo confundido durante muchos siglos con el filósofo Juan Duns Scoto). La expresión “de una contradicción se sigue cualquier cosa” debe tomarse con cuidado porque se presta a confusión. En realidad, en un sistema inconsistente se pueden probar como teoremas todas las fórmulas bien formadas que admita el lenguaje de ese sistema, pero no se pueden probar cadenas de símbolos que no sean fórmulas de ese sistema. Por ejemplo en un sistema formal inconsistente de lógica proposicional no se puede demostrar la expresión “x + y = y + x”, porque ésta no es una fórmula bien formada de la lógica proposicional (puesto que emplea símbolos como “+” que no pertenecen al vocabulario de esta parte de la lógica). La consistencia o coherencia es la propiedad más importante que debe tener un sistema formal. Se dice que un sistema inconsistente es trivial porque en él todas las fórmulas del sistema son teoremas. Un sistema de este tipo carece de interés lógico porque no permite discriminar entre las fórmulas que son teoremas y aquellas que no lo son. En virtud de la ley del Pseudo Escoto, que acabamos de probar, cualquier sistema axiomático que admita una contradicción de

99

JP 097a118-Cap4.QXD:0009

22/5/12

PROPIEDADES

10:38

Página 100

DE UN SISTEMA AXIOMÁ´TICO

la forma χ y ¬ χ (donde χ es una fórmula cualquiera) resultará trivial porque toda fórmula bien formada de su lenguaje se podrá demostrar en ese sistema. La ley del Pseudo Escoto es válida en la lógica clásica y también en muchas lógicas no clásicas, como la intuicionista. Por consiguiente, cualquier sistema formal que emplee una lógica subyacente (lo usual es que se emplee la lógica clásica) en la que vale la ley del Pseudo Escoto se volverá trivial si se demuestra en él una sola contradicción. Dicha contradicción, por así decir, se propaga a la totalidad del sistema porque a partir de ella se pueden demostrar todas las contradicciones posibles en ese sistema (χ y ¬ χ; ψ y ¬ ψ; etc.). Existen ciertos sistemas de lógica no clásica, denominados paraconsistentes, en los que la ley del Pseudo Escoto no es válida y, por tanto, no ocurre que a partir de una contradicción se pueda demostrar cualquier fórmula de una teoría. La lógica paraconsistente permite que un sistema formal sea contradictorio (es decir, inconsistente en el sentido a)) y sin embargo no sea trivial (inconsistente en el sentido b)). Una lógica de este tipo se puede emplear como lógica subyacente de las teorías inconsistentes y no triviales, porque garantiza que a partir de una contradicción no es posible demostrar cualquier fórmula del lenguaje de la teoría. Las lógicas paraconsistentes tienen, sin embargo, la dificultad de que para conseguir este resultado emplean un concepto de negación que no es el clásico. La correspondiente conectiva de negación no tiene las propiedades de la negación de la lógica clásica. Queda, entonces, abierto el problema de elegir entre dos conceptos diferentes de negación y de justificar esta elección con criterios adecuados y precisos. La situación de la lógica paraconsistente, como la de las otras lógicas rivales de la clásica, es un tema debatido que está muy lejos de su esclarecimiento o solución definitiva. En todas las consideraciones que siguen siempre hemos de suponer que la lógica subyacente de un sistema axiomático es la lógica clásica. Las pruebas de consistencia de un sistema formal constituyen la parte esencial de la metateoría de ese sistema. Ello es así porque todos los sistemas axiomáticos importantes utilizan a la lógica clásica como lógica subyacente, por lo cual si fueran inconsistentes serían igualmente triviales y por consiguiente inutilizables. En general, para probar la consistencia de un sistema formal es suficiente con mostrar que hay una fórmula bien formada que no es teorema en ese sistema. Con ello se ha mostrado que el sistema no es inconsistente en sentido b) y por tanto que no es trivial. Si el lenguaje del sistema tiene negación y su lógica subyacente es la clásica, la prueba anterior también implica que dicho sistema no contiene contradicciones, o sea, que no es inconsistente en el sentido a). Sin embargo, ésta no es la manera más práctica de proceder. Más adelante en este capítulo estudiaremos otra forma de probar la consistencia de un sistema formal, que consiste en encontrar un modelo de ese sistema (véase también el Apéndice 1).

100

JP 097a118-Cap4.QXD:0009

22/5/12

10:38

Página 101

PROPIEDADES

DE LOS SISTEMAS AXIOMÁ´TICOS EN GENERAL

La investigación metateórica acerca de la consistencia de los sistemas formales ha llegado a dos resultados fundamentales. El primero es que la lógica de primer orden (con o sin identidad) es consistente. La prueba definitiva de este metateorema la dieron D. Hilbert y W. Ackermann en 1928. El segundo resultado, de carácter negativo, es que no es posible demostrar, dentro del propio sistema, la consistencia de la mayoría de los sistemas matemáticos, como la teoría de conjuntos, que son más amplios que la lógica elemental. Esta es una consecuencia de uno de los célebres teoremas que K. Gödel demostró en 1931. Dada la importancia que tienen las pruebas de consistencia les dedicamos un tratamiento aparte en el Apéndice 1, donde se podrán encontrar más informaciones, así como una breve reseña histórica acerca de cómo se llegó a estos resultados.

2. Completitud La completitud de una teoría se relaciona con el hecho de que dicha teoría sea suficiente para deducir todos los enunciados o formas de enunciados que se esperan de ella. En este sentido, un sistema axiomático es completo cuando permite demostrar todas las fórmulas que se quieren obtener como teoremas. Por ejemplo, en el caso de un sistema de lógica, deseamos obtener como teoremas todas las verdades lógicas o tautologías; y en el caso de un sistema aritmético, todas las fórmulas de la aritmética que consideramos intuitivamente verdaderas. Esta caracterización vaga será enseguida reemplazada por definiciones más precisas. Hay por lo menos tres conceptos diferentes de completitud que se han denominado de manera diferente: a) la completitud respecto de la negación; b) la completitud fuerte o saturación; y c) la completitud semántica. Definiremos cada uno de estos sentidos de completitud precisando la manera en que se relacionan entre sí. ◊ a) Completitud respecto de la negación. Un sistema axiomático S es completo respecto de la negación si y sólo si para cada fbf χ que sea cerrada (sin variables libres), o bien χ, o bien ¬ χ es un teorema en S. La idea que se expresa en este concepto de completitud es que un sistema completo es siempre capaz de escoger una entre dos fórmulas contradictorias. Podemos imaginar una lista de todas las fórmulas bien formadas de un sistema S ordenadas de a pares (χ y ¬ χ; ψ y ¬ ψ; etc.). Un sistema completo respecto de la negación permitirá demostrar, para todo par de fórmulas ordenadas de esta manera, una u otra de cada par.

101

JP 097a118-Cap4.QXD:0009

22/5/12

PROPIEDADES

10:38

Página 102

DE UN SISTEMA AXIOMÁ´TICO

◊ b) Completitud fuerte o saturación. Un sistema axiomático S es completo si y sólo si para cada fbf χ, o bien χ es un teorema, o bien S se vuelve inconsistente si χ se le agrega como axioma. La completitud fuerte significa que el sistema S no puede extenderse a uno más amplio por medio de la adición de nuevos axiomas, ya que si se le agrega una fórmula que no se deduce de los axiomas (o sea que no es teorema) el sistema pierde su consistencia. A veces se llama saturación a la propiedad de completitud fuerte, y se dice que un sistema axiomático que cumple esta condición es saturado o maximal. Este segundo concepto nos permite aplicar la idea de completitud a sistemas formales cuyo lenguaje no incluye negación. Observemos que de las definiciones de completitud que hemos dado se sigue que un sistema inconsistente es trivialmente completo respecto de la negación y vacuamente saturado o maximal. En efecto, en tal sistema no sólo ocurre que, para cualquier fórmula χ, se demuestre que χ es teorema o que ¬ χ es teorema, sino que ambas, χ y ¬ χ, son teoremas. Por consiguiente, tampoco es posible agregarles una fórmula que no sea teorema (porque no hay tal fórmula). Los sistemas inconsistentes son super-completos, y este hecho es el que los vuelve triviales. En ellos toda fórmula es demostrable, por lo que no es posible distinguir entre fórmulas que son teoremas y fórmulas que no lo son. Los sistemas completos útiles e interesantes son aquellos en los que toda fórmula es demostrable o refutable, pero además, hay fórmulas que no son teoremas. Esto último equivale a decir que son consistentes. Se advierte, entonces, que la consistencia de un sistema es una propiedad más fundamental e importante que la completitud. La relación entre estos dos sentidos de completitud es la siguiente. Si un sistema S es completo respecto de la negación (a) y, además, es consistente, es también maximal o saturado (b). La prueba de ello es claramente intuitiva, porque si S es consistente y completo respecto de la negación y se le agrega una fórmula cualquiera χ, que no es teorema en S, se producirá una contradicción. Precisamente por ser completo respecto de la negación, si χ no es teorema en S, entonces ¬ χ debe ser teorema en S. Luego, si le agregamos al sistema la fórmula χ como axioma, tendremos como consecuencia χ y ¬ χ entre las fórmulas demostradas de S. La relación conversa también es válida, porque si un sistema S es maximal y no es posible agregarle sin inconsistencia una fórmula cualquiera χ que no sea teorema, entonces ¬ χ es teorema en S. Luego, S es completo respecto de la negación. Podemos afirmar, la siguiente equivalencia:  Un sistema axiomático S es completo respecto de la negación si y sólo si S es maximal o saturado.

102

JP 097a118-Cap4.QXD:0009

22/5/12

10:38

Página 103

PROPIEDADES

DE LOS SISTEMAS AXIOMÁ´TICOS EN GENERAL

Hay pocos sistemas formales que son completos respecto de la negación o maximales. Por ejemplo la lógica proposicional no es completa respecto de la negación, porque ningún símbolo proposicional p, ni su negación ¬ p, es teorema. Tampoco lo es la lógica de predicados, donde fórmulas como ∀x Fx y ¬ ∀x Fx no son teoremas. Sin embargo, existe un teorema, demostrado por A. Lindenbaum, que afirma que si un sistema axiomático es consistente, entonces hay una extensión de ese sistema que es maximal consistente. Se lo conoce como lema de Lindenbaum:  Lema de Lindenbaum. Todo sistema axiomático consistente admite una extensión maximal consistente. El significado de este teorema es que cualquier sistema axiomático que sea consistente se puede enriquecer con nuevos axiomas, sin perder la consistencia, hasta transformarlo en maximal. En 1930 Gödel probó que la lógica de primer orden es completa, lo cual fue ciertamente un resultado alentador para la investigación metateórica de los sistemas formales. La lógica de primer orden no es completa respecto de la negación, y por ello no es maximal o saturada. Es completa en un sentido más restringido que los anteriores, que generalmente se llama completitud semántica. En este tercer sentido se dice que una lógica es completa cuando es capaz de deducir todas las fórmulas que son verdaderas en ella. En el caso de la lógica de primer orden tales verdades son las tautologías y todas las fórmulas lógicamente verdaderas (a veces se las llama también “válidas”, o “universalmente válidas”). En general esta forma de completitud significa que todas las consecuencias lógicas de un cálculo deductivo son deducibles en él mediante sus reglas de transformación. Podemos definir en general la completitud semántica de un cálculo deductivo de la siguiente manera: ◊ c) Completitud semántica. Un cálculo deductivo es semánticamente completo si y sólo si para cualesquiera fórmulas χ y ψ, si χ |= ψ, entonces, χ l− ψ. El concepto de completitud semántica se aplica en sentido estricto a un cálculo deductivo. Una lógica se llama semánticamente completa si posee un cálculo deductivo semánticamente completo. En el caso de los sistemas axiomáticos, es la lógica subyacente del sistema la que puede o no ser semánticamente completa. Generalmente la lógica subyacente de un sistema axiomático no está a su vez axiomatizada. En el caso de que lo estuviera, diremos que esa lógica es semánticamente completa si todas las consecuencias lógicas de los axiomas

103

JP 097a118-Cap4.QXD:0009

22/5/12

PROPIEDADES

10:38

Página 104

DE UN SISTEMA AXIOMÁ´TICO

son demostrables como teoremas. A veces, por extensión de este sentido de completitud, se dice que un sistema axiomático es semánticamente completo si su lógica subyacente es semánticamente completa. Así, por ejemplo, toda teoría axiomatizada que tenga como lógica subyacente a la lógica de primer orden será semánticamente completa. La lógica de segundo orden o de orden superior no es completa en sentido semántico, por lo que toda teoría axiomática que tenga como lógica subyacente a una lógica de orden superior será semánticamente incompleta. La completitud semántica de una lógica no implica a ninguna de las otras dos formas de completitud. Por tanto, si se prueba que una lógica es completa en sentido semántico, no se sigue que sea completa respecto de la negación ni tampoco que sea saturada o maximal. Pero si se demuestra, en cambio, que una lógica es semánticamente incompleta, también se habrá probado que es incompleta respecto de la negación. La prueba de ello es la siguiente. Supongamos que el cálculo lógico CL es consistente, correcto y semánticamente incompleto. Supongamos también que la fórmula χ es consecuencia lógica de CL pero no es deducible en CL. Dado que CL es consistente, ¬ χ no es una consecuencia lógica de CL. Y dado que CL es correcto, ¬ χ no es deducible en CL. Por tanto, ni χ ni ¬ χ son fórmulas deducibles en CL. El cálculo CL, entonces, es también incompleto respecto de la negación. Hay muy pocas teorías que son completas respecto de la negación. Para probar que un sistema axiomático S es incompleto respecto de la negación resulta suficiente encontrar dos modelos de S, M1 y M2, y una fórmula bien formada χ, tal que χ sea verdadera en M1 y ¬ χ sea verdadera en M2. Con ello se ha probado que hay al menos una fórmula χ tal que ni χ ni ¬ χ son teoremas en S, y, por tanto, que S es incompleto. En efecto, los teoremas de S deben ser verdaderos en todo modelo de S (por definición misma de modelo), y es evidente que ni χ ni ¬ χ son teoremas en S, porque no son ambos verdaderos en los dos modelos M1 y M2 (χ es falso en M2 y ¬ χ es falso en M1). En 1931 Gödel obtuvo una demostración de imposibilidad de extraordinaria importancia. Demostró que cualquier sistema axiomático formal suficientemente rico como para contener a la aritmética elemental, si es consistente debe ser incompleto respecto de la negación. En cualquier sistema axiomático que permita deducir la aritmética elemental hay, por tanto, alguna fórmula del lenguaje de la aritmética tal que ni ella ni su negación son teoremas. Un corolario de este metateorema de Gödel sostiene, además, que una fórmula que expresa la consistencia del sistema es precisamente una de esas fórmulas que no pueden demostrarse dentro del propio sistema. Resulta, entonces, que en ningún sistema axiomático con las características antes señaladas, por ejemplo, las teorías de conjuntos, es posible ofrecer una prueba de consistencia mediante los recursos formales del propio sistema (para más detalles véase el Apéndice 1). La

104

JP 097a118-Cap4.QXD:0009

22/5/12

10:38

Página 105

PROPIEDADES

DE LOS SISTEMAS AXIOMÁ´TICOS EN GENERAL

investigación metateórica posterior reveló que muy pocas teorías matemáticas interesantes son completas y que la mayoría de los sistemas axiomáticos, como los de las diferentes teorías de conjuntos, son incompletos. La incompletitud en sentido lógico-formal no debe entenderse como una falta de desarrollo, es decir, como si la teoría fuera puramente parcial y pudiera completarse enriqueciendo su lenguaje o incorporando nuevos axiomas. Se trata de una incompletitud por principio que no se puede superar mediante estos recursos; aunque se agregue cualquier número de axiomas que se quiera (y se pueda, mientras se preserve la consistencia) la teoría resultante siempre seguirá siendo incompleta. Podemos describir el resultado de este teorema de Gödel diciendo que establece la imposibilidad de construir un sistema axiomático, suficientemente rico como para formular la aritmética elemental, que sea a la vez consistente y completo. Si dicho sistema es consistente, será incompleto; y si es completo, será inconsistente. Obviamente, los sistemas inconsistentes son inútiles, por lo cual la única alternativa viable es sacrificar la completitud de los sistemas matemáticos axiomatizados. La completitud es una propiedad deseable pero no indispensable de los sistemas axiomáticos y de las teorías formales en general. Una teoría incompleta no es inútil ni trivial en ningún sentido. Se puede trabajar perfectamente con ella demostrando un número indefinidamente grande de teoremas. No obstante, si un sistema axiomático es incompleto, contendrá fórmulas tales que ni ellas ni sus negaciones podrán probarse como teoremas a partir de los axiomas del sistema.

3) Decidibilidad La decidibilidad de un sistema formal se refiere al hecho de que exista en el sistema un procedimiento mecánico de decisión para establecer si una fórmula pertenece o no pertenece a ese sistema. Si tal procedimiento no existe, el sistema es indecidible. Para el caso de los sistemas axiomáticos definiremos estos conceptos de la siguiente manera: ◊ Un sistema axiomático S es decidible si y sólo si existe un procedimiento algorítmico tal que para toda fbf χ permite determinar si χ es o no es un teorema en S. ◊ Un sistema axiomático S es indecidible si y sólo si S no es decidible. Un algoritmo o procedimiento efectivo en general es un método mecánico para resolver un problema, llegando a la solución mediante un número finito de

105

JP 097a118-Cap4.QXD:0009

22/5/12

PROPIEDADES

10:38

Página 106

DE UN SISTEMA AXIOMÁ´TICO

operaciones. En ninguna de las operaciones de un algoritmo intervienen procesos aleatorios o azarosos, como elegir arrojando una moneda o un dado. En el caso de los sistemas axiomáticos el problema en cuestión será el de determinar si una fórmula del lenguaje de un sistema dado es o no es un teorema en dicho sistema. El sistema es decidible cuando existe un algoritmo de este tipo para toda fórmula bien formada del sistema. Las tablas de verdad para la lógica proposicional, por ejemplo, constituyen un procedimiento algorítmico para determinar si una forma proposicional es o no lógicamente verdadera, es decir, si es una tautología de la lógica proposicional o no lo es. Observemos que el método de las tablas de verdad nos permite decidir esto respecto de cualquier forma proposicional bien formada, por más extensa o complicada que sea. La tabla de verdad de una forma proposicional compleja podrá ser muy larga, pero siempre tendrá una extensión finita, y este hecho garantiza que será posible llegar a un resultado concluyente, por sí o por no, en un número finito de pasos. Otro ejemplo de algoritmo bien conocido son los procedimientos que aprendemos en la escuela elemental para sumar, restar, multiplicar y dividir números enteros o reales. Mediante ellos podemos resolver, en principio, cualquier problema que involucre estas operaciones con números. Por supuesto, en la práctica habrá operaciones que no podamos resolver por su extensión o complejidad, por ejemplo multiplicar dos números de 500 millones de dígitos cada uno. Sin embargo, la existencia de un algoritmo nos garantiza que la operación se puede resolver en un número finito de pasos, y, por tanto, en un tiempo finito. El resultado metateórico más importante acerca de la decidibilidad de los sistemas formales lo obtuvo A. Church en 1936, y es conocido como teorema de Church. En él se demuestra que la lógica de predicados de primer orden (con o sin identidad) es indecidible. La lógica proposicional es decidible. Hay un fragmento del cálculo de predicados que es decidible, el de predicados monádicos, pero cuando se emplean predicados poliádicos (de dos o más argumentos) no hay procedimiento de decisión. Ello significa que la lógica de primer orden como un todo es indecidible y que no hay, entonces, un algoritmo que permita determinar para cualquier fórmula de la lógica de predicados si es o no lógicamente verdadera. Todo el que haya empleado algún método de demostración, como las tablas semánticas o los árboles lógicos, recordará que estos métodos permiten decidir en un número finito de pasos si fórmulas con predicados monádicos (como ∀x (Fx → Gx)) son o no teoremas de la lógica de primer orden. Pero si la fórmula incluye predicados de dos o más argumentos (como, por ejemplo, ∀x ∀y (Fxy → Gyx)) las tablas o los árboles lógicos pueden volverse infinitos y, entonces, la prueba no logra concluir en un número finito de pasos. Esto no significa que no sea posible hacer demostraciones en lógica de predicados poliádicos, cosa obviamente falsa, sino únicamente que no podemos resolver de una manera mecánica todos los problemas de esta rama de la lógica elemental.

106

JP 097a118-Cap4.QXD:0009

22/5/12

10:38

Página 107

PROPIEDADES

DE LOS SISTEMAS AXIOMÁ´TICOS EN GENERAL

El propio Church y J. B. Rosser extendieron este resultado y también consiguieron demostrar que la aritmética elemental de Peano es indecidible. Posteriormente, la investigación metateórica probó que existen muchas otras teorías matemáticas importantes, como la teoría de grupos y la teoría de conjuntos (suponiendo que es consistente), que no son decidibles. También se descubrió que son decidibles muchas teorías matemáticas, como la teoría de las álgebras de Boole y la geometría hiperbólica. La consecuencia más significativa de los resultados de indecidibilidad es que muestran que la lógica y la matemática no son completamente mecanizables. Si una teoría es decidible, en principio es posible construir una máquina computadora y programarla para que de manera automática pruebe si cualquier fórmula bien formada que se le suministre es o no deducible en esa teoría, es decir, si es o no un teorema. Esto se consigue desde hace tiempo con la lógica proposicional, por ejemplo. Pero si la teoría no es decidible no hay manera de computar sus teoremas de manera automática, y, por tanto, no es posible construir una máquina que demuestre si una fórmula de la teoría es o no un teorema de esa teoría. No se trata de una limitación técnica que pueda ser superada construyendo máquinas más potentes y veloces. Es una imposibilidad lógica intrínseca a las teorías indecidibles e insuperable por principio. La decidibilidad de una teoría formal se prueba ofreciendo un algoritmo o procedimiento de decisión para esa teoría. Así, por ejemplo, las tablas de verdad prueban que la lógica proposicional es decidible (hay, además, muchos otros métodos de decisión más simples). Para los sistemas axiomáticos existe una relación entre completitud y decidibilidad que nos permite obviar la construcción de algoritmos para probar que el sistema es decidible:  Si un sistema axiomático S es completo respecto de la negación, entonces S es decidible. Así pues, la completitud de un sistema axiomático implica su decidibilidad, por tanto, si ya hemos probado que es completo respecto de la negación, no es necesario probar que es decidible. Este metateorema, demostrado por A. Turing en 1936, sólo es válido para las teorías axiomatizables. Si una teoría formal no es axiomatizable no se puede inferir su decidibilidad a partir de la prueba de su completitud. La conversa de esta relación es falsa: hay sistemas que son decidibles e incompletos, como lo muestra el ejemplo de la lógica proposicional. Es importante no confundir la completitud respecto de la negación con la decidibilidad de una teoría. La completitud respecto de la negación nos dice que para cualquier par de fórmulas bien formadas contradictorias χ y ¬ χ una de ellas es deducible en la teoría, pero esto nada nos dice acerca de la manera de encontrar la demostración de una de esas fórmulas. Puede ocurrir que de

107

JP 097a118-Cap4.QXD:0009

22/5/12

PROPIEDADES

10:38

Página 108

DE UN SISTEMA AXIOMÁ´TICO

hecho no encontremos una prueba de ninguna de las dos, aunque sepamos que tal prueba existe, y debamos permanecer en estado de incertidumbre al respecto. La decidibilidad de una teoría nos asegura que existe un procedimiento para determinar si una fórmula dada es o no es un teorema en una teoría determinada. Pero es perfectamente posible que la respuesta sea que ni esa fórmula ni su negación son teoremas, lo cual nos indica simplemente que tal teoría es incompleta respecto de la negación. Si una teoría o sistema axiomático es decidible las dificultades para arribar a la solución de un problema sólo pueden ser de tipo práctico, por ejemplo, cuando la prueba de un teorema sea tan larga que una máquina resulte incapaz de terminarla en un tiempo humanamente razonable; o bien cuando sea tan complicada que no seamos capaces de programar a una máquina para que la resuelva. Estas dificultades son meramente de hecho y pueden superarse progresivamente a medida que se desarrollan el conocimiento y la tecnología industrial de las computadoras. Por el contrario, si la teoría es completa pero indecidible (en cuyo caso no podrá ser una teoría axiomatizable) es imposible por principio construir una máquina que en un tiempo finito demuestre que para cualquier fórmula χ o bien χ o bien ¬ χ pertenece a la teoría (es teorema) y la otra no. Tal prueba depende exclusivamente de la creatividad humana y no se puede mecanizar de manera que se garantice su descubrimiento automático. Existe otro concepto de decidibilidad que se aplica a las fórmulas de un sistema axiomático y que debe distinguirse del anterior. Siguiendo la terminología de Gödel lo llamaremos decidibilidad formal y lo definiremos de la siguiente manera: ◊ Una fórmula bien formada χ, que pertenece al lenguaje de un sistema axiomático S, es formalmente decidible en S si y sólo si o bien χ o bien ¬ χ son teoremas en S. La indecidibilidad formal de una fórmula se define, entonces, como la negación de la decidibilidad: ◊ Una fórmula bien formada χ, que pertenece al lenguaje de un sistema axiomático S, es formalmente indecidible en S si y sólo si ni χ ni ¬ χ son teoremas en S. La existencia de fórmulas formalmente indecidibles en un sistema axiomático es una consecuencia inmediata del hecho de que dicho sistema sea incompleto respecto de la negación. Podemos afirmar, entonces, la siguiente equivalencia:

108

JP 097a118-Cap4.QXD:0009

22/5/12

10:38

Página 109

PROPIEDADES

DE LOS SISTEMAS AXIOMÁ´TICOS EN GENERAL

 Existen fórmulas formalmente indecidibles en el lenguaje de un sistema axiomático S si y sólo si S es incompleto respecto de la negación. Por su parte, los dos conceptos de indecidibilidad que hemos definido se relacionan de la siguiente manera. Si un sistema axiomático es decidible puede contener o no fórmulas formalmente indecidibles, pero si es indecidible deben existir en su lenguaje fórmulas formalmente indecidibles, ya que si no existieran, el sistema sería completo respecto de la negación y, por consiguiente, también sería decidible.

4) Satisfacibilidad ◊ Un sistema axiomático S es satisfacible si y sólo si S tiene al menos un modelo. La satisfacibilidad es una propiedad importante porque está relacionada con la consistencia de un sistema. Un sistema inconsistente no puede tener un modelo; por tanto, si el sistema es satisfacible, entonces es consistente.  Si un sistema axiomático S es satisfacible, entonces S es consistente. Esta relación general entre satisfacibilidad y consistencia vale para cualquier teoría o sistema axiomático. La relación conversa sólo es válida para los sistemas axiomáticos de primer orden. Para los sistemas de segundo orden o de orden superior en general, puede darse el caso de que un sistema axiomático sea consistente y, sin embargo, no tenga un modelo, es decir, no sea satisfacible. La equivalencia entre consistencia y satisfacibilidad vale en general para toda teoría de primer orden, por lo que podemos afirmar que:  Toda teoría consistente de primer orden tiene un modelo. Este es un resultado extremadamente importante porque asegura la satisfacibilidad de cualquier teoría consistente de primer orden. Por ello, el hecho de no poder encontrar un modelo para una de estas teorías se debe siempre a una limitación de las capacidades humanas pero no de la teoría en sí misma. En 1930 K. Gödel probó este resultado como parte de su demostración de la completitud de la lógica de primer orden. Sin embargo, ya había sido encontrado por Th. Skolem en 1929, e independientemente por J. Herbrand en 1930. La satisfacibilidad de un sistema axiomático se prueba simplemente encontrando un modelo de ese sistema. Al hacerlo se habrá probado también que dicho sistema es consistente. 109

JP 097a118-Cap4.QXD:0009

24/5/12

PROPIEDADES

17:00

Página 110

DE UN SISTEMA AXIOMÁ´TICO

Resulta inevitable preguntarse por qué razón un sistema inconsistente no puede tener un modelo. En términos informales, la respuesta se encuentra en el presupuesto de que el principio clásico de no contradicción, ¬ (χ & ¬ χ), es una ley lógica válida sin restricciones ni excepciones. Supongamos que Sn sea un sistema axiomático inconsistente en el sentido de que permite deducir de sus axiomas dos teoremas de la forma χ y ¬ χ. Si Sn tuviera un modelo M, todos los teoremas de Sn deberían ser enunciados verdaderos en M. Consiguientemente, χ y ¬ χ serían verdaderos en M, pero por la ley de no contradicción esto no puede ocurrir en ningún caso. Por tanto, Sn no tiene modelos, ya que no existe ninguna interpretación posible en la que todos sus teoremas sean enunciados simultáneamente verdaderos.

5) Independencia Hay dos conceptos de independencia para un sistema axiomático S: i) independencia de los axiomas de S, y ii) independencia de los términos primitivos de S. i) Independencia de los axiomas ◊ Los axiomas de un sistema axiomático S son independientes si y sólo si ninguno de ellos es deducible de los restantes. Si un axioma de un sistema axiomático S es deducible de los restantes axiomas de S se dice que no es independiente. Para probar que un determinado axioma no es independiente basta con demostrarlo como teorema a partir de los otros axiomas del sistema. En cambio, para probar que un axioma es independiente resulta necesario ofrecer una prueba de tipo semántico mediante la construcción de un modelo. La independencia de un determinado axioma Ax de un sistema axiomático se prueba encontrando un modelo en el cual sean verdaderos todos los axiomas del sistema excepto Ax, que, consiguientemente, será falso en dicho modelo. Por ejemplo, supongamos que en el sistema S = {Ax1, Ax2, Ax3} deseamos probar la independencia del axioma Ax3. Para ello es necesario construir un modelo del sistema S’ = {Ax1, Ax2, ¬ Ax3}. Si encontramos dicho modelo, habremos probado que S’ es consistente, ya que la satisfacibilidad de un sistema implica su consistencia, como se indicó en el parágrafo anterior. Y el hecho de que S’ sea consistente prueba que Ax3 no se deduce de los axiomas Ax1 y Ax2. En efecto, si Ax3 fuera deducible de los otros dos axiomas, el sistema S’ sería inconsistente (ya que contendría como teoremas a Ax3 y a ¬ Ax3) y, por tanto, no podría tener un modelo. Para probar la independencia de los otros axiomas del sistema se procede de la misma manera, esto es, encontrando modelos en los que resulten verdaderos todos los axiomas del sistema salvo aquél cuya independencia se quiere probar. 110

JP 097a118-Cap4.QXD:0009

22/5/12

10:38

Página 111

PROPIEDADES

DE LOS SISTEMAS AXIOMÁ´TICOS EN GENERAL

Existe otro sentido más fuerte de independencia según el cual una fórmula χ se dice independiente de un conjunto de fórmulas Γ si y sólo si ni χ ni ¬ χ son deducibles de Γ. Para probar la independencia, en este sentido del término, de un axioma de un sistema axiomático es necesario encontrar dos modelos. En nuestro ejemplo, un modelo del sistema S y otro modelo del sistema S’. El modelo de S prueba que ¬ Ax3 no es deducible de los otros dos axiomas del sistema. En general, siempre que se hace referencia a la independencia de los axiomas de un sistema axiomático se la entiende en el sentido más débil que mencionamos al comienzo, por lo cual no se requiere una prueba de consistencia de todo el sistema. ii) Independencia de los términos primitivos ◊ Los términos primitivos de un sistema axiomático S son independientes si y sólo si ninguno de ellos es definible mediante los demás primitivos de S. La prueba de independencia de un término primitivo t de un sistema S se realiza por el llamado método de Padoa (creado por el matemático italiano A. Padoa). Este consiste en encontrar dos modelos de S, M1 y M2, tales que ambos tengan el mismo dominio y la interpretación de cada primitivo de S, excepto t, sea la misma, pero la interpretación de t sea diferente en cada modelo. Esto muestra que t es definicionalmente independiente de los restantes términos primitivos de S, porque si no lo fuera debería tener forzosamente la misma interpretación en M1 y en M2 (es fácil construir algún ejemplo sencillo para comprobarlo). La independencia de los axiomas y de los términos primitivos de un sistema axiomático no es una propiedad indispensable. Por razones de simplicidad, economía de expresión y elegancia resulta deseable que el conjunto de los axiomas y términos primitivos de un sistema sea reducido al mínimo posible. Si algún axioma o término primitivo no es independiente se introduce información redundante en los puntos de partida del sistema, pero de ello no se sigue ningún perjuicio para la capacidad demostrativa del sistema, ni se afecta a su consistencia o a otras propiedades metateóricas. Frecuentemente, por razones prácticas, es conveniente introducir términos o axiomas redundantes para mejorar la comprensibilidad de un sistema. La axiomática de la lógica proposicional brinda un buen ejemplo de esta situación. H. M. Sheffer probó en 1913 que todas las conectivas lógicas pueden definirse utilizando una sola como término primitivo, la barra “” o funtor de Sheffer, que es la incompatibilidad conjunta de dos proposiciones (“pq” es verdadero si y sólo si p y q no son ambos verdaderos). Sin embargo, las definiciones y fórmulas construidas con esta conectiva no son claras ni fáciles de manejar a la hora de hacer deducciones. Por su parte, J. Nicod construyó en 1918 un sistema axiomático de lógica proposicional que empleaba

111

JP 097a118-Cap4.QXD:0009

22/3/13

PROPIEDADES

10:39

Página 112

DE UN SISTEMA AXIOMÁ´TICO

un solo axioma y esta única conectiva. Pero el axioma era largo y poco intuitivo, como puede verse: (p(qr))((s(ss))((tq)((pt)(pt)))). Posteriormente se inventaron muchos sistemas equivalentes de un único axioma, con una o dos conectivas, pero ninguno resultó sencillo y fácil de utilizar. En general, la independencia de los axiomas se considera un requisito más importante que la independencia de los términos primitivos. Al construir un sistema axiomático se adoptan casi siempre términos primitivos redundantes (por ejemplo, dos o más conectivas proposicionales) para facilitar la claridad de expresión. También se prefiere emplear varios axiomas breves y claros en vez de pocos largos y complicados. Así, se han construido sistemas axiomáticos de lógica proposicional, como el de D. Hilbert y P. Bernays de 1934, o el de H. Hermes y H. Scholz de 1952, que emplean cada uno quince axiomas independientes. Cuando el sistema a construir no es elemental, la independencia de los axiomas puede ser difícil de probar e incluso se la puede sacrificar por razones pragmáticas sin que se afecte más que la elegancia del sistema. No obstante, cuando un determinado axioma de un sistema es cuestionado, la prueba de que es independiente de los restantes axiomas del sistema tiene importancia teórica. Esto ocurrió históricamente con el quinto postulado de Euclides, cuya independencia tardó muchos siglos en ser reconocida, o con el axioma de elección de la teoría de conjuntos de Zermelo-Fraenkel, que P. Cohen probó como independiente en 1963 (véase el Capítulo 5.2).

6) Categoricidad ◊ Un sistema axiomático S es categórico si y sólo si S es satisfacible y todos sus modelos son isomorfos entre sí. Ya hemos definido precisamente el concepto de isomorfismo entre estructuras en el Capítulo 3.4. El isomorfismo entre modelos se puede caracterizar de manera intuitiva diciendo simplemente que dos modelos son isomorfos cuando poseen la misma cantidad de elementos en sus respectivos dominios y estos elementos están relacionados entre sí de la misma manera en cada modelo. Un sistema axiomático formal que es satisfacible no tiene un único modelo, sino un número infinito de modelos (lo cual no significa que podamos conocer ni siquiera uno de ellos). Si el sistema es categórico y conocemos al menos un modelo del sistema, podemos saber además que todos los otros modelos tienen la misma forma que ése. Los modelos isomorfos difieren solamente en la naturaleza de sus elementos, pero en lo demás son idénticos ya que tienen la misma cantidad de elementos, y además, las propiedades y relaciones que existen entre los elementos de un modelo son las mismas que existen entre los elementos correspondientes del otro modelo (o semejantes a ellas). Por esta razón, los

112

JP 097a118-Cap4.QXD:0009

22/3/13

10:39

Página 113

PROPIEDADES

DE LOS SISTEMAS AXIOMÁ´TICOS EN GENERAL

lógicos y matemáticos frecuentemente tratan a los sistemas o teorías categóricos como si tuvieran un único modelo. En realidad, tienen infinitos modelos, pero éstos sólo difieren en la naturaleza de sus elementos, algo que desde el punto de vista matemático es inesencial. La categoricidad de un sistema es una propiedad importante porque está relacionada con la completitud, pero ambas no son equivalentes, porque no ocurre que todo sistema categórico sea completo y a la vez que todo sistema completo sea categórico. La implicación entre categoricidad y completitud se da en un solo sentido:  Si un sistema axiomático S es categórico, entonces S es completo respecto de la negación. La relación inversa es falsa, ya que hay sistemas completos que no son categóricos. Un sistema completo es categórico sólo en el caso de que tenga algún modelo finito.  Si un sistema axiomático S es completo y tiene un modelo finito, entonces S es categórico. Ejemplos de sistemas axiomáticos categóricos son la aritmética elemental de Peano, la geometría euclídea de Hilbert y la teoría de los números reales de Tarski. Todas ellos requieren, sin embargo, que se los formule en el lenguaje de la lógica de segundo orden. Cuando se los formula como teorías de primer orden no son categóricos. El teorema de Löwenheim y Skolem (que formulamos en el Capítulo 3.4) tiene una consecuencia muy importante respecto de la categoricidad de las teorías. Esta consiste en el hecho de que ninguna teoría de primer orden que tenga algún modelo infinito es categórica. Como ya hemos visto, la isomorfía entre modelos requiere que todos ellos tengan dominios con el mismo número de elementos, esto es, dominios cuyos elementos se puedan poner en correspondencia uno a uno entre sí. Ahora bien, por la versión ascendente del teorema de Löwenheim y Skolem, toda teoría de primer orden que tiene un modelo infinito contable, tiene también modelos infinitos no contables. Los modelos infinitos contables y no contables no pueden ser isomorfos, porque los elementos de su dominio no son coordinables uno a uno. Dicho de manera informal, sus dominios no tienen el mismo número de elementos. Por consiguiente, tales modelos no son isomorfos. Esta es la razón por la cual sólo las teorías de primer orden que tienen únicamente modelos finitos son susceptibles de ser categóricas. Podemos afirmar, entonces la siguiente implicación entre estas dos propiedades:

113

JP 097a118-Cap4.QXD:0009

22/3/13

PROPIEDADES

10:39

Página 114

DE UN SISTEMA AXIOMÁ´TICO

 Si una teoría de primer orden es categórica, entonces, todos sus modelos son finitos. La implicación conversa no es en general válida, ya que una teoría puede tener sólo modelos finitos y, sin embargo, no ser categórica porque tiene modelos de diferente cardinalidad finita. Las teorías de primer orden que tienen algún modelo infinito no pueden ser categóricas. Las teorías de segundo orden, en cambio, sí pueden serlo. Esto se debe a que en la lógica de segundo orden (aquella que permite cuantificar variables predicativas) no es válido el teorema de Löwenheim y Skolem. Las teorías formuladas en un lenguaje de segundo orden pueden así ser categóricas y, como, consecuencia de ello, también completas. Muchos lógicos y filósofos las consideran apropiadas para caracterizar de manera unívoca una determinada estructura matemática, como la aritmética de Peano, ya que no tienen modelos no standard. Una noción más débil, pero sumamente útil, de categoricidad es la llamada κ-categoricidad. Ante todo, decimos que un modelo tiene cardinalidad κ cuando su dominio tiene un número κ de elementos (donde κ es un cardinal cualquiera, finito o infinito). Mediante este concepto podemos definir, entonces, la κ-categoricidad de la siguiente manera: ◊ Un sistema axiomático S es κ-categórico si y sólo si: a) S tiene al menos un modelo de cardinalidad κ; y b) todos los modelos de S de cardinalidad κ son isomorfos entre sí. Existen muchas teorías de primer orden que no son categóricas, pero, sin embargo, son κ-categóricas, por lo cual pueden caracterizar de manera unívoca sus modelos hasta el cardinal κ. Suele decirse, entonces, que dichas teorías tienen un único modelo de cardinalidad κ, ya que todos los modelos de esa cardinalidad tienen la misma estructura y pueden considerarse, desde el punto de vista matemático, como si fueran el mismo.

4.2 Propiedades de las teorías formales de primer orden A lo largo de este capítulo hemos mencionado numerosos ejemplos de sistemas axiomatizados de lógica y matemática que ejemplificaban cada una de las propiedades metateóricas que definimos. No hemos ofrecido prueba alguna de estos resultados, ni podemos hacerlo aquí, pero es conveniente resumir de ma114

JP 097a118-Cap4.QXD:0009

22/5/12

10:38

Página 115

PROPIEDADES

DE LAS TEORÍAS FORMALES DE PRIMER ORDEN

nera sistemática cuáles son las propiedades conocidas de las teorías fundamentales de primer orden. Por tratarse de teorías de primer orden, sabemos que si son consistentes, también son satisfacibles. Igualmente, sabemos que ninguna teoría de primer orden que tenga algún modelo infinito es categórica, por lo que no mencionaremos esta propiedad en cada caso. La lógica proposicional, que es la parte básica de la lógica de primer orden, es consistente, completa en sentido semántico y decidible. No es maximal ni completa respecto de la negación. La demostración de todas estas propiedades metateóricas se debe a E. Post, quien lo hizo en su tesis doctoral escrita en 1920. La lógica de predicados monádicos, que es un fragmento de la lógica de primer orden es consistente, completa en sentido semántico y decidible, pero no es maximal ni completa respecto de la negación. Todas estas propiedades metateóricas las demostró L. Loewenheim en 1915. La lógica de primer orden en su totalidad es consistente, completa en sentido semántico e indecidible. No es maximal ni completa respecto de la negación. La consistencia de la lógica de primer orden la demostraron D. Hilbert y W. Ackermann en 1928; la completitud semántica la demostró K. Gödel en 1930; y la indecidibilidad la probó A. Church en 1936. La lógica de primer orden satisface la propiedad esencial de los sistemas formales, la consistencia, y tiene también la fortuna de ser semánticamente completa. Observemos, además, que la lógica de primer orden como un todo es indecidible, pero hay un fragmento de ella, la lógica de predicados monádicos, que es decidible. Por otra parte, ningún fragmento de esta lógica es completo respecto de la negación. La aritmética elemental (la teoría de los números naturales con las operaciones de suma y multiplicación y el concepto general de número natural) es consistente. La primera prueba de consistencia absoluta la dio G. Gentzen en 1935, pero se trata de una prueba que no es estrictamente finitaria (véase el Apéndice 1) y por esa razón muchos la consideran poco segura o menos rigurosa que una prueba finitaria. No existe ninguna prueba finitaria de su consistencia. K. Gödel demostró en 1931 que si la aritmética elemental es consistente, entonces es incompleta respecto de la negación. A. Church demostró en 1936 que si esta teoría es consistente, entonces también es indecidible. Los resultados metateóricos muestran, pues, que la aritmética elemental es una teoría menos segura que la lógica de primer orden, ya que no podemos estar completamente ciertos de haber probado su consistencia. No obstante, la mayoría de los matemáticos considera que la consistencia de la aritmética elemental, aunque no la podamos proclamar con certeza absoluta, está más allá de toda duda razonable. Finalmente, la teoría de conjuntos (en las versiones axiomáticas de ZermeloFraenkel y de Von Neumann-Bernays-Gödel) carece de prueba de consistencia

115

JP 097a118-Cap4.QXD:0009

22/5/12

PROPIEDADES

10:38

Página 116

DE UN SISTEMA AXIOMÁ´TICO

absoluta. Se ha demostrado que si es consistente, entonces es incompleta y que es indecidible. El primer resultado lo dio K. Gödel en 1931, y el segundo A. Church en 1936. La teoría de conjuntos es, desde el punto de vista metateórico, la más insegura de las teorías matemáticas de primer orden porque no sabemos si es consistente o no. Existen pruebas relativas de la consistencia de una axiomática respecto de la otra, pero es perfectamente posible que ambas teorías sean inconsistentes (véanse el Capítulo 5.2 y el Apéndice 1). Por otra parte, no cabe duda de que ésta es la más importante de las teorías axiomáticas de primer orden en razón de su potencia deductiva. En efecto, la teoría de conjuntos es mucho más potente que la lógica de primer orden o que la aritmética elemental porque permite deducir muchas otras teorías matemáticas (teorías del álgebra, el análisis y la geometría) que las otras dos no implican. Por ello, es una herramienta de fundamental importancia para el trabajo matemático, que se ha empleado hasta nuestros días sin que aparezcan contradicciones, pero sin la seguridad de que no se presentarán en el futuro.

Notas bibliográficas Hunter (1996) es una introducción detallada a la metateoría de la lógica de primer orden. Las pruebas de consistencia y completitud de la lógica de primer orden están expuestas, con diferentes medios y grados de dificultad, en casi todos los tratados de lógica, por ejemplo, Church (1956); Enderton (2001); Kleene (1952) y (1967); Machover (1996); Margaris (1990); Schoenfield (1967); Smullyan (1995) y Zalabardo (2002). Priest (2001) es un texto detallado sobre lógicas no clásicas, incluyendo la lógica paraconsistente, que se menciona al discutir el principio del Pseudo Scoto. Epstein (1995) es una obra enciclopédica que contiene mucha información sobre la lógica proposicional clásica y sobre las más diversas lógicas no clásicas.

El teorema de incompletitud de Gödel, y su corolario acerca de la indemostrabilidad de la consistencia, son difíciles de probar de manera completa y minuciosa. Nagel y Newman (1986) es una presentación no técnica. Crossley (1972) incluye una demostración breve y más detallada, pero accesible. Hamilton (1988) y Machover (1996) son otras presentaciones simplificadas, pero más precisas. En la nota bibliográfica al final del Apéndice 1 se indican otras obras más avanzadas. La indecidibilidad de la lógica de primer orden la prueban, entre muchos otros textos, Enderton (2001); Hunter (1996); Kleene (1952) y (1967). Los trabajos pioneros sobre la indecidibilidad de la lógica y la matemática se recopilan en Davis (1965). El problema de la decidibilidad de los sistemas formales se trata hoy en términos de la teoría de las funciones recursivas, que

116

JP 097a118-Cap4.QXD:0009

22/5/12

10:38

Página 117

NOTAS

BIBLIOGRÁ´FICAS

es una parte de la teoría de la computabilidad en general. Para introducciones amplias a este tema, pero muy diferentes, véanse las obras de Boolos, Burgess y Jeffrey (2007), Kunen (2009), Hermes (1971) y Wang (1993). Cutland (1986) es un tratado sistemático de nivel más avanzado. Sobre la teoría de conjuntos véase la nota bibliográfica al final del Capítulo 5. Introducciones a la lógica de segundo orden (tema que no tratamos en esta obra) se hallan en Church (1956), Enderton (2001), Boolos, Burgess y Jeffrey (2007) y Alchourrón, Méndez y Orayen (1995). Shapiro (2000) es un texto avanzado sobre lógica de segundo orden y cuestiones filosóficas acerca de las teorías de segundo orden.

117

JP 097a118-Cap4.QXD:0009

22/5/12

10:38

Página 118

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

5

Página 119

Teorías axiomatizadas

5.1 Introducción n este capítulo presentaré cuatro teorías axiomatizadas, todas ellas pertenecientes al campo de la matemática, que ofrecen ejemplos acabados del empleo del método axiomático. No demostraré de manera sistemática un conjunto amplio de teoremas de cada una de estas teorías, como se hace habitualmente en los libros de texto, sino que sólo ofreceré algunas demostraciones selectas a modo de ejemplos. En cambio, caracterizaré a los axiomas de estas teorías de una manera más detallada que lo habitual, introduciendo formalizaciones precisas de cada axioma y comentarios de tipo histórico y epistemológico. No hay ninguna secuencia lógica entre estas teorías, por lo que pueden leerse en cualquier orden. La primera teoría que presentaré es la teoría de conjuntos de Zermelo-Fraenkel con el axioma de elección. A este axioma en particular, dada su importancia histórica, le dedicaré una sección aparte. Luego, mencionaré otras axiomatizaciones rivales de la teoría de conjuntos, como la de Von Neumann-Gödel-Bernays, la de Kelley-Morse y la de Quine. No formularé los axiomas de estas teorías, con excepción de la de Quine, que sólo contiene dos axiomas sencillos. La segunda teoría axiomatizada que presentaré es la topología general o topología de conjuntos de puntos. Esta es una de las aplicaciones más exitosas de la teoría de conjuntos y, aunque ya la inició el propio Cantor, recibió su primera formulación axiomática en la obra de Hausdorff en 1914. Definiré algunos de los conceptos principales de la topología general y formularé los axiomas que caracterizan a las estructuras de espacio topológico y espacio métrico. También formularé los axiomas que definen a determinados tipos de espacios topológicos, tales como espacio de Hausdorff, espacio regular y espacio normal. La tercera teoría axiomatizada que expondré es la teoría de la probabilidad. Incluiré la formulación conjuntista de Kolmogorov, tanto con aditividad finita como con aditividad contable. Luego, introduciré la noción abstracta de espacio de probabilidades. Finalmente, ofreceré una axiomatización equivalente de la teoría, pero formulada en el lenguaje de la lógica proposicional clásica en vez del lenguaje de la teoría intuitiva de conjuntos.

E

119

JP 119a154-Cap5.QXD:0009

TEORI´AS

22/5/12

10:59

Página 120

AXIOMATIZADAS

La cuarta y última teoría que presentaré es la teoría abstracta de la medición. La primera formulación axiomática de esta teoría la hizo H. Von Helmholtz hacia fines del siglo XIX, pero desde entonces se ha refinado y perfeccionado hasta alcanzar un alto grado de sofisticación. Aquí ofreceré la axiomatización de una parte modesta, pero fundamental, de la teoría de la medición, las llamadas métricas combinatorias extensivas positivas. Existen muchos otros tipos de métricas, pero no sería oportuno intentar exponerlas aquí. En su conjunto, las cuatro teorías que presentaré ofrecen un ejemplo concreto y preciso de la manera en que el método axiomático se emplea en las ciencias matemáticas. El contenido de este capítulo es algo más técnico y difícil que el de los precedentes. En una primera lectura es posible omitirlo sin pérdida de continuidad. Sin embargo, la formulación axiomática de la teoría de conjuntos, a la que se aludió muchas veces a lo largo de esta obra, me parece esencial para comprender tanto las aplicaciones del método axiomático como sus limitaciones.

5.2 La teoría de conjuntos Hemos dicho reiteradamente que la axiomatización de la teoría de conjuntos representa uno de los mayores logros del método axiomático formal. Ya es hora, entonces, de que hagamos una presentación más detallada de este tema. Existen diversas axiomatizaciones de la teoría de conjuntos, pero la más exitosa ha sido la de Zermelo-Fraenkel, que es el producto de la teoría original propuesta por E. Zermelo en 1908 (tal como aparece en el Apéndice 2.14) junto con las adiciones y correcciones introducidas por A. Fraenkel en 1922 y por el propio Zermelo en 1930. El sistema axiomático completo consta de 9 axiomas. Se lo puede formalizar como una teoría de primer orden, que tiene como lógica subyacente a la lógica de primer orden con identidad, y un único término primitivo específico, el predicado diádico “pertenece” (∈). Los axiomas Ax1-Ax8 forman la teoría de Zermelo-Fraenkel propiamente dicha, que se abrevia usualmente como ZF. Los axiomas Ax1-Ax9 constituyen la teoría de Zermelo-Fraenkel con el axioma de elección, que abreviamos como ZFE. El sistema contiene dos esquemas de axiomas, y por consiguiente, no es una axiomatización finita de la teoría de conjuntos. Como puede apreciarse, los axiomas Ax1-Ax6 son prácticamente idénticos a los axiomas introducidos por Zermelo en 1908 (compárese con el Apéndice 2.14). El axioma de reemplazo (Ax7) lo propusieron, de manera independiente, A. Fraenkel en 1922 y Th. Skolem en 1923. Por esta razón, muchos autores afirman que la teoría debería llamarse de Zermelo, Fraenkel y Skolem, para hacer justicia al aporte del célebre matemático sueco. Sin embargo, ya en 1917 D. Mirimanoff había formulado ese axioma, que en realidad fue redescubierto por Fraenkel y Skolem. El axioma de

120

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 121

LA

TEORI´A DE CONJUNTOS

regularidad (Ax8), también llamado de fundamentación, es el más tardío, ya que lo introdujo Zermelo en 1930, cuando reformuló su axiomatización de 1908, aunque Von Neumann en 1925 lo había formulado al dar otra axiomatización de la teoría de conjuntos. Por último, el axioma de elección (Ax9) ya se hallaba en el sistema de Zermelo de 1908, pero hoy se lo considera separadamente del resto de la teoría. Por su importancia histórica, este axioma merece un comentario aparte. La estrategia general de ZF para la formación de conjuntos se conoce como limitación de tamaño y, de manera intuitiva, se puede caracterizar diciendo que se admite la existencia de conjuntos que no sean demasiado grandes como para generar antinomias. Ya hemos visto que el principio de comprensión utilizado por Cantor: ∃y ∀x (x ∈ y ↔ ϕx) permitía deducir enunciados contradictorios dentro de la teoría. La razón de ello es que era sumamente potente como para formar conjuntos arbitrariamente grandes. Zermelo se propuso limitar este principio de modo que no se produjeran antinomias, pero a la vez trató de preservar la mayor parte posible de las instancias de este principio, es decir, de los resultados de la teoría de conjuntos de Cantor. Los axiomas que introdujo para reemplazar al principio de comprensión pueden considerarse como instancias o casos particulares de este principio, con excepción del axioma de elección (Ax9), que tiene un carácter diferente. Zermelo y sus seguidores presentaron a la teoría de conjuntos como un sistema axiomático formal, pero escrito en un lenguaje no formalizado. Posteriormente se advirtió que el sistema ZF puede ser formalizado en un lenguaje de primer orden con identidad, que es la manera en que se lo presenta actualmente en los tratados de lógica, aunque los matemáticos prefieren a menudo la versión no formalizada. Aquí ofreceremos ambas formulaciones de cada axioma, primero un enunciado informal y luego su versión formalizada. Como resultará evidente, esta última formulación es más complicada y menos intuitiva. También haremos un breve comentario informal de cada axioma y, dada su importancia, algunas observaciones adicionales acerca del axioma de elección. Los axiomas de ZF son los siguientes: Ax1. Axioma de extensionalidad. Si dos conjuntos x e y tienen los mismos elementos, entonces x = y. ∀(xy) (∀z (z ∈ x ↔ z ∈ y) → x = y). El primer axioma de la teoría afirma simplemente que si dos conjuntos tienen todos sus elementos en común, entonces son idénticos, es decir, uno y el mismo conjunto. Cada conjunto está determinado exclusivamente por sus elementos. Dos conjuntos son diferentes cuando hay al menos un elemento que no

121

JP 119a154-Cap5.QXD:0009

TEORI´AS

22/5/12

10:59

Página 122

AXIOMATIZADAS

es común a ambos. Este principio ya había sido empleado por Cantor en la construcción de la teoría intuitiva de conjuntos. Zermelo y sus sucesores lo adoptaron sin cambios. Ax2. Axioma de los pares. Para cualesquiera objetos x y y existe un conjunto {x, y} que contiene como elementos exactamente a x y y. ∀(xy) ∃z ∀u (u ∈ z ↔ (u = x) v (u = y)). De acuerdo con este axioma, dados dos objetos a y b (sean o no conjuntos), se puede asegurar la existencia del conjunto llamado el par de a y b, escrito como {a, b}. Este es un par no ordenado, por lo que {a, b} = {b, a}. Dado el conjunto {a, b}, el axioma de los pares autoriza la formación de otros conjuntos de dos elementos, como por ejemplo, {{a, b}, a}; {{a, b}, b}, etc. Ax3. Axioma esquema de separación. Si ϕ es una propiedad, entonces para todo conjunto x existe un conjunto y que contiene a todos los elementos de x que tienen la propiedad ϕ. ∀x ∃y ∀z (z ∈ y ↔ (z ∈ x & ϕ(z)) [Suponiendo que y no es una variable libre en ϕ]. Este es seguramente el axioma más original y característico de la teoría ZF. Es evidentemente una modificación del axioma de comprensión de Cantor. Zermelo lo llamó axioma de separación, pero también se lo conoce como axioma de subconjuntos. La idea intuitiva detrás de este principio es que garantiza la existencia de los subconjuntos de un conjunto dado, aquellos determinados por la propiedad ϕ. Luego, si el conjunto previamente existente no es demasiado grande, tampoco lo será ninguno de sus subconjuntos. De acuerdo con este axioma, toda propiedad ϕ determina un conjunto, a condición de que éste sea un subconjunto de un conjunto ya dado. Por tanto, en ZF ya no ocurre que para toda propiedad existe un conjunto que es su extensión. Zermelo, en su formulación original de 1908, había enunciado la condición de que ϕ debía ser una propiedad bien definida, esto es, que un enunciado de la forma ϕ(z) fuera verdadero o falso respecto de cualquier objeto del dominio de la teoría. Esta noción un poco vaga fue clarificada por Th. Skolem en 1922, quien propuso considerar a ϕ(z) como una condicion sobre z, o sea, como una fórmula bien formada del sistema en la cual la variable z está libre. Esta es desde entonces la manera usual de entender la expresión ϕ(z) en el axioma de separación.

122

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 123

LA

TEORI´A DE CONJUNTOS

El axioma de separación resulta por consiguiente un esquema de axioma, que tiene tantas instancias como casos de sustitición posibles tiene ϕ(z), esto es, infinitas. Se ha probado que este esquema de axioma no puede sustituirse por un número finito de axiomas, y, por consiguiente, que ZF no es finitamente axiomatizable. Ax4. Axioma de unión. Para todo conjunto x existe un conjunto y que contiene como elementos exactamente a todos los elementos de los elementos de x. ∀x ∃y ∀z (z ∈ y ↔ ∃u (u ∈ x & z ∈ u)). Este axioma afirma que, dado un conjunto de conjuntos a, existe otro conjunto ∪a (el conjunto unión o conjunto suma) que tiene como elementos a todos los elementos de los conjuntos contenidos en a. Esto es, si el conjunto a tiene como elementos a los conjuntos b, c, d,... entonces todos los elementos de b, c, d,..., y sólo ellos, están contenidos en ∪a. Este axioma permite construir, a partir de dos conjuntos dados a y b, la unión a ∪ b, que también es un conjunto. En efecto, si a y b son conjuntos, el axioma de los pares afirma que existe el conjunto c = {a, b}; y de acuerdo con el axioma de unión ∪c = a ∪ b. Ax5. Axioma del conjunto potencia. Para todo conjunto x existe un conjunto y que tiene como elementos exactamente a todos los subconjuntos de x. ∀x ∃y ∀z (z ∈ y ↔ ∀u (u ∈ z → u ∈ x)). Este axioma afirma que dado un conjunto a existe otro conjunto ℘a que contiene como elementos a todos los subconjuntos de a y sólo a ellos. ℘a es un conjunto de conjuntos, del cual también existe el conjunto potencia, y así sucesivamente: b = ℘a, ℘b = ℘℘a, etc. De este modo, el axioma del conjunto potencia permite generar un número infinito de conjuntos a partir de un conjunto dado a, formándose una secuencia infinita: a, ℘a, ℘℘a, ℘℘℘a ... . Ax6. Axioma de infinitud. Existe un conjunto x que satisface las siguientes condiciones: i) ∅ ∈ x; ii) para todo conjunto y ∈ x también y ∪ {y} ∈ x. ∃x (∅ ∈ x & ∀y (y ∈ x → y ∪ {y} ∈ x)).

123

JP 119a154-Cap5.QXD:0009

TEORI´AS

22/5/12

10:59

Página 124

AXIOMATIZADAS

Este axioma afirma la existencia de al menos un conjunto que contiene infinitos elementos. Sin este axioma resulta imposible probar que existen conjuntos infinitos en ZF. Además, todo conjunto que satisfaga las condiciones i) y ii) es infinito. Por ejemplo, un conjunto z que cumple con estas condiciones es el que contiene como elementos a: ∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}, ... etc. Ax7. Axioma esquema de reemplazo. Si ƒ es una función, entonces, para todo conjunto x existe un conjunto y tal que y = ƒ (x). ∀x ∃y (ƒ(x, y) & ∀z (ƒ(z, y) → z = y)) → ∀x ∃y ∀t (t ∈ y ↔ ∃u (u ∈ x & ƒ(u, t))). Esto quiere decir que si el dominio de una función es un conjunto, el codominio de esa función también constituye un conjunto. Dado que el codominio de la función debe ser un conjunto que no tiene más elementos que el dominio, si el dominio no es demasiado grande tampoco el codominio será un conjunto demasiado grande. Este axioma lo propusieron de manera independiente A. Fraenkel y Th. Skolem en 1922. En una forma algo diferente ya había sido sugerido por D. Mirimanoff en 1917. Este axioma es necesario para asegurar la existencia de conjuntos infinitos de cardinalidades grandes (como ℵω), que ya se encuentran en la teoría de Cantor. También es indispensable para probar diversos teoremas de la aritmética de los números ordinales, que requieren el método general de inducción transfinita. Ax8. Axioma de fundamentación: Todo conjunto no vacío x contiene al menos un elemento cuyos elementos no pertenecen a x. ∀x (∃y (y ∈ x) → (∃y (y ∈ x & ¬ ∃z (z ∈ y & z ∈ x)))). Una forma más intuitiva de escribir este axioma, empleando términos definidos de la teoría de conjuntos, es la siguiente: ∀x ((x ≠ ∅) → (∃y (y ∈ x) & (y ∩ x = ∅))). El significado de este axioma, también llamado axioma de regularidad, es que los conjuntos están bien fundados con respecto a la relación de pertenencia, de modo que pueden disponerse en capas o estratos: individuos, conjuntos de individuos, conjuntos de conjuntos de individuos, y así sucesivamente. Una consecuencia de este axioma es que no existen conjuntos que pertenecen a sí mismos, es decir, no hay ningún conjunto a tal que a ∈ a. Tampoco hay conjuntos a y b tales que (a ∈ b) & (b ∈ a); ni secuencias (finitas o infinitas) de conjuntos tales que a ∈ b ∈ c ... ∈ a. 124

JP 119a154-Cap5.QXD:0009

24/5/12

17:02

Página 125

LA

TEORI´A DE CONJUNTOS

Ax9. Axioma de elección. Todo conjunto de conjuntos no vacíos tiene una función de elección. ◊ Una función de elección sobre un conjunto de conjuntos no vacíos a es una función f cuyo dominio es a, tal que para todo x ∈ a, f (x) ∈ x. ∀t (∀x (x ∈ t → ∃z (z ∈ x) & ∀y (y ∈ t & y ≠ x → ¬ ∃z (z ∈ x & z ∈ y))) → ∃u ∀x (x ∈ t → ∃w ∀v (v = w ↔ (v ∈ u & v ∈ x)))). El significado intuitivo de este axioma es que dado un conjunto de conjuntos no vacíos, existe un conjunto selectivo que se obtiene eligiendo exactamente un elemento de cada elemento del conjunto de partida. Esto es, si a es un conjunto de conjuntos tal que ∅ ∉ a, entonces, existe el conjunto c tal que, para cualquier x ∈ c, la intersección c ∩ x tiene exactamente un elemento.

El axioma de elección y sus dificultades Este axioma tiene una larga y debatida historia y ha sido examinado con mucho detalle. Aquí sólo podemos limitarnos a algunas observaciones importantes. La primera formulación explícita del axioma de elección la hizo G. Peano en 1890, aunque el axioma ya lo había usado Cantor, sin reconocerlo como un principio. En 1904 Zermelo lo utilizó en su célebre demostración del teorema del buen orden, según el cual todo conjunto puede ser bien ordenado (un conjunto está bien ordenado cuando todo subconjunto no vacío tiene primer elemento). En 1908 Zermelo lo incluyó entre sus axiomas para la teoría de conjuntos. Desde ese momento se lo reconoce como un principio indispensable para la matemática, porque es necesario para probar diversos teoremas básicos de la aritmética. Pronto se probó que el teorema del buen orden y el axioma de elección son lógicamente equivalentes. Posteriormente, se descubrieron muchos otros teoremas de la teoría de conjuntos que son equivalentes al axioma de elección, por ejemplo, el principio maximal de Hausdorff (1914), el lema de Zorn (1935) y el lema de Tukey-Teichmüller (1939-40) (para referencias precisas sobre este punto véase la bibliografía indicada al final de este capítulo). El axioma de elección no es, a diferencia de otros axiomas de ZF, una instancia del principio de comprensión. Es un postulado puramente existencial que afirma la existencia de un conjunto sin caracterizarlo como la extensión de una propiedad previamente especificada. Esto lo hizo sospechoso para muchos matemáticos, especialmente intuicionistas o constructivistas. En efecto, el axioma no indica cómo construir el conjunto selectivo. Dado un conjunto de conjuntos

125

JP 119a154-Cap5.QXD:0009

TEORI´AS

22/5/12

10:59

Página 126

AXIOMATIZADAS

hay muchas maneras de elegir un elemento de cada elemento para formar el conjunto selectivo. Por otra parte, pronto se advirtió que tenía consecuencias contraintuitivas. Una de ellas es la llamada paradoja de Banach y Tarski (descubierta por estos autores en 1924), la cual, entre otras cosas, tiene como consecuencia que es posible descomponer una esfera en un número finito de partes congruentes y luego reunirlas para formar otra esfera cuyo radio es el doble del radio de la esfera original. Durante mucho tiempo se pensó que el axioma de elección (y sus equivalentes) podía deducirse de los restantes axiomas de ZF. Ahora sabemos que esto es posible cuando se trata de conjuntos finitos, pero no para el caso de conjuntos infinitos. Hay dos hitos fundamentales en el análisis de este axioma. En 1938 K. Gödel demostró la consistencia relativa del axioma de elección respecto de los restantes axiomas de ZF. Esto es, si ZF es consistente, entonces, ZFE también lo es, lo cual prueba que la negación del axioma de elección no se deduce de los restantes axiomas de ZF. Dicho axioma puede tener consecuencias extrañas pero no introduce contradicciones en la teoría de conjuntos. Por su parte, en 1963 P. Cohen probó que el axioma de elección no se deduce de los demás axiomas de ZF. Por consiguiente, la negación del axioma de elección tampoco lleva a contradicciones, de modo que si ZF es consistente, también lo es ZF & ¬E. Así, Cohen demostró que el axioma de elección es independiente de los restantes axiomas de ZF. De allí se sigue que es posible construir teorías de conjuntos alternativas, con y sin el axioma de elección, las cuales serán ambas consistentes, suponiendo que ZF lo sea. Conjuntamente, los resultados de Gödel y de Cohen implican que el axioma de elección no puede ser probado ni refutado mediante los recursos de la teoría de conjuntos ZF. Constituye una proposición formalmente indecidible para esta teoría. En este aspecto, la situación es comparable a la de la existencia de diferentes geometrías euclídeas y no euclídeas, que se obtienen negando el axioma de las paralelas (del cual también sabemos que es independiente de los otros axiomas euclídeos). Si nos preguntamos cuál de las teorías de conjuntos (ZFE o ZF¬E) es la correcta o verdadera, la respuesta es que no sabemos cómo determinarlo, o incluso podemos dudar de si tal pregunta tiene sentido.

Propiedades generales de la teoría de conjuntos Para concluir, podemos repasar brevemente las propiedades metateóricas conocidas de la teoría de Zermelo-Fraenkel. La consistencia absoluta de ZF no ha sido probada. Ya hemos dicho que, como consecuencia del segundo teorema de Gödel, no es posible demostrar la consistencia de este sistema mediante recursos formalizables dentro del mismo (véase el Apéndice 1). Toda prueba absoluta de consistencia de ZF (o de cual-

126

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 127

LA

TEORI´A DE CONJUNTOS

quier otro sistema axiomático de conjuntos) deberá hacerse empleando otro sistema formal cuya consistencia será, por lo menos, igualmente dudosa. Un ejemplo de este tipo de prueba es el ofrecido por Quine, de acuerdo con el cual se puede probar en el sistema de su Mathematical Logic (Quine 1951) que ZF es consistente. El sistema de Quine es más potente que ZF, pero su consistencia no está asegurada. Hay muchas pruebas relativas de la consistencia de ZF, o de partes de él, respecto de otros sistemas formales. La más importante es la obtenida de manera independiente por I. Novak y por B. Rosser y H. Wang en 1950, quienes demostraron que si el sistema ZF es consistente, entonces también lo es el sistema VNBG (Von Neumann, Bernays y Gödel). Esto implica que no puede ocurrir que VNBG sea inconsistente y ZF no lo sea. ZF es incompleto, suponiendo que sea consistente. Esta es una consecuencia del primer teorema de Gödel, que prueba que cualquier sistema axiomático formal que contenga a la aritmética elemental (como es el caso de ZF), si es consistente, entonces es incompleto. ZF es indecidible. Esta es una consecuencia del hecho de que ZF contiene a la aritmética elemental. Church demostró en 1936 que la aritmética elemental es indecidible. Por consiguiente, también será indecidible todo sistema formal que permita expresar a la aritmética elemental. ZF no es categórico. Los axiomas del sistema postulan la existencia de conjuntos infinitos y aseguran la posibilidad de construir conjuntos infinitos de conjuntos infinitos, y así sucesivamente. Por tanto, si ZF tuviera algún modelo, el dominio de ese modelo debería ser infinito, esto es, tener infinitos elementos. Ya hemos visto que ningún sistema de primer orden que tenga modelos infinitos puede ser categórico. Esta es una consecuencia de la versión ascendente del teorema de Löwenheim y Skolem (véase el Capítulo 4.1). Los axiomas de ZF no son todos independientes entre sí. El axioma de los pares se deduce de los axiomas de reemplazo y del conjunto potencia. Además, el axioma de separación se deduce del axioma de reemplazo. El propio Zermelo demostró estos resultados en 1930. Los restantes axiomas son todos independientes. El sistema axiomático de Zermelo-Fraenkel ha sido siempre el preferido por la mayoría de los matemáticos profesionales hasta la actualidad. No obstante, como dijimos en el Capítulo 1, existen muchas otras axiomatizaciones de la teoría de conjuntos, las cuales no son equivalentes entre sí. La alternativa más importante al sistema ZF es el sistema de Von Neumann, Bernays y Gödel (VNBG), cuyos axiomas no vamos a exponer aquí (véanse las referencias al final de este capítulo). La teoría VNBG parece en primera instancia muy diferente del sistema ZF porque admite la existencia de conjuntos muy grandes, tales como la clase universal, que no pueden construirse en el sistema ZF. A estos conjuntos se los denomina clases últimas porque no pueden a su vez ser

127

JP 119a154-Cap5.QXD:0009

TEORI´AS

22/5/12

10:59

Página 128

AXIOMATIZADAS

elementos de otros conjuntos. Sin embargo, una vez que se estudiaron las propiedades metateóricas de este sistema y sus relaciones con el sistema ZF, se advirtió que las diferencias no son en realidad tan grandes. Ante todo, el sistema VNBG es finitamente axiomatizable, mientras que ZF no lo es porque no puede axiomatizarse sin emplear al menos un esquema de axioma. También se probó, como ya dijimos, la consistencia relativa de VNBG respecto de ZF, de modo tal que si ZF es consistente, VNGB también lo es. Finalmente, el resultado más importante fue la prueba de que el sistema VNBG es una extensión conservativa (véase el Capítulo 6.2) del sistema ZF, esto es, si χ es una fórmula de ZF, entonces, si χ es un teorema de VNBG, es también un teorema de ZF.

Otros sistemas axiomáticos Existen muchos otros sistemas axiomáticos para la teoría de conjuntos, de los cuales mencionaremos solamente los de W. Quine y A. Morse, formulados por primera vez en 1937 y 1955, respectivamente. El sistema de Quine, conocido como New Foundations o NF, se basa en la estratificación del lenguaje en diferentes niveles jerárquicos. La idea de estratificación de una fórmula es la siguiente. En una fórmula estratificada ϕ(y) cada variable de ϕ(y) lleva como rótulo un número entero, de tal manera que en toda fórmula atómica que sea parte de ϕ(y) y tenga la forma x ∈ y, el número que rotula a y es el sucesor del número que rotula a x. En un lenguaje estratificado de este tipo se evitan las paradojas como la de Russell, ya que una fórmula como ϕ = x ∉ x no se puede construir porque no está estratificada. Consiguientemente, no existe la clase {x : x ∉ x}. Los axiomas del sistema NF son variantes de los principios de extensionalidad y de comprensión empleados por Cantor: Ax1. ∀(xy) (∀z (z ∈ x ↔ z ∈ y) → ∀u (x ∈ u ↔ y ∈ u) [Axioma de extensionalidad]. Ax2. ∃x ∀y (y ∈ x ↔ ϕ(y))

(donde ϕ(y) es una fórmula estratificada cualquiera en la que x no aparece libre) [Axioma esquema de comprensión].

El sistema de Quine permite deducir una parte importante de la matemática. Sin embargo, E. Specker demostró en 1953 que dicho sistema admite la refutación del axioma de elección, lo cual lo hace muy poco interesante para los matemáticos, dada la importancia de este axioma en la matemática actual. La con-

128

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 129

LA

TOPOLOGI´A GENERAL

sistencia del sistema de Quine no ha sido probada, como ocurre con todas las teorías de conjuntos. El sistema de Morse lo presentó inicialmente J. Kelley en un libro de texto sobre topología general (Kelley 1955). Se trata de una variante del sistema VNBG, variante que consiste en admitir que para toda fórmula ϕ(x) es posible formar la clase {x : ϕ(x)}. Emplea ocho axiomas, entre los cuales se encuentra el axioma de elección, y un esquema de axioma. Es una teoría de conjuntos sumamente potente, acerca de la cual se ha demostrado que no es una extensión conservativa de ZF. En la teoría de Morse se puede demostrar la propia consistencia de ZF. Por supuesto, la consistencia del sistema de Morse no se ha probado, y, dado que se trata de una teoría más potente que ZF, su propia consistencia es aun más dudosa que la de ZF.

5.3 La topología general La topología general o topología de conjuntos de puntos es una rama de la matemática que estudia las propiedades del espacio que se conservan cuando se realizan transformaciones continuas. Esta es una caracterización algo inexacta, que enseguida haremos más precisa. Por el momento, consideremos algunos ejemplos. Una esfera y un cubo son topológicamente equivalentes, es decir, tienen las mismas propiedades topológicas, porque es posible obtener uno de estos cuerpos deformando de manera continua el otro (esto es, sin cortar partes unidas ni unir partes separadas). En cambio, un toroide (un cuerpo con la forma de una dona o una cámara de neumático) no es topológicamente equivalente a una esfera o un cubo. Ninguna deformación continua de una esfera o un cubo puede producir un toroide, ni a la inversa. La esfera y el toroide tienen algunas propiedades topológicas muy diferentes. Por ejemplo, si se traza una circunferencia sobre la superficie de una esfera, siempre es posible trazar otra circunferencia dentro de ella, que tenga el mismo centro pero un radio menor. Sobre la superficie de la esfera no existen circunferencias de radio mínimo. Sobre la superficie de un toroide, en cambio, hay algunas circunferencias que no pueden contraerse más allá de un radio determinado, como ocurre con las que rodean al agujero central. Las transformaciones topológicas, llamadas homeomorfismos, son las que preservan la continuidad de los puntos del espacio o de cualquier conjunto de puntos en general. No siempre conservan la distancia entre puntos, ni los ángulos, ni el paralelismo entre rectas. Hay, sin embargo, muchas propiedades que permanecen invariantes cuando se deforma de manera continua un cuerpo o una figura. Por ejemplo, el número de dimensiones del respectivo cuerpo o figura. La topología general se ocupa de estudiar estas propiedades invariantes y la manera en que se relacionan entre sí.

129

JP 119a154-Cap5.QXD:0009

TEORI´AS

22/5/12

10:59

Página 130

AXIOMATIZADAS

La topología general, o topología de conjuntos de puntos, es una de las aplicaciones más fructíferas de la teoría de conjuntos de G. Cantor. Muchos de los teoremas fundamentales de esta disciplina los descubrió el propio Cantor en las décadas de 1880 y 1890. La primera axiomatización de la topología general la realizó F. Hausdorff en su célebre libro Fundamentos de la teoría de conjuntos publicado en 1914 (véase el Apéndice 2.15), obra que contribuyó notablemente a la aceptación de la teoría de conjuntos por parte de la comunidad de los matemáticos. Después se propusieron muchas axiomatizaciones diferentes, todas equivalentes entre sí, que empleaban términos primitivos distintos de los de Hausdorff. Durante la primera mitad del siglo XX la topología de conjuntos de puntos se desarrolló vigorosamente, hasta convertirse en la base (esto es, en un presupuesto necesario) no sólo de la geometría, sino también del análisis y de otras ramas de la matemática. Una de las razones de tal desarrollo es que la topología general presupone una parte relativamente elemental y segura de la teoría intuitiva de conjuntos. Una parte que parece estar a salvo de la amenaza de las paradojas o contradicciones que acechan a la teoría de conjuntos tomada en su totalidad. Aquí sólo ofreceremos los axiomas más habituales que se emplean para definir la estructura de espacio topológico, junto con las definiciones de algunos términos importantes de la topología general. Definiremos, entonces, la noción de homeomorfismo, que acabamos de emplear de manera informal. Luego caracterizaremos mediante axiomas específicos otros espacios topológicos, como el espacio de Hausdorff, el espacio regular y el espacio normal. Para concluir, introduciremos la definición axiomática del concepto de espacio métrico.

Los espacios topológicos Los conceptos fundamentales de la topología general son los de conjunto abierto, conjunto cerrado y entorno de un punto. En la mayoría de las axiomatizaciones corrientes de la topología uno de estos términos se toma como primitivo y los otros dos se introducen como términos definidos. Aquí seguiremos la práctica más usual y tomaremos “conjunto abierto” como término primitivo. La lógica subyacente del sistema será (una parte de) la teoría intuitiva de conjuntos. Con estos elementos definiremos la noción de espacio topológico de la siguiente manera: ◊ Si E es un conjunto no vacío de elementos cualesquiera, y T es una familia de conjuntos abiertos tal que T ⊆ ℘E, 〈E, T〉 es un espacio topológico si y sólo si cumple con los siguientes axiomas:

130

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 131

LA

TOPOLOGI´A GENERAL

Ax1. E ∈ T.

Ax2. ∅ ∈ T.

Ax3. Si A y B ∈ T, entonces, A ∩ B ∈ T.

Ax4. Si A1, A2, ... Ak ∈ T, entonces A1 ∪ A2 ∪ … ∪ Ak ∈ T. Estos axiomas afirman que el espacio E y el conjunto vacío ∅ son dos conjuntos abiertos que pertenecen a la familia de conjuntos T. Que la intersección de dos conjuntos cualesquiera de T también pertenece a T. Y que la unión de cualquier número finito o infinito de conjuntos de T también pertenece a T. Los elementos de E se llaman, convencionalmente, puntos. La familia de conjuntos abiertos T se llama una topología de E. Se dice, entonces, que T topologiza a E. Hay diversas maneras de topologizar un conjunto de puntos como E. Si la topología T contiene a todos los subconjuntos de E (esto es, si T = ℘E), la topología se llama discreta. Si, en cambio, T contiene solamente al conjunto vacío y a sí mismo (esto es, si T = {∅, T}), la topología se llama indiscreta o trivial. Las topologías discreta e indiscreta de E son, respectivamente, las topologías máxima y mínima de E. Toda topología de E está contenida en la topología discreta y, además, toda topología de E contiene a la topología indiscreta. Dadas dos topologías T1 y T2 de un mismo conjunto E tales que T1 ⊆ T2, se dice que T2 es más fina que T1 y que T1 es más gruesa que T2. Si T1 債 T2 y T2 債 T1, se dice que T1 y T2 no son comparables. Como puede advertirse por estas definiciones, la topología discreta es la más fina de todas las topologías posibles de un conjunto de puntos, mientras que la topología indiscreta es la más gruesa. Una topología más fina que otra contiene más conjuntos que aquélla y posee, por así decir, un mayor poder de resolución, tal como una fotografía de grano fino de un objeto respecto de otra de grano grueso del mismo objeto. La topología de un conjunto E se puede especificar describiendo la colección completa T de conjuntos abiertos. Dado que, en general, es bastante difícil hacer esta descripción completa, usualmente se especifica una colección más pequeña de subconjuntos de E que tiene la capacidad de definir a la topología T en su totalidad. Se la llama la base de T y se la define de esta manera: ◊ Dado un espacio topológico 〈E, T〉, una base para la topología T es una familia B de subconjuntos de E (llamados elementos básicos) tales que: (i) Para todo punto x ∈ E hay al menos un elemento básico B tal que x ∈ B¸ (ii) para todo punto x ∈ E, si x ∈ B1 ∩ B2 entonces, existe un elemento básico B3 tal que x ∈ B3 y B3 ⊆ B1 ∩ B2.

131

JP 119a154-Cap5.QXD:0009

TEORI´AS

22/5/12

10:59

Página 132

AXIOMATIZADAS

B se llama una base para la topología T y se dice que T es generada por B . Una consecuencia de la definición anterior, que no probaremos ahora, es que B es una base para T si y sólo si todo elemento de T es una unión de elementos de B . Esta propiedad a veces se utiliza como definición de base. Hay también otras definiciones posibles, que pueden encontrarse en la bibliografía sobre el tema. Los términos conjunto cerrado y entorno se introducen por definición de la siguiente manera: Definición 1. A es un conjunto cerrado si y sólo si E ~ A es un conjunto abierto (para todo A ⊆ E). Definición 2. Ux es un entorno del punto x si y sólo si, i) Ux ⊆ E. ii) Hay un conjunto abierto U’x tal que U’x ⊆ Ux. iii) x ∈ U’x. La primera definición afirma que un conjunto cerrado es el complemento de un conjunto abierto, de modo que si A es abierto en E, ~A es cerrado, y viceversa. El conjunto vacío ∅ y el espacio E son a la vez abiertos y cerrados. En efecto, según el axioma 1, E es abierto, y, según la definición 1, su complemento ∅ es cerrado. Pero, de acuerdo con el axioma 2, ∅ es abierto y, por la misma definición 1, su complemento E es cerrado. La segunda definición afirma que el entorno de un punto es un conjunto que contiene un conjunto abierto al cual pertenece ese punto. Según esta definición, un entorno puede ser tanto un conjunto abierto como un conjunto cerrado. Por otra parte, todo conjunto abierto es entorno de cada uno de sus puntos. Más aun, puede probarse como teorema que un conjunto es abierto si y sólo si es entorno de cada uno de sus puntos. La topología general habitualmente emplea muchos otros términos definidos, como “clausura”, “interior”, “frontera”, “punto de acumulación” y otros, cuyas definiciones no necesitamos dar aquí, pero pueden encontrarse en cualquier tra tado de topología (véase la nota bibliográfica al final de este capítulo). La transformación entre espacios topológicos que preserva la continuidad en tre los puntos de cada espacio se denomina homeomorfismo. Un homeomorfismo es una función biyectiva y bicontinua (véase el Apéndice 3 para la caracterización de estos conceptos) entre dos espacios topológicos. Se la define de la siguiente manera:

132

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 133

LA

TOPOLOGI´A GENERAL

◊ Un homeomorfismo es una función de un espacio topológico A en un espa cio topológico B (ƒ: A → B) tal que: i) ƒ es biyectiva.

ii) ƒ es continua.

iii) ƒ -1 es continua. La topología general puede caracterizarse como el estudio de las propiedades geométricas del espacio, o más en general, de conjuntos de elementos cualesquiera, que son invariantes bajo homeomorfismos. Definamos ahora la noción de espacio de Hausdorff. ◊ Un espacio topológico 〈E, T〉 es un espacio de Hausdorff si y sólo si satisface el siguiente axioma: Ax5. Si x e y son dos puntos cualesquiera de E tales que x ≠ y, existen dos entornos de x e y, Ux, Uy, tales que Ux ∩ Uy = ∅. Este axioma, introducido por F. Hausdorff, es uno de los llamados axiomas de separación. Por esta razón, el espacio de Hausdorff se llama también espacio separado. El axioma afirma que para dos puntos diferentes cualesquiera existen dos entornos disjuntos de esos puntos. Como es obvio por la propia definición, todo espacio de Hausdorff es un espacio topológico, pero no a la inversa. Otros espacios topológicos separados son el espacio regular y el espacio nor mal, a los que definiremos de la siguiente manera: ◊ Un espacio topológico 〈E, T〉 es un espacio regular si y sólo si satisface el siguiente axioma: Ax6. Para todo punto x ∈ E y todo conjunto cerrado A ⊆ E tal que x ∉ A, existen dos conjuntos abiertos, Ux y O, tales que x ∈ Ux, A ⊆ O y Ux ∩ O = ∅. ◊ Un espacio topológico 〈E, T〉 es un espacio normal si y sólo si satisface el siguiente axioma: Ax7. Para todo par de conjuntos cerrados A, B ⊆ E tales que A ∩ B = ∅, exis ten dos conjuntos abiertos, O1 y O2, tales que A ⊆ O1, B ⊆ O2 y O1 ∩ O2 = ∅.

133

JP 119a154-Cap5.QXD:0009

TEORI´AS

22/5/12

10:59

Página 134

AXIOMATIZADAS

Los axiomas Ax6 y Ax7 son axiomas de separación más fuertes que el axioma de Hausdorff Ax5, en el sentido de que ambos lo implican, pero no son implicados por éste. Como es evidente por las definiciones, todo espacio regular es un espacio de Hausdorff y todo espacio normal es un espacio regular. Los tres axiomas de separación expresan de manera precisa las nociones intuitivas de proximidad y separación entre puntos del espacio.

Los espacios métricos La noción de espacio métrico la introdujo M. Fréchet en 1906 como parte de su estudio de los “espacios abstractos”, como se los llamaba en ese momento. El nombre “espacio métrico” se debe a F. Hausdorff (Hausdorff 1914, p. 211). Intuitivamente, un espacio métrico es un conjunto de objetos donde está determinada la distancia entre dos elementos cualesquiera de ese conjunto. Un espacio métrico es un conjunto de objetos cualesquiera E, entre los cua les se define una función binaria que a cada par ordenado 〈a, b〉 de elementos de E le asigna un número real. La distancia δ es esta función que asigna un número real a cada par de puntos próximos del conjunto E (δ: E x E → ⺢). Co mo lógica subyacente se emplea, como es habitual en casi todas las teorías matemáticas axiomatizadas, la teoría intuitiva de conjuntos. En el lenguaje formal, la función distancia está representada por un funtor de segundo grado ƒ2(xy), pero aquí lo escribiremos simplemente como δ(x, y). Las condiciones que debe cumplir la función distancia están dadas por los axiomas. Tomando como primitivo al término “distancia” se puede definir el concepto de espacio métrico de la siguiente manera: ◊ Si E es un conjunto no vacío de elementos cualesquiera, y δ es una función binaria que asigna un número real a cada par de elementos de E (δ: E x E → ⺢), 〈E, δ〉 es un espacio métrico si y sólo si satisface estos axiomas: Ax1. δ(x, y) = 0 ↔ x = y.

Ax2. (δ(x, y) + δ(y, z) ≥ δ(z, x)). Los elementos de E se llaman, convencionalmente, puntos. El número real δ(x, y) se denomina la distancia entre los puntos x e y. La función δ se llama la métrica o función distancia de E. El primer axioma afirma que la distancia entre dos puntos sólo es igual a cero cuando esos dos puntos son idénticos, de modo que siempre ocurre que δ(x, x) = 0. El segundo axioma, llamado axioma de desigualdad triangular, dice que la distancia sobre uno de los lados de un triángulo es siempre menor o igual que la suma de las distancias sobre los otros dos lados. O, de manera más ge-

134

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 135

LA

TOPOLOGI´A GENERAL

neral, que la distancia entre dos puntos cualesquiera nunca es mayor que la suma de las distancias de cada uno de ellos respecto de un tercer punto. Generalmente, δ(z, x) es menor que δ(x, y) + δ(y, z). En ambos axiomas, todas las variables deben considerarse cuantificadas universalmente (es decir, para todo x, y, z ∈ E), aunque en la práctica matemática usualmente se omiten estos cuantificadores. A menudo se incluyen en la definición de espacio métrico otros dos axiomas: el de simetría (δ(x, y) = δ(y, x)), que afirma que la distancia entre dos puntos es simétrica; y el de positividad (δ(x, y) ≥ 0), que afirma que la distancia entre dos puntos nunca es negativa. Sin embargo, estos axiomas no son independientes de los dos anteriores, por lo que su inclusión es redundante. Probaremos ahora que estos axiomas se deducen de Ax1 y Ax2. Teorema 1 δ(x, y) = δ(y, x). Demostración: 1. δ(x, y) ≤ δ(y, z) + δ(z, x)

2. δ(x, y) ≤ δ(y, x) + δ(x, x)

3. δ(x, x) = 0

4. δ(x, y) ≤ δ(y, x)

5. δ(y, x) ≤ δ(x, w) + δ(w, y)

6. δ(y, x) ≤ δ(x, y) + δ(y, y)

7. δ(y, y) = 0

8. δ(y, x) ≤ δ(x, y)

9. δ(x, y) = δ(y, x)

[De Ax2] [De 1, sustituyendo z por x] [De Ax1] [De 2 y 3] [De Ax2] [De 5, sustituyendo w por y] [De Ax1] [De 6 y 7] [De 4 y 8]

Teorema 2 δ(x, y) ≥ 0. Demostración: 1. δ(z, x) ≤ δ(x, y) + δ(y, z)

2. δ(x, x) ≤ δ(x, y) + δ(y, x)

3. 0 ≤ δ(x, y) + δ(y, x)

4. δ(x, y) = δ(y, x)

5. 0 ≤ 2δ(x, y) 6. δ(x, y) ≥ 0)

[De Ax2] [De 1, sustituyendo z por x] [De 2 y Ax1] [Teorema 1] [De 3 y 4] [De 5]

135

JP 119a154-Cap5.QXD:0009

TEORI´AS

22/5/12

10:59

Página 136

AXIOMATIZADAS

El espacio euclídeo es el ejemplo más conocido de un espacio métrico. En dos dimensiones, es decir, en el plano euclídeo la distancia entre dos puntos se define como: δ(x, y) = (x1 - y1)2 + (x2 - y2)2. En un número n de dimensiones n la función distancia tiene la siguiente forma general: δ(x, y) = ∑ i = 1 (xi - yi)2. Hay muchos otros espacios métricos, como, por ejemplo, el conjunto de los números reales ⺢, donde la función distancia se define como: δ(x, y) = x - y . Todo espacio métrico es un espacio de Hausdorff. Este teorema fundamental puede probarse cuando se admite como entorno de cada punto x de un espacio métrico a una esfera abierta que contiene a x. Una esfera abierta es el subconjunto de todos los puntos de E tales que δ(x, y) < r, donde r es un nú mero real positivo. Los entornos de E constituidos por las esferas abiertas de E satisfacen los cuatro axiomas que definen un espacio de Hausdorff. La relación entre espacios topológicos y espacios métricos constituye uno de los capítulos principales de la topología general, pero ese es un tema que excede los alcances de este libro.

5.4 La teoría de la probabilidad Consideremos ahora un ejemplo de un sistema axiomático formulado en un lenguaje no formalizado, tal como la teoría matemática de la probabilidad, axiomatizada por primera vez en 1933 por el gran matemático ruso A. Kolmogorov. Nos detendremos con más detalle en esta teoría con el fin de observar en acción el desarrollo de una teoría axiomática formal expuesta en un lenguaje no formalizado. Además de exponer los axiomas del sistema, presentaremos varios teoremas importantes, de los cuales sólo daremos la demostración de uno. Comencemos, ante todo, presentando de manera intuitiva los conceptos fundamentales del lenguaje de esta teoría. “Evento” y “probabilidad” son términos primitivos de la teoría. Denotamos los tipos de eventos con letras mayúsculas, como A, B y C. La probabilidad de que ocurra un evento A la escribiremos como P(A). Introducimos también un evento especial Ω, al que llamamos espacio de muestra. El espacio de muestra Ω se puede caracterizar como el conjunto de todas las posibilidades o de todos los eventos elementales. Por ejemplo, si el evento en cuestión consiste en arrojar un dado, puede ocurrir que el resultado sea E1 = un uno, o bien E2 = un dos, y así hasta seis. Ω contendrá, entonces, las seis posibilidades o posibles resultados de una tirada, Ω = {E1, E2, E3, E4, E5, E6}. Por su parte, los eventos, A, B, C, etc., son subconjuntos del espacio de muestra Ω. Es fácil advertir que Ω es un evento cierto o necesario, ya que al tirar un dado siempre ocurrirá algún evento que está incluido en Ω, o sea, siempre saldrá un número comprendido entre uno y seis. Por su parte, denotamos como ∅ al evento que es imposible que ocurra, al cual lo definimos como el complemento del evento necesario Ω (∅ = ~Ω). En nuestro ejemplo, ocurriría

136

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 137

LA

TEORI´A DE LA PROBABILIDAD

∅ si al tirar un dado no saliera un número entre uno y seis, lo cual es obviamente imposible. Ω puede tener un número finito o infinito de elementos, pero comenzaremos por el caso en que Ω es finito. Los eventos son conjuntos. El evento elemental A que consiste, por ejemplo en obtener un as en una tirada será A = {1}; mientras que el evento compuesto B consistente en obtener un número impar en una tirada será B = {1, 3, 5}. Finalmente, Ω ha de ser Ω = {1, 2, 3, 4, 5, 6}. El espacio de muestra Ω es el conjunto de todos los resultados posibles en un determinado contexto o universo de discurso. Un evento, en general, es un conjunto de resultados posibles que es un subconjunto del espacio de muestra. Dado que los eventos son conjuntos, podemos introducir entre ellos las operaciones de intersección (∩), unión (∪) y complemento (~). A ∩ B afirma que los eventos A y B ocurren simultáneamente. A ∪ B afirma que ocurre el evento A o el evento B (o bien ambos a la vez). Por último, ~A afirma que no ocurre el evento A. Los eventos A y ~A son eventos opuestos, ya que son excluyentes entre sí y no pueden ocurrir ambos a la vez. Cumplen, por tanto, las siguientes leyes: i) A ∩ ~A = ∅; y ii) A ∪ ~A = Ω; leyes en las que el lector reconocerá a los tradicionales principios lógicos de no contradicción y de tercero excluido. Dos eventos A y B se llaman disyuntos cuando no pueden ocurrir si multáneamente, es decir, cuando A ∩ B = ∅. La probabilidad es una función que asigna a cada evento un único número real r comprendido entre cero y uno. La expresión P(A) = r afirma que la probabilidad de que ocurra el evento A es igual al número r. La teoría matemática de la probabilidad se hallaba ya ampliamente desarrollada cuando Kolmogorov consiguió axiomatizarla después de varios intentos fallidos de otros matemáticos (véase el Apéndice 2.18 para la formulación original). Aquí presentaremos una versión simplificada de ese sistema, que se debe al propio Kolmogorov, y emplea sólo tres axiomas. La lógica subyacente del sistema es la teoría intuitiva de conjuntos y el lenguaje en el que se lo formula no está formalizado. El espacio de muestra Ω es un conjunto no vacío que contiene un número finito de eventos elementales. La teoría aquí axiomatizada es la teoría de la probabilidad con aditividad finita.

Axiomas Ax1. Para todo evento A, 0 ≤ P(A) ≤ 1. Este axioma, llamado axioma de normalización, establece que la probabilidad es una magnitud normalizada, esto es, que sólo puede tomar como valores a los números reales positivos comprendidos entre 1 y 0. La elección de este particular

137

JP 119a154-Cap5.QXD:0009

TEORI´AS

22/5/12

10:59

Página 138

AXIOMATIZADAS

intervalo es puramente convencional y se funda en razones de simplicidad. Es un axioma que contiene información redundante, ya que puede reemplazarse, como hacen muchos autores, por otro axioma más débil, el de positividad, según el cual, para todo evento A, P (A) ≥ 0, esto es, que la probabilidad de cualquier evento es siempre un número positivo. De este axioma, junto con los otros dos que siguen, puede deducirse como teorema que para todo evento A, P (A) ≤ 1, y de las dos últimas fórmulas se sigue evidentemente el axioma Ax1. Ax2. Para todo espacio de muestra Ω, P(Ω) = 1. Este axioma nos dice que la probabilidad del evento necesario Ω es 1, número que es la cota superior de toda probabilidad. Ax3. Para todo par de eventos disyuntos A y B, P(A ∪ B) = P(A) + P(B). Este axioma se puede generalizar a cualquier número finito de eventos A1... An, disyuntos, de modo que, en general, P(A1 ∪ ... ∪ An) = P(A1) + ... + P(An). En él se afirma el carácter aditivo de las probabilidades, es decir, el hecho de que las probabilidades se pueden sumar cuando los eventos son excluyentes entre sí. Es el axioma de aditividad finita. Se lo conoce también como regla especial de adición.

Teoremas básicos Los tres axiomas de Kolmogorov permiten demostrar una gran cantidad de teoremas sobre probabilidad inicial o absoluta. Se denomina de esta manera a la probabilidad de un evento respecto de un espacio de muestra cuando dicha probabilidad no depende de ningún otro evento de ese espacio de muestra. Se escribe como P(A/Ω), pero si el espacio de muestra es el mismo para todos los eventos que estamos considerando podemos escribirla simplemente como P(A). Algunos teoremas importantes sobre probabilidad absoluta son los siguientes: T1. P(∅) = 0. La probabilidad del evento imposible es nula. T2. P(A) + P(~A) = 1. La suma de las probabilidades de los eventos opuestos es igual a 1. T3. P(~A) = 1 - P(A).

138

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 139

LA

TEORI´A DE LA PROBABILIDAD

La probabilidad de un evento es igual a 1 menos la probabilidad del evento opuesto. Este teorema se conoce usualmente como la regla de negación y se sigue inmediatamente del teorema anterior por pasaje de términos. T4. Para cualquier par de eventos A y B, P(A ∪ B) = P(A) + P(B) – P(A ∩ B). Este es el teorema general de adición. A diferencia del Axioma 3, vale también para sumar las probabilidades de eventos no disyuntos. Cuando A y B son disyuntos, el teorema se reduce al Axioma 3, ya que en ese caso P(A ∩ B) = 0. Es posible generalizar este teorema a cualquier número finito de eventos. T5. P(A ∩ B) ≤ P(A) + P(B). La probabilidad de que dos eventos (disyuntos o no) ocurran nunca es mayor que la suma de las probabilidades de cada evento. Se sigue del teorema anterior y del Axioma 1. Dado que toda probabilidad es no negativa, P(A ∩ B) ≥ 0. Introduciremos ahora la noción de probabilidad condicional. Se llama de esta manera a la probabilidad de un evento relativa a otro evento. La escribimos como P(A/B). En esta fórmula se expresa la probabilidad del evento A dado el hecho de que el evento B ha ocurrido (ocurre u ocurrirá), o, más simplemen te, la probabilidad condicional de A respecto de B. Se la define de la siguiente manera: P(A/B) = P(A ∩ B) / P(B), suponiendo que P(B) ≠ 0. Esta es una definición lo suficientemente importante como para ocupar el lugar de cuarto axioma de la teoría de la probabilidad, como veremos más adelante. La probabilidad condicional de dos eventos que pertenecen a un espacio de muestra Ω se escribe de manera completa como P(A/Ω, B), pero cuando presuponemos que el espacio de muestra es el mismo en todas nuestras fórmulas la escribimos simplemente como P(A/B). La probabilidad condicional nos permite definir la independencia entre even tos. Decimos que dos eventos A y B son independientes cuando la ocurrencia o no ocurrencia de uno de ellos carece de efectos sobre el otro. Es decir, A y B son independientes si y sólo si P(A/B) = P(A). La independencia entre even tos es recíproca: si A es independiente de B, éste también lo es de A. También vale para los eventos opuestos, es decir, si A es independiente de B, también lo es de ~B. Estos conceptos se pueden ejemplificar considerando el evento que consiste en sacar cartas de un mazo. Si el mazo tiene 40 cartas la probabilidad inicial de sacar un as es de 4/40 = 1/10. Si volvemos a colocar la carta extraída en el ma zo y mezclamos, la probabilidad de sacar otra vez un as seguirá siendo de 1/10.

139

JP 119a154-Cap5.QXD:0009

TEORI´AS

22/5/12

10:59

Página 140

AXIOMATIZADAS

Ello es así, aunque a muchos jugadores les parezca extraño, porque la segunda extracción es independiente de que en la primera haya salido un as. En cambio, si retiramos el primer as del mazo, la probabilidad de obtener otra vez un as resulta ahora de 3/39. Este segundo evento ya no es independiente del primero. Prueba de ello es que si en la primera extracción no sale un as, las probabilidades cambian nuevamente. En ese caso, si retiramos la carta, la probabilidad de sacar un as en la segunda extracción es de 4/39. En la primera situación tenemos P(A/Ω) = 1/10 como probabilidad inicial y una probabilidad condicional P(B/Ω, A) = 1/10. En la segunda y tercera situación tenemos las mismas probabilidades iniciales, pero diferentes probabilidades condicionales P(B/ Ω ', A) = 3/39, y P(B/Ω ', C) = 4/39, respectivamente. En este ejemplo debemos especificar el espacio de muestra, ya que no es el mismo en todos los casos. Ahora podemos introducir en el sistema la definición de probabilidad condicional. Definición: P(A/B) = P(A ∩ B) / P(B)

[Para P(B) ≠ 0].

De esta definición, junto con los tres axiomas, se deducen diversos teoremas sobre la probabilidad condicional; entre ellos los siguientes: T6. Para todo par de eventos A y B, P(A ∩ B) = P(B) x P(A/B). [Para P(B) ≠ 0]. Este es el teorema general de multiplicación, que nos da la probabilidad de que dos eventos cualesquiera, independientes o no, ocurran simultáneamente. Se sigue directamente de la definición de probabilidad condicional por pasaje de términos. Este resultado se puede extender a cualquier número finito de eventos. T7. Para todo par de eventos A y B, que sean independientes, P(A ∩ B) = P(A) x P(B). Este es el teorema especial de multiplicación, que vale sólo para eventos in dependientes. Se sigue del teorema anterior y de la definición de independen cia entre eventos. T8. P(A) = P(B) x P(A/B) + P(~B) x P(A/~B). Este es el teorema de eliminación o de probabilidad total. Se puede genera lizar a cualquier número finito de eventos. T9. P(B/A) = P(B) x P(A/B) / P(A). [Para P(A) ≠ 0]. Este es el célebre Teorema de Bayes, demostrado por el clérigo inglés Th. Bayes y publicado póstumamente en 1763. 140

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 141

LA

TEORI´A DE LA PROBABILIDAD

Otra forma equivalente de este teorema es la siguiente:

P(B/A) = P(B) x P(A/B) / P(B) x P(A/B) + P(~B) x P(A/~B). La equivalencia entre estas dos fórmulas se sigue del Teorema 8, reemplazando en el denominador del Teorema 9 la expresión P(A) por su equivalente, que es la fórmula de probabilidad total. El teorema de Bayes es una consecuencia directa de la definición de probabilidad condicional y puede demostrarse de esta manera: 1. P(A/B) = P(A ∩ B) / P(B)

[Por definición de P(A/B)]

2. P(B/A) = P(B ∩ A) / P(A)

[Por definición de P(B/A)]

3. P(A ∩ B) = P(A/B) x P(B)

[De 1, multiplicando por P(B)]

4. P(B ∩ A) = P(B/A) x P(A)

[De 2, multiplicando por P(A)]

5. P(A ∩ B) = P(B ∩ A)

[Conmutatividad de la operación ∩]

6. P(A/B) x P(B) = P(B/A) x P(A) 7. P(B/A) = P(A/B) x P(B) / P(A)

[De 3 y 4, igualando los segundos miembros] [De 6, dividiendo por P(A)]

El teorema de Bayes es de especial importancia para el problema de la confirmacion de las hipótesis científicas. Toda una corriente epistemológica, llamada precisamente bayesianismo, se apoya en una aplicación de este teorema para calcular el grado de confirmación de una hipótesis respecto de una determinada evidencia. Para ello, se supone que los científicos asignan probabilidades a las hipótesis y teorías, y que esas probabilidades representan el grado de con firmación de tales hipótesis y teorías respecto de la evidencia disponible. El em pleo del teorema de Bayes se hace reemplazando en la fórmula del teorema a la expresión B por el enunciado h, que representa una determinada hipótesis científica, y a la expresión A por el enunciado e, que representa una determinada evidencia empírica. El teorema toma, así, la siguiente forma: P(h/e) = P(h) x P(e/h) / P(e). Esta y otras formas equivalentes del teorema tienen numerosas aplicaciones epistemológicas, por ejemplo, para determinar el grado de confirma ción de dos o más hipótesis rivales respecto de un mismo cuerpo de evidencia.

141

JP 119a154-Cap5.QXD:0009

TEORI´AS

6/8/12

18:00

Página 142

AXIOMATIZADAS

En la axiomatización de Kolmogorov, que en lo esencial hemos seguido hasta aquí, sólo intervienen probabilidades absolutas, mientras que las probabilidades condicionales se introducen por definición. Algunos autores, sin embargo, prefieren tomar a la probabilidad condicional como un término primitivo del sistema, y luego introducir la probabilidad absoluta como término definido. Los axiomas de la teoría, entonces, se formulan de esta manera: Ax1: Para cualesquiera eventos A, E (suponiendo que P(E) ≠ 0) 0 ≤ P(A | E) ≤ 1. Ax2: Para todo espacio de muestra Ω, y todo evento E (suponiendo que P(E) ≠ 0) P(Ω | E) = 1. Ax3: Para toda secuencia finita de eventos, disyuntos de dos en dos, A1, A2 ... An y para todo evento E (suponiendo que P(E) ≠ 0) P(A1 ∪ A2 ∪ … ∪ An | E) = P(A1 | E) + P(A2 | E) ... + P(An | E). Ax4: Para cualesquiera eventos A, B, E (suponiendo que P(E) ≠ 0) P(A ∩ B | E) = P(B | E) x P(A | B & E). Este último axioma, que se conoce como axioma de multiplicación, es equivalente a la definición de probabilidad condicional de Kolmogorov. Adviértase que aquí no se requiere la condición P(B | E) ≠ 0, porque Si P(B | E) = 0, entonces, P(A ∩ B | E) = 0, pero P(A | B & E) queda indeterminado, como ocurre también en la definición de probabilidad condicional de Kolmogorov. La probabilidad absoluta de un evento, por su parte, se introduce por definición del siguiente modo: Definición: para todo evento A, P(A) =def P(A | Ω) El sistema que se obtiene mediante estos axiomas es equivalente al de Kolmogorov, pero aquí todas las probabilidades resultan condicionales. La función probabilidad, entonces, asigna un número real a pares de eventos y no sólo a eventos individuales.

142

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 143

LA

TEORI´A DE LA PROBABILIDAD

Es posible formular de una manera más abstracta y simple un sistema axiomático para la teoría de la probabilidad empleando el concepto de espacio de probabilidades (los párrafos que siguen, que son relativamente más técnicos que el resto de la sección, pueden saltarse sin pérdida de continuidad). Un espacio de probabilidades en general es una estructura X = 〈Ω, ℑ, P〉, donde Ω es un conjunto de elementos cualesquiera, ℑ es una sigma-álgebra de subconjuntos de Ω y P es una función, la función probabilidad, que asigna a cada elemento de ℑ un número real comprendido entre 0 y 1 (es decir, (P: ℑ → [0, 1]). Definamos ahora el concepto de sigma-álgebra, presupuesto en la definición de espacio de probabilidades. Dado un conjunto no vacío de elementos cualesquiera C, una sigma-álgebra Σ sobre C es un conjunto no vacío de subconjuntos de C, tal que Σ ⊆ ℘C, que cumple las siguientes condiciones: 1. Para todo conjunto A, si A ∈ Σ, entonces, C ∼A ∈ Σ. 2. Para toda secuencia contable de conjuntos A1... An ∈ Σ, (A1 ∪ ... ∪ An) ∈ Σ. De estas dos condiciones se deduce que C ∈ Σ; que ∅ ∈ Σ; y que si A1... An ∈ Σ, (A1 ∩ ... ∩ An) ∈ Σ. Una sigma-álgebra es, en resumen, un conjunto de subconjuntos de C que es cerrado respecto de las operaciones de complemento, unión (contable) e intersección (contable). Si el espacio de muestra Ω es un conjunto finito, el espacio de probabilidades es finito. En los casos típicos, la sigma-álgebra ℑ de subconjuntos de Ω será un álgebra de Boole (véase el Capítulo 6. 4) tal que ℑ = ℘Ω (aunque podría restringirse a un subconjunto propio de ℘Ω). Si Ω es un conjunto contable, el espacio de probabilidades es contable. En este caso ℑ es una sigmaálgebra tal que ℑ ⊆ ℘Ω. Finalmente, si Ω es un conjunto no contable, el espacio de probabilidades es infinito no contable. Para esta clase de espacios la función probabilidad no puede asignar probabilidades a todo elemento de ℘Ω (esto es así por razones técnicas: si Ω no es contable y se acepta el axioma de elección, entonces, puede probarse que existen subconjuntos de ℘Ω que no son medibles). En ese caso, ℑ es una sigma-álgebra tal que ℑ ⊂ ℘Ω, es decir, es un subconjunto propio de ℘Ω. En un espacio de probabilidades finito la teoría de la probabilidad sólo puede formularse mediante el axioma Ax3, el de aditividad finita. En cambio, en un espacio de probabilidades infinito (contable o no contable) la teoría de la probabilidad puede formularse con aditividad finita o con aditividad contable. Esta última es la forma más general de la teoría, la cual se obtiene reemplazando el axioma Ax3 por el siguiente axioma de aditividad contable:

143

JP 119a154-Cap5.QXD:0009

TEORI´AS

24/5/12

17:05

Página 144

AXIOMATIZADAS

Ax3’. Si A1... A2… es una secuencia infinita contable de eventos disyuntos, entonces, P(A1 ∪ ... ∪ An ∪ ...) = P(A1) + ... + P(An) + ... La teoría de la probabilidad con aditividad contable debe formularse en un espacio de probabilidades infinito, que puede ser contable o no. Un espacio no contable permite la aplicación de la teoría a las magnitudes continuas, como las que típicamente se utilizan en la física teórica (de hecho, la formulación original de Kolmogorov es máximamente general, ya que es una teoría con aditividad contable en un espacio de probabilidades no contable. Véase el Apéndice 2.18). El sistema axiomático de Kolmogorov está formulado en el lenguaje de la teoría de conjuntos, pero la teoría de la probabilidad también se puede formular en el lenguaje de la lógica proposicional clásica. En ese caso, la función probabilidad P se aplica a proposiciones en lugar de a eventos. Ambas formulaciones son equivalentes y sus respectivos lenguajes son intertraducibles. Esta es la formulación que habitualmente prefieren los lógicos y filósofos que se ocupan de la teoría de la confirmación y de la lógica inductiva, quienes generalmente introducen la probabilidad condicional como término primitivo mediante el axioma de multiplicación. La formulación del sistema es la siguiente: Sea L un conjunto de proposiciones cerrado respecto de las combinaciones finitas veritativo-funcionales. La probabilidad P es una aplicación de L en el conjunto de los números reales (P: L → ⺢) que satisface los siguientes axiomas: Ax1. Para toda proposición A ∈ L , 0 ≤ P(A) ≤ 1. Ax2. Para toda proposición A ∈ L tal que |=A, P(A) = 1. Ax3. Para cualesquiera proposiciones A, B ∈ L tales que |= ¬ (A & B), P(A v B) = P(A) + P(B). Ax4. Para cualesquiera proposiciones A, B ∈ L , P(A & B) = P(B) x P(A | B). Los axiomas Ax3 y Ax4, de aditividad y multiplicación, respectivamente, se pueden escribir de una manera más general para cualquier secuencia finita o infinita contable de proposiciones. De esa manera se obtiene, respectivamente, la teoría de la probabilidad con aditividad finita o con aditividad contable.

144

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 145

LA

TEORI´A DE LA MEDICIÓ´N

El mismo sistema se puede formular mediante la condicionalización de todos los axiomas, que no volveremos a escribir. En tal caso, la probabilidad absoluta de una proposición se introduce por definición como la probabilidad condicional de dicha proposición respecto de una tautología o verdad lógica. Esto es, para toda proposición B ∈ L tal que |=B, P(A) =def P(A | B). La teoría de la probabilidad, en cualquiera de las formulaciones que hemos presentado, ya sea con aditividad finita o contable, constituye un sistema puramente formal, una teoría perteneciente a la matemática pura. Como todo sistema axiomático formal, esta teoría admite infinitas interpretaciones y, posiblemente, muchos modelos diferentes. Es bien conocido el hecho de que existen diferentes concepciones de la probabilidad; algunas empiristas y objetivistas, como la frecuencial y la propensivista, y otras subjetivistas o epistémicas, como la personalista o bayesiana. En esta última interpretación, elaborada principalmente por B. de Finetti, la probabilidad se concibe como el grado de creencia de un individuo en la ocurrencia de un evento o en la verdad de una proposición. Esta interpretación, que no era la que Kolmogorov tenía en mente al construir su sistema, satisface, sin embargo, todos los axiomas de la teoría de la probabilidad con aditividad finita y es, por tanto, un modelo del cálculo de probabilidades. Ha habido un considerable debate de carácter filosófico acerca de cuáles son las interpretaciones correctas o admisibles de la teoría de la probabilidad. No obstante, si consideramos a la teoría matemática de la probabilidad como un sistema axiomático formal, no tiene por qué haber conflicto entre estas diferentes interpretaciones. Todas ellas pueden concebirse como diferentes modelos de la misma teoría formal, y, consiguientemente, como compatibles entre sí. No es necesario, por tanto, argumentar, como se ha hecho a menudo, que existe una única interpretación correcta de la probabilidad, ni tampoco una interpretación privilegiada o superior a las demás en algún respecto. Sin embargo, es indudable que algunas interpretaciones de la teoría pueden ser más adecuadas o útiles que otras para ciertos fines o para determinadas aplicaciones del cálculo de probabilidades.

5.5 La teoría de la medición Un ámbito donde el método axiomático se ha mostrado especialmente fértil es en la llamada teoría de la medición, iniciada por H. Von Helmholtz en 1887. No se trata, como el nombre podría sugerir, de un análisis de la manera de medir cantidades físicas, sino de las condiciones necesarias y suficientes para introducir conceptos cuantitativos en un determinado lenguaje. En lengua españo la llamamos a esta operación metrización de conceptos para distinguirla de la operación empírica de medición de cantidades. El resultado de la metrización es

145

JP 119a154-Cap5.QXD:0009

TEORI´AS

22/5/12

10:59

Página 146

AXIOMATIZADAS

la creación de un nuevo concepto métrico o la transformación de un concepto no métrico ya existente. Otras lenguas, como el inglés, no distinguen entre metrización y medición. Los conceptos métricos son las llamadas cantidades o magnitudes cuantitativas. Los lenguajes naturales no tienen conceptos métricos, en el sentido técnico de este término, que es el que analizaremos enseguida. Los conceptos métricos son creaciones del conocimiento científico y caracterizan a las ciencias más desarrolladas, como la física, o a las partes mejor establecidas de otras ciencias, como la química o la genética. Desde el punto de vista lógico, los conceptos métricos se expresan mediante funtores numéricos que asignan números reales a los objetos de un determinado dominio. La extensión de un concepto métrico es, por consiguiente, una función o una clase de funciones. Existen diferentes tipos de conceptos métricos. Se llama magnitudes escalares a los conceptos métricos que asignan un único valor numérico a los objetos de un dominio. Magnitudes vectoriales, en cambio, son los conceptos métricos que asignan un vector a los objetos de un dominio y, por consiguiente, requieren la asignación de tres o más valores numéricos. Ejemplos de conceptos métricos del primer tipo son los conceptos de masa, tiempo y longitud, mientras que ejemplos del segundo tipo son los conceptos de fuerza, velocidad y aceleración, entre otros. Aquí nos limitaremos a estudiar únicamente las magnitudes escalares rea les, es decir, aquellas que asignan un único número real a cada objeto de un dominio dado. La introducción de conceptos métricos se realiza de la siguiente manera. Primero se especifica un dominio D, que es un conjunto no vacío de objetos cualesquiera. Luego, se introducen dos predicados diádicos, C y P, que represen tan relaciones entre dos objetos cualesquiera del dominio. También es necesario introducir un funtor binario ⊕, que representa una operación binaria entre objetos del dominio. Estos términos primitivos deben cumplir con las condiciones estipuladas en una lista de axiomas. Mediante ellos definiremos la estructura denominada sistema extensivo. ◊ La estructura E = 〈D, C, P, ⊕〉 es un sistema extensivo si y sólo si para cualesquiera individuos pertenecientes a D, se cumplen los siguientes axiomas: Ax1. ∀x (xCx)

Ax2. ∀xy (xCy → yCx)

Ax3. ∀xyz ((xCy & yCz) → xCz) Ax4. ∀xyz ((xPy & yPz) → xPz)

146

[C es reflexiva]. [C es simétrica]. [C es transitiva]. [P es transitiva].

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 147

LA

Ax5. ∀xy (xCy → ¬ xPy)

Ax6. ∀xy (xCy v xPy v yPx)

Ax7. ∀xy (x ⊕ y C y ⊕ x)

Ax8. ∀xyz (x ⊕ (y ⊕ z) C (x ⊕ y) ⊕ z)

Ax9. ∀xyz (xPy ↔((x ⊕ z P y ⊕ z) ↔ (z ⊕ x P z ⊕ y))) Ax10. ∀xy (xPx ⊕ y)

Ax11. ∀xy (yPx → ∃n ((n ∈ ⺞) & (xPny)))

TEORI´A DE LA MEDICIÓ´N

[P es C-irreflexiva]. [P es C-conexa]. [⊕ es conmutativa]. [⊕ es asociativa]. [⊕ es P-monótona]. [⊕ es positiva]. [⊕ es arquimediana].

Los primeros tres axiomas afirman que C es una relación de equivalencia (reflexiva, simétrica y transitiva). Los tres siguientes afirman que P es una relación de orden débil (transitiva, C-irreflexiva y C-conexa). Las relaciones C y P suelen interpretarse, respectivamente, como la coincidencia y precedencia de dos objetos del dominio respecto de una determinada propiedad, por ejemplo, la longitud o el peso. Un sistema extensivo también se puede introducir utilizando una sola relación de orden R, que puede definirse de la siguiente manera xRy ↔def xCy v xPy. Si se lo hace de esa manera, se necesitan menos axiomas. Mediante los primeros seis axiomas podemos definir una subestructura de E llamada sistema comparativo. Decimos, entonces, que O = 〈D, C, P〉 es un sistema comparativo si y sólo si para cualesquiera individuos pertenencientes a D, se cumplen los axiomas Ax1 a Ax6. Estableciendo un sistema comparativo para un concepto dado pueden introducirse conceptos comparativos tales como “más duro que” en el dominio de los minerales, o “más pesado que” en el dominio de los cuerpos. Una vez que se ha introducido un concepto comparativo, es posible establecer una escala ordinal para dicho concepto. Una escala en general es una función que asigna números a los objetos de un determinado dominio. Una escala ordinal asigna estos números de tal manera que si un objeto precede a otro res pecto de una determinada propiedad, asigna al primero un número menor que al segundo, y si los dos objetos coinciden respecto de dicha propiedad les asigna el mismo número. Podemos dar una definición más precisa del siguiente modo: ◊ Una escala ordinal es una aplicación del dominio D sobre el conjunto de los números reales ⺢ (ƒ: D → ⺢) tal que para cada x, y que pertenezcan a D, Ax1. ∀xy (xCy → ƒ(x) = ƒ(y)). 147

JP 119a154-Cap5.QXD:0009

TEORI´AS

22/5/12

10:59

Página 148

AXIOMATIZADAS

Ax2. ∀xy (xPy → ƒ(x) < ƒ(y)). Una escala ordinal se limita a dar un número al orden de un determinado objeto, pero no cuantifica las diferencias o proporciones entre los diferentes objetos. Un ejemplo de esta clase de escala es la tabla de Mohs para las durezas de los minerales. Esta escala asigna al talco el número 1, al yeso el número 2, y al diamante el número 10, pero estos números no proporcionan una medida de la dureza de esos minerales, sino simplemente un orden. No expresan el hecho de que la dureza del yeso sea el doble de la del talco, sino simplemente el hecho de que el yeso es más duro que el talco y ocupa el lugar siguiente en el orden de dureza de los minerales. Igualmente, la escala nos informa que el diamante es el más duro de los minerales, pero no nos dice cuánto más duro que los otros minerales que ocupan los lugares inferiores. Los números asignados a los objetos de un dominio por una escala ordinal no se pueden sumar y, en general, no se les pueden aplicar operaciones aritméticas. No expresan cantidades, sino que simplemente etiquetan el orden de los objetos del dominio. Los conceptos para los cuales existe un sistema extensivo se denominan conceptos métricos, o más frecuentemente, magnitudes o cantidades (aquí usaremos estos dos términos de manera indistinta). Los conceptos métricos se introducen como funciones numéricas, que asignan números reales a los objetos de un determinado dominio. Para introducir un concepto métrico es necesario poseer primero un sistema comparativo 〈D, C, P〉 para ese concepto. Luego, se debe enriquecer ese sistema agregándole el funtor binario ⊕. Este representa una operación que usualmente se interpreta como la combinación de dos objetos del dominio, la cual da como resultado otro objeto del dominio. Esta operación debe ser aditiva y, desde el punto de vista formal, tiene las propiedades de la suma o adición entre números reales. Por ejemplo, si agregamos dos cuerpos pesados al platillo de una balanza, el resultado es un cuerpo pesado, cuyo peso es igual a la suma de los dos cuerpos pesados. Si mezclamos dos volúmenes de líquidos no volátiles en un recipiente obtenemos un volumen de líquido que es igual a la suma de los dos volúmenes mezclados. Aquí no podemos definir más precisamente qué entendemos por una operación empírica de combinación que sea aditiva, pero los ejemplos dejan suficientemente en claro el significado intuitivo de esta noción. Un sistema extensivo es un sistema comparativo que cumple con ciertos axiomas adicionales, como los axiomas Ax7-Ax11 de la lista anterior. Es una extensión (véase el Capítulo 6.2) de un sistema comparativo. Los axiomas Ax7 y Ax8 son suficientemente claros e intuitivos como para no necesitar explicación. El axioma Ax9 dice que si un objeto precede a otro, entonces la combinación de ese objeto con otro objeto z también precede a la combinación del otro objeto con ese mismo objeto z. Esto quiere decir que la operación ⊕ es monótona,

148

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 149

LA

TEORI´A DE LA MEDICIÓ´N

tal como la suma entre números. El axioma Ax10 afirma que la operación ⊕ es siempre positiva (adiciona, pero nunca resta), de modo que un objeto siempre precede a la combinación de sí mismo con otro objeto diferente. El axioma Ax11 probablemente sea el menos intuitivo de la lista. Afirma que por grande que sea la diferencia entre dos objetos x e y respecto de una propiedad, existe siempre un número natural n tal que la combinación de y consigo mismo un número finito de veces es superior a x respecto de tal propiedad. Por ejemplo, dado un cuerpo a que es mucho más pesado que otro cuerpo b, hay sin embar go un número n tal que b combinado n veces consigo mismo es más pesado que a. Esto implica que ningún objeto del dominio posee una propiedad en un grado infinitamente mayor que otro, por ejemplo, ningún objeto es infinitamente más pesado que otro. Una vez que se ha introducido un sistema extensivo para un concepto determinado, es posible definir una escala proporcional que asigna un único número real a cada objeto del dominio D. Una escala proporcional se diferencia de una escala ordinal por el hecho de que la función que asigna los números a los objetos no sólo conserva el orden entre esos objetos, sino que, además, represen ta a la operación de combinación empírica de objetos como una suma entre números reales, esto es, la representa como una operación aditiva. De esta manera, establece el orden y la proporción cuantitativa que existe entre los objetos del dominio. Podemos definir el concepto de escala proporcional de la siguiente manera: ◊ Una escala proporcional sobre un sistema extensivo 〈D, C, P, ⊕〉 es una función de D en ⺢ (ƒ: D → ⺢) tal que para cada x, y pertenecientes a D, Ax1. ∀xy (xCy → ƒ(x) = ƒ(y)).

Ax2. ∀xy (xPy → ƒ(x) < ƒ(y)).

Ax3. ∀xy (ƒ(x ⊕ y) = ƒ(x) + ƒ(y)). Las primeras dos de estas tres condiciones son las de una escala ordinal; mientras que la tercera, que es propia de las escalas proporcionales, afirma que el número que la función asigna a la combinación de dos objetos del dominio es igual a la suma de los números que asigna a cada uno de esos objetos. Esta condición expresa el carácter aditivo de la operación empírica de combinación de objetos del dominio. Resulta obvio que toda escala proporcional es también una escala ordinal, pero no a la inversa. Estos tres axiomas fijan las condiciones para establecer una escala propor cional en general, pero no determinan ninguna escala en particular. Para obtener una escala determinada es necesario fijar una unidad o patrón de la escala.

149

JP 119a154-Cap5.QXD:0009

TEORI´AS

22/5/12

10:59

Página 150

AXIOMATIZADAS

Esto se hace convencionalmente asignando a un objeto cualquiera del dominio (o mejor, a una clase de equivalencia de objetos) un número determinado, generalmente el 1, por razones de simplicidad. Ese objeto es la unidad o patrón de la escala, por ejemplo, el metro para la escala de longitudes. Cuando se ha fijado la unidad, el sistema extensivo determina de manera unívoca los valores que la función asigna a todos los restantes objetos del dominio, preservando el orden y la proporción entre esos objetos. Por supuesto, dado que la elección de la unidad es convencional, son posibles diversas escalas para una misma magnitud, como por ejemplo las que establecen el kilogramo y la libra como unidades de peso. Cada escala asigna un número real diferente al mismo objeto, por ejemplo, 3 kilogramos y 6.6 libras de peso. Sin embargo, todas estas escalas son equivalentes, en un sentido que ahora debemos precisar. Existen muchas escalas posibles para una misma magnitud, pero se las puede agrupar en clases de equivalencia. Todas las escalas de una misma clase son equivalentes si preservan determinados valores numéricos cuando se cambia de una escala a otra. El tipo de valor numérico preservado es el que define la correspondiente clase de escala. Aquí nos limitaremos a considerar únicamente las escalas proporcionales, que son características de las magnitudes extensivas. Las escalas proporcionales no preservan el valor absoluto asignado a un determinado objeto. Por ejemplo, la regla que está sobre mi escritorio mide 25 centímetros en una escala de longitud y 10 pulgadas en otra escala de longitud. Mi escritorio, por su parte, mide 100 centímetros y 40 pulgadas, respectivamente. Las dos escalas en cuestión son escalas proporcionales porque conservan el cociente entre los valores absolutos asignados a cada objeto. En efecto, el cociente entre los valores asignados a la regla y al escritorio es el mismo en las dos escalas: 25/100 y 10/40. En ambos casos obtenemos el mismo número: 0.25. Lo mismo ocurrirá para las longitudes de todos los objetos del dominio D sobre el cual está definido el concepto métrico de longitud. Podemos, entonces, definir a una escala proporcional para cualquier magnitud de la siguiente manera: ◊ Si f y g son dos escalas diferentes para una misma magnitud, entonces son escalas proporcionales si y sólo si para todo objeto del dominio D, se cumple que f(x)/f(y) = g(x)/g(y). Cada clase de escala se caracteriza por un determinado tipo de transformación, esto es, por una manera específica de realizar los cambios de una escala a otra. Una transformación es una función tal que al valor de cada objeto en una determinada escala le asigna otro valor para el mismo objeto en otra escala. La función transformación F(x) es la que nos permite convertir los valores de una escala a los valores de la otra, es decir, pasar de una escala a otra. El tipo de transformación característico de las escalas proporcionales se denomina transformación similar. En una transformación similar, la función transforma-

150

JP 119a154-Cap5.QXD:0009

22/5/12

10:59

Página 151

LA

TEORI´A DE LA MEDICIÓ´N

ción, definida sobre el conjunto de los números reales ⺢, adopta la siguiente forma: F(x) = ax (donde a es un número real positivo). Una transformación similar de una función es otra función que resulta de multiplicar a la primera por una constante positiva. Podemos definirla de la siguiente manera: ◊ La función h es una transformación similar de la función f si y sólo si existe un número real a ∈ ⺢+, tal que para todo objeto del dominio D se cumple que h(x) = af(x). La manera de aplicar una transformación similar para pasar de una escala a otra consiste simplemente en multiplicar el valor numérico asignado a un objeto en una determinada escala por un número real positivo, obteniéndose así el valor numérico correspondiente a ese objeto en la otra escala. Así, por ejemplo, para obtener el peso de un cuerpo en libras a partir de su peso dado en kilogramos se multiplica este último valor por 2.2. Para obtener el peso en kilogramos dado el peso en libras se multiplica dicho valor por 0.454. Se procede de un modo análogo para cualquier cambio de escalas para toda magnitud para la cual exista una escala proporcional. Todo sistema extensivo posee al menos una escala proporcional. Una transformación similar aplicada a una escala proporcional para un sistema extensivo da como resultado otra escala proporcional para ese sistema extensivo. Como consecuencia de este hecho, es evidente que existe un número potencialmente infinito de escalas proporcionales para cada sistema extensivo. La elección de una determinada escala es una cuestión puramente convencional, basada fundamentalmente en razones de simplicidad y economía de cálculo. Las magnitudes dotadas de escalas proporcionales son aquellas que tradicionalmente se denominan magnitudes extensivas, tales como, por ejemplo, la longitud, la duración temporal y la masa (que son los tres conceptos métricos fundamentales de la mecánica). Estas son las magnitudes para las cuales existe un sistema extensivo. Lo característico de las magnitudes extensivas es que sus valores se pueden sumar y, en general, se les pueden aplicar todas las operaciones aritméticas. Ello es así porque un sistema extensivo para una determinada magnitud es semejante a un sistema numérico en el dominio de los números reales. La semejanza en cuestión es una relación de homomorfismo (en el sentido definido en el Capítulo 3.5). Una escala proporcional para un sistema extensivo establece, precisamente, un homomorfismo entre un sistema extensivo 〈D, C, P, ⊕〉 y el sistema numérico 〈⺢, =, 0 existe un δ > 0 tal que f (x) - f (a) < ε para todo x tal que x - a < δ. ◊ Una función es continua por la izquierda en el punto a si la condición anterior se cumple sólo para todos los valores de x menores que a, y es continua por la derecha si tal condición se cumple sólo para todos los valores de x mayores que a; la función es continua en el punto a si y sólo si es a la vez continua por la izquierda y por la derecha en ese punto.

208

JP 207a210-Ape3.QXD:0009

22/5/12

11:27

Página 209

EL

CONCEPTO DE FUNCIÓ´N

◊ Una función es continua si es continua en todos los puntos. ◊ Una función continua se llama bicontinua si su inversa también es continua. El término aplicación se usa frecuentemente como sinónimo del término función. A veces, en cambio, se reserva este último término para las aplicaciones que tienen como dominio y codominio conjuntos de números, y se usa aplicación cuando se trata de otros conjuntos cualesquiera. Aquí hemos empleado el concepto de función en un sentido general, sin distinguir entre aplicaciones y funciones. También los términos transformación y operación se suelen utilizar, aunque con menos frecuencia, como sinónimos del de función.

Notas bibliográficas Los conceptos de función, límite y continuidad se explican con mayor detalle en cualquier texto de análisis matemático. El de Spivak (1994) es amplio y accesible. Se pueden encontrar definiciones claras de estos y otros términos del análisis en Borowski y Borwein (2006).

209

JP 207a210-Ape3.QXD:0009

22/5/12

11:27

Página 210

JP 211a220-Bibl.QXD:0009

22/5/12

11:35

Página 211

Bibliografía

Alchourrón, C., Méndez, J. y Orayen, R. (eds.) (1995), Lógica, Madrid, Trotta. Aleksandrov, A. D., Kolmogorov, A. N. y Lavrentev, M. A. (1969), Mathematics: Its Content, Methods and Meaning, Cambridge (Mass.), The MIT Press, 3 vols. Balzer, W. (1982), Empirische Theorien: Modelle-Strukturen-Beispiele, BraunschweigWiesbaden, F. Vieweg & Sohn. (Traducción española corregida: Teorías empíricas: modelos, estructuras y ejemplos, Madrid, Alianza, 1997). Balzer, W., Moulines, C. U. y Sneed, J. (1987), An Architectonic for Science: The Structuralist Program, Dordrecht, Reidel. Baum, J. (1991), Elements of Point Set Topology, New York, Dover. (1.ª ed. 1964). Beaney, M. (ed.) (1997), The Frege Reader, Oxford, Blackwell. Benacerraf, P. y Putnam, H. (eds.) (1983), Philosophy of Mathematics: Selected Readings, Second edition, Cambridge, Cambridge University Press. Bernays, P. (1958), Axiomatic Set Theory, Amsterdam, North Holland. Beth, E. W. (1965), The Foundations of Mathematics: A Study in the Philosophy of Science, Amsterdam, North Holland, 2.ª ed. (1.ª ed. 1959). Blanché, R. (1955), L’axiomatique, Paris, Presses Universitaires de France. Blumentahal, L. M. (1980), A Modern View of Geometry, New York, Dover (1.ª ed. 1961). Bonola, R. (1955), Non-Euclidean Geometry: A Critical and Historical Study of its Development, New York, Dover. (1a ed. en italiano 1908) [Traducción española: Geometrías no euclidianas, Buenos Aires, Espasa-Calpe, 1945]. Borowski, E. J. y Borwein, J. M. (2006), Collins Web-linked Dictionary of Mathematics, New York, Collins, 2.ª ed. (1.ª ed. 1991). Bridge, J. (1977), Beginning Model Theory: The Completeness Theorem and Some Consequences, Oxford, Clarendon Press. Boolos, G., Burgess, J. y Jeffrey, R. (2007) Computability and Logic, Cambridge, Cambridge University Press, 5.ª ed. (1.ª ed. 1974).

211

JP 211a220-Bibl.QXD:0009

EL

22/5/12

11:35

Página 212

JUEGO DE LOS PRINCIPIOS

Bourbaki, N. (1974), Eléments d’histoire des mathématiques, París, Hermann, 2.ª ed. (1.ª ed. 1969). Boyer, C. B. y Merzbach, U. C. (1989), A History of Mathematics, Second edition, New York, J. Wiley & Sons. (1.ª ed. 1968). Bunge, M. (1967), Foundations of Physics, Berlin-New York, Springer Verlag. Bunge, M. (1973), Philosophy of Physics, Dordrecht, Reidel. (Traducción española: Filosofía de la física, Barcelona, Ariel, 1978). Carnap, R. (1958), Introduction to Symbolic Logic and its Applications, New York, Dover. (1ª ed. en alemán 1954). Casati, R. y Varzi, A. (1999), Parts and Places: The Structure of Spatial Representation, Cambridge (Mass.), The MIT Press. Cavaillès, J. (1938), Méthode axiomatique et formalisme, Paris, Hermann. (Traducción española: Método axiomático y formalismo, México, UNAM, 1992). Chellas, B. F. (1980) Modal Logic: An Introduction, Cambridge, Cambridge, University Press. Church, A. (1956), Introduction to Mathematical Logic, Vol. I, Princeton, Princeton University Press. Cohen, P. (1966), Set Theory and the Continuum Hypothesis, New York, Benjamin. Collette, J. P. (1973-1979), Histoire des mathématiques, Montréal, Éditions du Renouveau Pédagogique, 2 Vols. (Traducción española: Historia de las matemáticas, México, Siglo XXI, 1985). Crossley, J.N. y otros (1972), What is Mathematical Logic?, Oxford, Oxford University Press. Curry, H. B. (1977), Foundations of Mathematical Logic, New York, Dover (1.ª ed. 1963). Cutland, N. J. (1986), Computability: An Introduction to Recursive Function Theory, Cambridge, Cambridge University Press. Dahan-Dalmedico, A. y Peiffer, J. (1986), Une histoire des mathématiques: Routes et dédales, Paris, Éditions du Seuil. Davis, M. (ed.) (1965), The Undecidable: Basic Papers on Undecidable Propositions, Unsolvable Problems and Computable Functions, New York, Raven Press, De Lorenzo, J. (1980), El método axiomático y sus creencias, Madrid, Tecnos.

212

JP 211a220-Bibl.QXD:0009

22/5/12

11:35

Página 213

BIBLIOGRAFÍ´A

Detlefsen, M. (1986), Hilbert’s Program: An Essay on Mathematical Instrumentalism, Dordrecht, Reidel. Detlefsen, M., McCarty, D. y Bacon, J. (1999), Logic from A to Z, London, Routledge. Dopp, J. (1965), Notions de logique formelle, Louvain, Nauwelaerts. Drake, F. y Singh, D. (1996), Intermediate Set Theory, Chichester, John Wiley & Sons. Dummett, M. (2000) Elements of Intuitionism, Oxford, Oxford University Press, 2.ª ed. (1.ª ed. 1977). Durbin, J. R. (1992), Modern Algebra: An Introduction, 3ª ed. New York, John Wiley & Sons. (1ª ed. 1979) Earman, J. (1992), Bayes or Bust? A Critical Examination of Bayesian Confirmation Theory, Cambridge (Mass.), The MIT Press. Enderton, H. (2001) A Mathematical Introduction to Logic, New York, Academic Press, 2a ed. (1.ª ed. 1972). Eves, H. (1990), Foundations and Fundamental Concepts of Mathematics, 3ª ed. New York, Dover, reimpresión, 1997. (1.ª ed. 1958). Ewald, E. (ed.), (1996), From Kant to Hilbert: Readings in the Foundations of Mathematics, Oxford, Oxford University Press, 2 Vols. Ferreirós, J. (ed.) (2006), Georg Cantor: Fundamentos para una teoría general de conjuntos. Escritos y correspondencia selecta, Barcelona, Crítica. Fine, T. (1973), Theories of Probability, New York, Academic Press. Fraenkel, A. (1966), Abstract Set Theory, Amsterdam, North Holland, 3.ª ed. (1.ª ed. 1953). Fraenkel, A., Bar-Hillel, Y. y Levy, A. (1973), Foundations of Set Theory, Amsterdam, North Holland, 2.ª ed. (1.ª ed. 1958). Fraïssé, R. (1982), “Les axiomatiques ne sont-elles qu’un jeu?”, en: Guénard, F. y Lelièvre, G. (eds.), Penser les mathématiques, Paris, Éditions du Seuil, 1982, pp. 39-57. Garciadiego, A. (1992), Bertrand Russell y los orígenes de las paradojas de la teoría de conjuntos, Madrid, Alianza. Gentzen, G. (1969), The Collected Papers of Gerhard Gentzen, ed. M. Szabo, Amsterdam, North Holland.

213

JP 211a220-Bibl.QXD:0009

EL

22/5/12

11:35

Página 214

JUEGO DE LOS PRINCIPIOS

Gillies, D. (2000), Philosophical Theories of Probability, London-New York, Routledge. Gödel, K. (1989), Obras completas, ed. J. Mosterín, Madrid, Alianza, 2ª ed. Gödel, K. (1986-2003) Collected Works, ed. S. Feferman y otros, New York, Oxford University Press, 5 Vols. Grattan-Guinness, I. (ed.) (1994), Companion Enciclopedia of the History and Philosophy of Mathematical Sciences, London-New York, Routledge, 2 vols. Grattan-Guinness, I. (1997), The Fontana History of the Mathematical Sciences, London, Fontana. Grattan-Guinness, I. (2000), The Search for Mathematical Roots 1870-1940: Logic, Set Theories and the Foundations of Mathematics from Cantor Through Russell to Gödel, Princeton, Princeton University Press. Gray, J. (1989), Ideas of Space: Euclidean, Non-Euclidean, and Relativistic, Oxford, Clarendon Press, 2.ª ed. (1.ª ed. 1979). Gray, J. (2000), The Hilbert Challenge, New York, Oxford University Press. Halmos, P. R. (1974), Naive Set Theory, New York, Springer. (1.ª ed. 1960). Hamilton, A. G. (1982), Numbers, Sets and Axioms: The Apparatus of Mathematics, Cambridge, Cambridge University Press. Hamilton, A. G. (1988), Logic for Mathematicians, Cambridge, Cambridge University Press, 2.ª ed. (1.ª ed. 1978). Hart, W. D. (ed.) (1996), The Philosophy of Mathematics, Oxford, Oxford University Press. Hausdorff, F. (1914), Grundzüge der Mengenlehre, Leipzig, Veit. Hausdorff, F. (1927), Mengenlehre, Berlin, De Gruyter. Henkin, L., Suppes, P. y Tarski, A. (eds.), (1959), The Axiomatic Method, with Special Reference to Geometry and Physics, Amsterdam, North-Holland. Herbrand, J. (1968), Écrits logiques, Paris, Presses Universitaires de France. Hermes, H. (1971), Aufzählbarkeit, Entscheidbarkeit, Berechenbarkeit, Berlin, Springer (1.ª ed. 1961). (Traducción española parcial: Introducción a la teoría de la computabilidad, Madrid, Tecnos, 1984). Heyting, A. (1971) Intuitionism: An Introduction, Amsterdam, North Holland, 3.ª ed. (1.ª ed. 1956).

214

JP 211a220-Bibl.QXD:0009

22/5/12

11:35

Página 215

BIBLIOGRAFÍ´A

Hilbert, D. (1918), “Axiomatisches Denken”, Mathematische Annalen, 78, pp. 405-415. Reimpreso en Gesammelte Abhandlungen, Berlin, Springer, Vol. 3, pp. 146-156. Hilbert, D. (1930), Grundlagen der Geometrie, Leipzig, Teubner. 7.ª ed. (1.ª ed. 1899). Hilbert, D. y Ackermann, W. (1959), Grundzüge der theoretischen Logik, Berlin, Springer, 4.ª ed. (1.ª ed. 1928). (Traducción española: Elementos de lógica teórica, Madrid, Tecnos, 1962). Hilbert, D. y Bernays, P. (1934-1939), Grundlagen der Mathematik, Berlin, Springer, 2 vols. Hodges, W. (1997), A Shorter Model Theory, Cambridge, Cambridge University Press. Howson, C. y Urbach, P. (2006) Scientific Reasoning: The Bayesian Approach, La Salle, Open Court, 3.ª ed. (1.ª ed. 1989). Hughes, R. I. G. (ed.) (1993), A Philosophical Companion to First-Order Logic, Indianapolis, Hackett. Hughes, G. E. y Cresswell, M. J. (1996) A New Introduction to Modal Logic, London, Routledge. Hunter, G. (1996), Metalogic: An Introduction to the Metatheory of Standard First Order Logic, Berkeley, University of California Press. (1.ª ed. 1971). Jech, Th. (1997), Set Theory, 2.ª ed. corregida, Berlin, New York, Springer. (1.ª ed. 1978). Johnstone, P. T. (1987), Notes on Logic and Set Theory, Cambridge, Cambridge University Press. Kelley, J. L. (1955), General Topology, New York, Van Nostrand. Kelly, J. (1997), The Essence of Logic, London, Prentice Hall. Kleene, S. C. (1952), Introduction to Metamathematics, New York, Van Nostrand. Kleene, S. C. (1967), Mathematical Logic, New York, J. Wiley. Klimovsky, G. y Boido, G. (2005), Las desventuras del conocimiento matemático. Filosofía de la matemática: una introducción, Buenos Aires, A-Z editora. Kline, M. (1980), Mathematics: The Loss of Certainty, New York, Oxford University Press.

215

JP 211a220-Bibl.QXD:0009

EL

22/5/12

11:35

Página 216

JUEGO DE LOS PRINCIPIOS

Kline, M. (1990), Mathematical Thought from Ancient to Modern Times, New York, Oxford University Press, 3 Vols. (1.ª ed. 1972). Kneale, W. y M. (1984), The Development of Logic, Oxford, Clarendon Press. (1.ª ed. 1962). Kolmogorov, A. N. (1933), Grundbegriffe der Wahrscheinlichkeitsrechnung, Berlin, Springer. Krantz, D., Luce, D., Suppes, P. y Tversky, A. (1971), Foundations of Measurement Vol. I: Additive and Polinomial Representations, New York, Academic Press. Kunen, K. (2009) The Foundations of Mathematics, London, College Publications. Kuratowski, K. (1948), Topologie, Vol 1, Warsaw, Pantwowe Wydawnictwo Naukowe, 2.ª ed. (1.ª ed. 1933). Kuratowski, K. (1961), Introduction to Set Theory and Topology, New York, Pergamon Press. Lavine, S. (1994), Understanding the Infinite, Cambridge (Mass.), Harvard University Press. Levy, A. (2002), Basic Set Theory, Second edition, New York, Dover (1.ª ed. 1979). Ludwig, G. (1985-1987), An Axiomatic Basis for Quantum Mechanics, Berlin, Springer, 2 Vols. Łukasiewicz, J. (1963), Elements of Mathematical Logic, Oxford, Pergamon Press (1.ª ed. en polaco 1929). Machover, M. (1996), Set Theory, Logic and their Limitations, Cambridge, Cambridge University Press. Manzano, M. (1989), Teoría de modelos, Madrid, Alianza. Margaris, A. (1990), First Order Mathematical Logic, New York, Dover, 2.ª ed. (1.ª ed. 1967). Mancosu, P. (1998), From Brouwer to Hilbert: The Debate on the Foundations of Mathematics in the 1920s, New York, Oxford University Press. Mates, B. (1972), Elementary Logic, New York, Oxford University Press, 2.ª ed. (1.ª ed. 1965). Mellor, D. H. (2005), Probability: A Philosophical Introduction, London, Routledge. Moore, G. H. (1982), Zermelo’s Axiom of Choice: Its Origins, Development and Influence, Berlin, Springer. 216

JP 211a220-Bibl.QXD:0009

22/5/12

11:35

Página 217

BIBLIOGRAFÍ´A

Morse, A. (1965), A Theory of Sets, New York, Academic Press. Mosterín, J. (1980), Teoría axiomática de conjuntos, Barcelona, Ariel, 2.ª ed. (1.ª ed. 1971). Mosterín, J. (2000), Los Lógicos, Madrid, Espasa Calpe. Mosterín, J. y Torretti, R. (2010), Diccionario de Lógica y Filosofía de la Ciencia, Madrid, Alianza, 2.ª ed. (1.ª ed. 2002). Mueller, I. (1981), Philosophy of Mathematics and Deductive Structure in Euclid’s Elements, Cambridge, Mass., The MIT Press. Munkres, J. (2000), Topology, Englewood Cliffs, NJ, Prentice-Hall. Nagel, E., y Newman, J. R. (1986), Gödel’s Proof, New York, New York University Press. (1.ª ed. 1958). Narens, L. (1985), Abstract Measurement Theory, Cambridge (Mass.), The MIT Press. Pollard, S. (1990), Philosophical Introduction to Set Theory, Notre Dame-London, University of Notre Dame Press. Priest, G. (2001), An Introduction to Non-Classical Logic, Cambridge, Cambridge University Press. Quine, W. V. O. (1951), Mathematical Logic, Revised edition, Cambridge (Mass.), Harvard University Press. (1.ª ed. 1940). Quine, W. V. O. (1953), From a Logical Point of View, Cambridge (Mass.), Harvard University Press. Quine, W. V. O. (1969), Set Theory and its Logic, Cambridge (Mass.), The Belknap Press of Harvard University Press, 2.ª ed. (1.ª ed. 1963). Quine, W. V. O. (1982), Methods of Logic, 4.ª ed., Cambridge (Mass.), Harvard University Press. (1.ª ed. 1950). Resnik, M. (1997), Mathematics as a Science of Patterns, Oxford, Clarendon Press. Rey Pastor, J. y Babini, J. (1985), Historia de la matemática, Barcelona, Gedisa, 2 vols. Robb, A. A. (1914), A Theory of Time and Space, Cambridge, Cambridge University Press. Rosen, J. (1995), Symmetry in Science: An Introduction to the General Theory, New York, Springer.

217

JP 211a220-Bibl.QXD:0009

EL

22/5/12

11:35

Página 218

JUEGO DE LOS PRINCIPIOS

Russell, B. (1956), Logic and Knowledge: Essays 1901-1950, Edited by R. Marsh, London, Unwin. Schoenfield, J. (1967) Mathematical Logic, New York, Academic Press. Shanker, S. G. (ed.) (1989), Gödel’s Theorem in Focus, London, Routledge. Shapiro, S. (1997), Philosophy of Mathematics: Structure and Ontology, New York, Oxford University Press. Shapiro, S. (2000), Foundations Without Foundationalism: A Case For Second-Order Logic, Oxford, Clarendon Press, 2.ª ed. (1.ª ed. 1991). Shapiro, S. (2000a), Thinking About Mathematics: The Philosophy of Mathematics, New York, Oxford University Press. Shapiro, S. (ed.) (2005) The Oxford Handbook of Philosophy of Mathematics and Logic, New York, Oxford University Press. Simons, P. (1987), Parts: A Study in Ontology, Oxford, Clarendon Press. Smith, P. (2007) An Introduction to Gödel’s Theorems, Cambridge, Cambridge University Press. Smullyan, R. M. (1992), Gödel‘s Incompleteness Theorems, New York, Oxford University Press. Smullyan, R. M. (1995), First-Order Logic, New York, Dover, 2.ª ed. (1.ª ed. 1968). Sneed, J. (1971), The Logical Structure of Mathematical Physics, Dordrecht, Reidel. Spivak, M. (1994), Calculus, Third edition, Berkeley, Publish or Perish, (1.ª ed. 1967). Stegmüller, W. (1973), Theorienstrukturen und Theoriendynamik, Berlin, Springer. (Traducción española: Estructura y dinámica de teorías, Barcelona, Ariel, 1983). Stewart, I. y Tall, D. (1979), The Foundations of Mathematics, Oxford, Oxford University Press. Stoll, R. (1979), Set Theory and Logic, New York, Dover (1.ª ed. 1963). Suppes, P. (1957), Introduction to Logic, New York, Van Nostrand. Suppes, P. (1972), Axiomatic Set Theory, New York, Dover, 2.ª ed. (1.ª ed. 1960). Suppes, P. (1993), Models and Methods in the Philosophy of Science: Selected Essays, Dordrecht, Kluwer.

218

JP 211a220-Bibl.QXD:0009

22/5/12

11:35

Página 219

BIBLIOGRAFÍ´A

Suppes, P. (2002), Representation and Invariance of Scientific Structures, Stanford, CSLI Publications. Tarski, A. (1956), Logic, Semantics, Metamathematics: Papers from 1923 to 1938, Oxford, Clarendon Press. Tarski, A. (1959), “What is Elementary Geometry?, en: Henkin, L, Suppes, P. y Tarski, A. (eds.), pp. 16-29 Tarski, A. (1994), Introduction to Logic and to the Methodology of Deductive Sciences, New York, Oxford University Press, 4.ª ed. (1.ª ed. en polaco 1936). Tiles, M. (1989), Philosophy of Set Theory: An Historical Introduction to Cantor’s Paradise, Oxford, Blackwell. Tiles, M. (1991), Mathematics and the Image of Reason, London-New York, Routledge. Torretti, R. (1978), Philosophy of Geometry from Riemann to Poincaré, Dordrecht, Reidel. Torretti, R. (1993), “El método axiomático”, en: Moulines, C. U. (ed.), La ciencia: estructura y desarrollo, Madrid, Trotta, pp. 89-110. Torretti, R. (1998), El paraíso de Cantor: La tradición conjuntista en la filosofía matemática, Santiago de Chile, Editorial Universitaria. Tymoczko, Th. (ed.) (1998), New Directions in the Philosophy of Mathematics, Princeton, Princeton University Press, 2.ª ed. (1.ª ed. 1986). Van Heijenoort, J. (1967), From Frege to Gödel: A Source Book in Mathematical Logic, 1879-1931, Cambridge (Mass.), Harvard University Press. Von Plato, J. (1994), Creating Modern Probability: Its Mathematics, Physics and Philosophy in Historical Perspective, Cambridge, Cambridge University Press. Wang, H. (1962), “The Axiomatic Method”, en: Logic, Computers and Sets, New York, Chelsea Publishing Company, 1970, pp. 1-33. Wang, H. (1993), Popular Lectures on Mathematical Logic, New York, Dover. 2.ª ed. (1.ª ed. 1981). Whitehead, A. y Russell, B. (1910-1913), Principia mathematica, Cambridge, Cambridge University Press, 3 vols. Wilder, R. (1965), Introduction to the Foundations of Mathematics, New York, J. Wiley. 2.ª ed. (1.ª ed. 1952).

219

JP 211a220-Bibl.QXD:0009

EL

22/5/12

11:35

Página 220

JUEGO DE LOS PRINCIPIOS

Williams, M. B. (1970), “Deducing the Consequences of Evolution: A Mathematical Model”, Journal of Theoretical Biology, 29, pp. 343-385. Woodger, J. (1937), The Axiomatic Method in Biology, Cambridge, Cambridge University Press. Woodger, J. (1952), Biology and Language, Cambridge, Cambridge University Press. Wussing, H. (1989), Vorlesungen zur Geschichte der Mathematik, Berlin, VEB Deutscher Verlag der Wissenschaften. 2.ª ed. (1.ª ed. 1979). (Traducción española: Lecciones de historia de las matemáticas, Madrid, Siglo XXI, 1998). Zalabardo, J. L. (2002), Introducción a la teoría de la lógica, Madrid, Alianza.

220

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.