Quantcast
Channel: математика —Блог Хеллера
Viewing all articles
Browse latest Browse all 33

Теории: интуиция

$
0
0

Когда я начинал писать учебник, там была глава о синтаксисе и теориях, начиная с которой большинство читателей перестали понимать о чём это всё вообще. Я долго грозился те параграфы переписать нормально и вот способился. Писался этот параграф довольно долго, но я постарался раскрыть тему наиболее понятно, неформально и интуитивно доступно. Я его публикую несколько не по порядку: он принадлежит первой главе, но я решил его дописать прежде, чем двинусь дальше в рассказе о натуральных числах, так как некоторые сведения из этого параграфа всё же понадобятся.

Тем кто ждет текстов про проституток, могу сказать: скоро.

Учебник рекомендую читать в pdf, так же требуется помощь с вычиткой и версткой на GitHub.

В этом пункте мы попытаемся на очень неформальном интуитивном уровне понять в чем состоят базовые вопросы логики и откуда они возникают при рассмотрении математических теорий, которые, на первый взгляд, отношения непосредственного к логике не имеют. Это будет очень неформальный материал, и я заранее должен оговориться, что подходы и определения, которые я буду здесь приводить, очень утрированы и упрощены. Абсолютная строгость нам здесь и не нужна, важно пока понять лишь принципы. Формальные определения будут даны в § 1.7.

Давайте для начала снова рассмотрим теорему 1.4 и попробуем доказать её в общем виде, но несколько более абстрактно.

Итак, нам дано высказывание \forall x (P(x)\to Q). Поскольку нам сказано «для любого x», то давайте возьмём для начала какой-нибудь конкретный элемент a. Что это за элемент мы не знаем, но он вполне себе конкретен. Имеем P(a)\to Q. Предположим далее, что нам совершенно точно известно, что P(a) истинно. Тогда, в этом предположении, используя импликацию, нам так же будет достоверно известно (по таблице истинности), что истинно Q. Обозначим тот факт, что из P(a) мы вывели Q как P(a)\vdash Q. Теперь трюк: мы изначально не знали что такое a, мы выбрали его на самом деле произвольным образом, мы могли бы вместо него выбрать и любой другой элемент. По сути нам тут важно лишь то, что в принципе есть некоторое a, для которого оказывается верно P(a). Из этих соображений мы можем заменить P(a) на \exists x, P(x). Теперь \exists x, P(x) \vdash Q и отсюда мы можем вернуться к импликации (опять же, в соответствии с таблицей истинности): (\exists x, P(X))\to Q. Внимательный читатель заметит, что мы наполовину доказали теорему 1.4.

Упражнение. Докажите теорему 1.4 в обратную сторону тем же способом.

У читателя могли справедливо возникнуть некоторые сомнения в этом доказательстве, однако они вызваны не каким-то недостатком в доказательстве, а скорее слишком высоким уровнем абстракции. Если перейти не к общим словам о высказываниях, а к конкретным примерам, то подобные рассуждения, как окажется, будут встречаться в математике повсеместно. Например, позже мы докажем, что любое комплексное уравнение имеет решение. Мы можем не знать это решение, мы лишь знаем, что оно существует, но из одного этого факта мы можем делать далее какие-то общие выводы. На уровне логики мы будем проделывать те же самые трюки, но они не вызовут у нас никаких сомнений.

Тем не менее, допустить ошибку в таких рассуждениях так же довольно легко. Рассмотрим элементарное высказывание \exists x \exists y, x\not= y
Поскольку мы утверждаем существование некоторых x и y, удовлетворящих неравенству, то давайте возьмём конкретные значения a и b, такие что a\not= b. А теперь, посольку b мы никак не выводили предварительно, а просто взяли любое первое попавшееся число, не равное a, давайте заменим b на \forall b: \forall b, a\not= b. Очевидно, что это приводит к противоречию, так как если теперь взять вместо b значение a, то получится a\not= a, что явно не правда.

В данном примере мы допустили очевидную ошибку, закрыв глаза на то, что мы выбирали изначально b не произвольным элементом, а исходя из того, чтобы оно не было равно a. На практике, в более сложных и длинных рассуждениях, подобные ошибки связанные с потерей каких-то условий могут так быстро и не обнаружиться. Можете ли вы с достоверностью утверждать, что в нашем доказательстве теоремы 1.4 мы не допустили ошибки? Ошибки там действительно нет, но у честного человека останутся сомнения.

Все эти рассуждения приводят нас к тому, что хорошо бы иметь какую-то более четкую систему математических доказательств. Хочется формально описать все ходы, которые мы можем делать в наших рассуждениях и которые гарантированно не приведут нас к ошибке. Этим мы и займемся.

Возьмём за базовый строительный элемент наших рассуждений понятие предложения, под которым мы будем подразумевать некоторое высказывание, по каким-то простым правилам составленное, возможно, из других высказываний. Формально мы определим это понятие в 1.7, пока же просто будем полагаться на интуицию. Например, высказываниями являются выражения \forall x (P(x)\to Q) и «любые две прямые либо пересекаются ровно в одной точке, либо не пересекаются вообще». Последнее можно формализировать: \forall l \forall k, P(l, k) \lor C(l, k), где P и C — это соответствующие предикаты, которые в свою очередь так же могут быть более подробно расписаны на языке логики. Не смотря на то, что на практике формализацией на логическом языке математических теорем занимаются довольно редко, для наших текущих целей будет важным помнить, что это по крайней мере всегда возможно.

Если обозначить высказывания греческими буквами, то любое доказательство теперь можно определить как последовательность высказываний \alpha, \beta, \gamma, \ldots, \omega. Эта последовательность должна удовлетворять следующему критерию: каждое предложение доказательства должно быть логическим следствием некоторых предыдущих предложений. Осталось определить лишь логические следствия, но это легко: каждое логическое следствие является набором предложений-посылок и связанными с ними символом \vdash предложением-результатом, причем в качестве составных частей этих предложений выступают уже не конкретные высказывания, а некоторые шаблонные символы, в которые мы можем подставлять произвольные предложения.

Приведём пример. Простейшим правилом вывода является правило, называемое дедукцией: \alpha, \alpha\to\beta \vdash \beta (если \alpha\to\beta и истинно \alpha, то отсюда следует \beta). Рассмотрим так же правило \alpha\lor\beta, \neg\alpha \vdash \beta (если верно \alpha\lor\beta и известно, что \alpha ложно, то тогда отсюда следует, что истинно \beta). То что эти правила корректны легко убедиться по таблице истинности: если все выражения слева от знака \vdash истинны, то и выражения справа так же будут истинны. Проверка этого совершенно не сложна и я оставляю её читателю в качестве упражнения.

Пусть теперь нам известно, что истинными являются высказывания \neg a, a\lor b и b\to c. Такой набор высказываний, которые мы принимаем за основные и никак их не доказываем, называется аксиомами. Все вместе эти аксиомы и возможные их следствия обозначим как T. Например, используя данные аксиомы мы можем построить следующее доказательство: T\vdash b из первых двух аксиом и второго правила вывода. Затем T\vdash c из правила дедукции и третьей аксиомы. Предложение, которое всегда истинно при предположении истинных аксиом, называется теоремой. В нашем примере мы получили две теоремы: b и c. Множество всех теорем, выводимых из заданных аксиом (включая сами аксиомы), называется теорией.

Упражнение. Пример выше может выглядеть абстрактно, тогда попробуйте задать вместо a, b, c какие-то конкретные высказывания, наделенные смыслом.

Упражнение. Импликация и теорема дедукции связаны на самом деле несколько более глубоко. Докажите, что помимо того, что T, \alpha, \alpha\to\beta\vdash \beta верно так же и то, что если T, \alpha \vdash \beta, то T \vdash \alpha\to\beta. Переформулировать человеческим языком это можно так: пусть теория T содержит аксиому \alpha и из этой теории возможно вывести теорему \beta. Тогда, если выкинуть из теории аксиому \alpha, то в этой урезанной теории будет иметься теорема \alpha\to\beta. (Подсказка: для доказательства переберите все возможные варианты истинности для предложений \alpha и \beta).

Не смотря на то, что рассматриваемый нами математический аппарат появился сравнительно недавно (точную дату дать сложно, так как всё это создавалось в течение столетий), сами подходы к аксиомам и теоремам оформились именно в таком идейном виде еще во времена Евклида, чья книга «Начала» стала первой известной исторической попыткой построить математическую теорию строго в соответствии с законами логики. После нескольких неформальных определений геометрии на плоскости, Евклид приводил 15 аксиом, которые предлагалось принять без доказательства, а далее, уже исходя из этих аксиом, выводилось шесть томов теорем.

Определения были им даны довольно невразумительные. Так, первыми двумя определениями он определял точку как «то, что не имеет никакой части» и линию как «длину без ширины». Это, вероятно, как-то отражает интуитивные представления, но не даёт ни точного определния, ни свойств. Например, Евклид, ссылаясь в этих определениях на «части», «длину» и «ширину» сами эти понятия нигде не определяет.

Это на самом деле общая ситуация с любой теорией. Если мы даём какое-то определение, то мы обязаны пользоваться некими понятиями, определенными ранее. При этом для этих более ранних определений так же должны быть определения. Процесс может продолжаться бесконечно и мы никогда не сможем придти к определению, которое не пользуется никакими другими определениями.

Таким образом, какую бы теорию мы не строили, мы неминуемо приходим к тому, что в самом начале нам необходимо ввести некое понятие, которые мы не определяем никак, просто констатируем как факт, что есть некий объект (неопределенный), которому мы придумываем название и говорим какие мы с ним можем делать операции и какими свойствами он обладает — это и есть аксиомы.

Мы не будем приводить определения Евклида, так как они лишены смысла, но и не будем вводить пока собственных определений: процесс этот хоть и не слишком сложный, но долгий и кропотливый, к тому же позже мы найдём более удобный способ определить евклидову геометрию. Пока будем полагаться на интуицию читателя о понятиях линии, окружности, пересечения, параллельности и подобном, и перейдём сразу к аксиомам.

Хотя сам Евклид приводил 15 аксиом, с современной точки зрения их можно резюмировать всего пятью следующими простыми утверждениями (остальные аксиомы оказались избыточны либо были переформулированы):

  1. Пусть a и b — две различные точки. Тогда через них можно провести единственную прямую L.
  2. Пусть a — точка, не лежащая на прямой L. Тогда из a на L можно опустить единственный перпендикуляр.
  3. Пусть a — точка, лежащая на прямой L, а M — некоторый отрезок. Тогда на прямой L можно построить различные точки b и c, лежащие от a на расстоянии, равном M.
  4. Пусть a — точка и M — отрезок. Можно построить единственную окружность с центром a и радиусом, равным M.
  5. Пусть L — прямая, и a — точка, на ней не лежащая. Тогда можно простроить единственную прямую M, которая будет проходить через a и будет параллельна L.

Далее в «Началах» следует первая теорема: для любого отрезка с концами ab возможно построить равносторонний треугольник abc.

Доказательство строится таким образом (см. русинок 1.1 для наглядной интерпретации): проведем окружность c центром a и радиусом ab, затем окружность того же радиуса, но с центром b. Пусть c — их точка пересечения. Поскольку обе окружности имеют один радиус ab, то точка c отстоит от обоих точек a и b на одно и то же расстояние, равное отрезку ab. Стало быть точки a, b и c образуют равносторонний треугольник.

euclids1thm

Вроде бы вполне себе наглядное и очевидное доказательство, какие к нему могут быть вопросы? На самом деле это доказательство некорректно. Если вместо рассуждений на пальцах начать рассуждать более строго (например, на языке логики или около того), то окажется, что у нас возникнет проблема: мы не сможем никак доказать, что окружности с центрами в точках a и b вообще пересекутся. Это кажется очевидно нашей интуиции, но из сформулированных теорем доказать этого не получится. Когда мы сталкиваемся с ситуацией, когда мы не можем доказать ни утверждение, ни его отрицание, вариантов тут может быть три:

  1. мы просто не смогли найти пока доказательство, так как это может быть сложно;
  2. что-то не так с нашей логикой, возможно нам не хватает правил вывода;
  3. что-то не так с нашими аксиомами, возможно их слишком мало и их надо дополнить.

Я сразу могу сказать забегая вперед, что в случае евклидовой геометрии, проблема именно в аксиомах: их недостаточно. Пока мы не сможем этого доказать, но мы к этой теме еще вернемся в последующих главах.

Уточним теперь понятие «что-то не так». Для примера введём такую систему аксиом:

  1. Любые две прямые пересекаются ровно в одной точке;
  2. Через любые две точки проходит ровно одна прямая;
  3. Существуют четыре точки такие, что они не лежат на одной прямой.

Это довольно расплывчатые и странные аксиомы. Например, вторая аксиома утрверждает, что параллельных прямых не существет. Тем не менее эти аксиомы не лишены смысла. Их можно интерепретировать, например, как аксиомы геометрии, которую мы наблюдаем на плоских изображениях (фото, картины) пространства. На фото возникает это странное свойство: любые две прямые пересекаются (см. рис. 1.2). Если рассмотреть, например, фото железной дороги, уходящей за горизонт, то на картинке две колеи сольются на горизонте в одну точку. В физическом мире они конечно не сливаются, но фотография создаст такую иллюзию и такая геометрия (называемая в науке проективной) вполне имеет право на существование и очень широко применяется, например, в компьютерной трехмерной графике, не говоря уже о чисто научных применениях.

railroad

fano

С другой стороны, мы можем отойти от привычного интуитивного определения линий и пространства, и рассмотреть конструкцию, изображенную на рис.1.3, которая называется плоскостью Фано. Эта «плоскость» состоит всего из семи точек и семи линий. Каждая линия состоит из трёх точек. Очевидно, что такое построение не имеет ничего общего с первой нашей интерпретацией в виде фотографий (и даже с нашей интуицией о пространстве и линиях в нём), но однако простым перебором всех возможных вариантов легко убедиться, что эта «плоскость Фано» удовлетворяет всем трём нашим аксиомам.

Рассматривая теперь плоскость Фано и фотографию, мы можем обнаружить, что хотя хотя эти две картинки совершенно не похожи друг на друга, у них есть общие теоремы. Один такой простейший пример демонстрирует следующее упражнение:

Упражнение. Докажите, что из сформулированных аксиом можно вывести, что существуют четыре линии, не пересекающиеся в одной точке.

Есть, однако, и утверждения, которые в различных интерпретациях будут отличаться. Самое очевидное касается количества точек: на фотографии их бесконечно много, а вот на плоскости Фано их всего семь. Отсюда можно понять, что раз какое-то утверждение может быть либо верным либо неверным в зависимости от интерпретации. При том, что аксиомы верны в обоих интерпретациях, это утверждение из аксиом доказать невозможно.

Схожим образом мы докажем в дальнейшем и невозможность доказательства первой теоремы Евклида из его аксиом: мы предъявим две интерпретации его аксиом, и в одной интерпретации близколежащие окружности будут пересекаться, а в другой нет. Это очень важный приём, так как он даёт нам однозначный ответ на вопрос о том, что это именно наши аксиомы неполны, а не что-то ещё. Мы готовы сформулировать теперь такие определения:

Определение. Система аксиом называется неполной, если существует предложение \phi такое, что из аксиом невозможно вывести ни \phi ни \neg\phi.

Определение. Система аксиом называется полной, если для любого предложения \phi можно вывесли либо \phi, либо \neg\phi.

Опять же забегая вперёд могу порадовать читателя: практически все полезные аксиоматические системы являются неполными. Об этом будет сказано в третьей главе, и мы даже докажем, что простейшая школьная арифметика не полна и полной быть никак не может (мы даже предъявим целый набор теорем, которые невозможно ни доказать ни опровергнуть).

В каждой конкретной интерпретации любое предложение либо истинно, либо ложно и это не зависит от возможности это доказать. Может быть такое, что у аксиом существуют разные фактически интерпретации, но при этом в них наборы истинных и ложных утверждений совпадают. Это даёт нам основание для того, чтобы в некоторых случаях рассматривать лишь такие наборы утверждений в отрыве от самой интерпретации:

Определение. Структурой называется такое множество предложений X, что для любого предложения p либо p\in X, либо \neg p \in X.

Структуры могут быть интересны иногда сами по себе и связаны с рядом задач (например, по заданной структуре найти аксиомы, которые её породили, желательно автоматически с помощью компьютера), но нами будут использоваться лишь в неотрывной связи с конкретными теориями. Желание увязать структуру с теорией приводит к следующему определению:

Определение. Моделью теории T называется такая структура M, что для любого p\in T верно, что p\in M. Множество всех моделей теории T обозначается как \operatorname{Mod} T.

Определение. Теория называется удовлетворимой, если она обладает моделью. В противном случае она называется неудовлетворимой.

Разные интерпретации могут обладать одной моделью, если в них верны одинаковые предложения, а вот модель полностью определяется набором своих истинных предложений. Для неполной теории могут существовать различные модели, в которых различные предложения истинны.

Однако, даже если теория полна, это не значит, что мы можем любое истинное утверждение в ней доказать. Подходы к определению истинности высказывания, основые на возможности доказать теорему и на основе возможных моделей теории приводят к таким различным определениям:

Определение. Предложение p называется синтаксически истинным в теории T (обозначение T\vdash p), если его возможно вывести в данной теории пользуясь правилами вывода.

Определение. Предложение называется семантически истинным в теории T (обозначение T\models p), если оно истинно в любой модели данной теории.

Если предложение семантически истинно, то вовсе не обязательно мы сможем это доказать правилами вывода, это зависит от того, что собствено говоря за правила вывода мы используем. Правила вывода мы можем взять различные и они будут обладать различными свойствами, из которых всегда хочется доказать следующее:

Определение. Набор правил вывода называется полным, если из семантической истинности предложения следует его синтаксическая истинность.

Обычно в качестве правил вывода используется правило дедукции, приведенное выше, набор утверждений о логических связках, приведенных нами в первом параграфе, а так же четыре правила для кванторов: обобщение и переход к частному для кванторов \forall и \exists. Последние правила относительно сложны и мы сформулируем их строго в § 1.7, пока что же можно думать о них интуитивно как в начале этого параграфа.

Теорема Гёделя о полноте. Указанный набор правил вывода полон.

Обратите внимание на два различных термина: полный набор правил вывода и полный набор аксиом. Первое говорит о выводимости всех истинных семантических предложений и характеризует нашу логику, которой мы пользуемся, а второй говорит не о логике, а о аксиоматической системе. Это часто вносит путаницу. Например, существует две теоремы с похожими названиями: сформулированная нами теорема Гёделя о полноте и теорема Гёделя о неполноте. Первая говорит о том, что логика, используемая нами, в некотором смысле действительно хороша для доказательства истинных утверждений, а вторая говорит уже о неполноте аксиом арифметики. Не смотря на похожее название эти теоремы относятся по сути совершенно к разным областям.

Доказывать теорему о полноте мы не будем, это доказательство довольно нетривиально (хоть принципиально и не сложно) и выходит за рамки данной книги. Вы можете найти его в любом подробном учебнике по логике либо в статьях в Интернете. Для практических нужд достаточно лишь знать ту логику, о которой мы до сих пор говорили и о возможной неполноте отдельных формальных систем не задумываться, хотя чистые математики рассматривают и другие виды логики. В качестве примера в следующем параграфе мы рассмаотрим модальную и темпоральную логику.

Многие операции, которые мы до сих пор рассматривали с точки зрения таблиц истинности и синтаксиса, можно так же рассмотреть и с точки зрения семантики. В качестве примера возьмём импликацию:

Определение. Операцией импликации p\to q называется такая операция, истинность которой эквивалентна выражению \operatorname{Mod}(T, q)\subset\operatorname{Mod}(T, p).

Здесь под \operatorname{Mod}(T, p) понимается множество всех моделей теории T, дополненной предложением p.

Упражнение. Докажите, что приведённое утверждение порождает ровно те же значения истинности, которые мы приводили в §1.1.

Прежде чем двинуться дальше введем последнее простое, но важное, определение.

Определение. Теория называется противоречивой, если в ней выводимы одновременно некоторое высказывание p и \neg p. В противном случае теория называется непротиворечивой.

Теорема. В противоречивой теории любое предложение синтаксически истинно.

Доказательство. Пусть мы вывели p и \neg p и хотим вывести q. Из истинности p вытекает истинности p\lor q (для истинности «или» достаточно, чтобы истинным было одно из двух высказываний, а первое высказывание, как мы знаем, истинно). Однако теперь из того, что истинно \neg p и p\lor q мы получаем, что истинно так же и q.\square

Это довольно странно выглядит, но на самом деле это нормально: противоречивая теория на то и противоречивая, что она не соотстветствует здравому смыслу. Очевидно так же, что противоречивая теория не может иметь модели, а следовательно и интерпретации. При построении аксиоматических систем мы должны всеми силами стараться доказать, что аксиоматика, с которой мы работаем, не протеворечива. Опять же, я могу заранее обрадовать читателя: вторая теорема Гёделя о неполноте утверждает, что для большинства полезных аксиоматик непротиворечивость доказать невозможно. Об этом мы кратко поговорим в третьей главе.

То что противоречивая теория не может иметь модели — это довольно очевидно. А верно ли обратное? То есть верно ли, что если нам известно, что теория модели не имеет, то она противоречива? Можно так же поставить схожий вопрос: если известно, что теория обладает единственной моделью, то верно ли, что она полна? (То что полная теория имеет единственную модель, опять же, вполне очевидно). В общем случае ответ на эти вопросы отрицательный. С другой стороны логика, которую мы рассматривали до сих пор (и которая, кстати, вполне достаточна для нужд других разделов математики — за её рамки нам ни разу выходить в дальнейшем не придётся и за пределами чистой логики что-либо кроме неё вообще редко встречается), всё же обладает этими свойствами. Подробности мы, однако, пока оставим в стороне, поскольку они не относятся напрямую к нашему повествованию.


Viewing all articles
Browse latest Browse all 33

Trending Articles