Can a machine create new knowledge?
Table of contents
Share
Metrics
Can a machine create new knowledge?
Annotation
PII
S207751800000074-0-1
Publication type
Article
Статус публикации
Published
Authors
Timur Gataullin 
Affiliation: Professor of department of Mathematical methods in economy and management FSBEI HPE (Federal State-Financed Educational Institution of Higher Professional Education) «State University of Management»
Address: Russian Federation, ,
Abstract
Economy, based on manual labor and agriculture, was replaced by industrial economy, based on the use of natural resources, almost in all countries. International tendency demonstrates that the latter is recently being replaced by post-industrial economy which is supported by knowledge, an intellectual resource. Post-industrial society economy is specifically called knowledge economy. This deals with the fact that in the framework of knowledge economy the latter become the fundamental economic resource.
Keywords
knowledge economy, formal systems, сan a machine think
Received
27.10.2008
Date of publication
01.12.2008
Number of characters
20282
Number of purchasers
2
Views
1103
Readers community rating
0.0 (0 votes)
Cite Download pdf

To download PDF you should sign in

1 Один из авторов американской конституции, третий президент США Томас Джефферсон как-то заметил: «Кто воспринял от меня идею, пользуется ею, не обедняя меня, как получивший свет от моей лампы не погружает меня во тьму». Именно эта глубокая мысль и легла в основу новой науки — «экономики знаний». Первые систематические исследования в этом направлении в 1960-х годах провел профессор Венского университета Фриц Махлуп (см. [1]).
2 Одним из важнейших понятий экономики знаний является как раз понятие «знание».Эта экономика ставит много новых интересных вопросов, которые требуют хотя бы частичных ответов.
3 Может ли в следствии содержаться больше знания, чем в посылке? Можно ли с помощью чисто логических умозаключений увеличить знание? Может ли в результате работы алгоритма-компьютера появиться новое знание? Ведь не зря работают патентные бюро, тщательно отфильтровывая все конструкции, не содержащие принципиально нового. Ведь не зря считается, что только открытия содержат новое знание! В судебном разбирательстве имеют значение только факты, а не логические умозаключения (а ведь именно факты доставляют новое, не вытекающее посредством умозаключений, новое знание!). С другой стороны, если обучим компьютер вычислять любой сколько угодно далекий знак числа лишь по его номеру (это стало возможно совсем недавно, ранее это считалось невозможным) и он вычислит, скажем, 1 000 000 000-й знак-это новое знание или нет? Теорема Шора о том, что существует алгоритм квантовых вычислений, позволяющий (при создании соответствующих квантовых компьютеров) разлагать 1000-значное натуральное число на простые множители за несколько часов, в то время как современные самые быстродействующие компьютеры могут это сделать лишь за миллиарды миллиардов часов – так эта теорема содержит новое знание? Если нет, то почему спецслужбы готовы ассигновать на соответствующие исследования миллиарды долларов (ответ: потому что они накопили огромные массивы нерасшифрованной информации, которую можно расшифровать, основываясь на этой теореме Шора!). Если логические умозаключения не способны увеличить объем знаний, тогда как вся современная математика, теоремы которой получены логическим путем из примерно 10 аксиом Цермело-Френкеля, содержит знания не больше, чем содержится в этих аксиомах? Вся огромная математика, изложить которую Бурбаки так и не смогли из-за ее непрерывного возрастания, вся эта огромная наука содержит знания не больше, чем в этих 10 аксиомах? Но ведь, если вдуматься, что же в этом удивительного - ведь математики сами согласились выводить теоремы только из этих аксиом! Откуда же появится новое знание, такое, которого не было бы в этих аксиомах?
4 Правда тут появляется новый важный вопрос. Чтобы его сформулировать, напомним, что процесс добывания нового знания, например, поиск доказательства математической теоремы, бывает нередко сложным, запутанным, длительным во времени. Отражается ли это на количестве добываемого таким способом знания? Другими словами, правда ли, что чем сложнее доказательство теоремы, тем больше знания оно содержит?
5 Дадим ответ на оба поставленных вопроса. Выход в том, что нужно рассмотреть процесс добывания знаний, т.е. рассмотреть добывание знания во времени или как процесс получения знания из ранее полученного. Тогда чем больше теорем выведем из аксиом, тем более значительными будут эти аксиомы, тем больше знания будут содержать. Потенциально, может быть бесконечно много. Но именно потенциальность должна быть отвергнута здесь. Уместно вспомнить высказывание Вейля в духе интуиционизма по поводу натурального ряда: “Этот ряд чисел, который растет, не останавливаясь ни на какой стадии, за счет перехода к следующему числу, представляет собой многообразие возможностей, открытых для бесконечности; он вечно остается в состоянии становления, а не является царством вещей, существующих в себе” (цит. по [2, c.234].)
6 Пожалуй, математика в смысле выводов из аксиом Цермело-Френкеля еще лучше иллюстрируется этим высказыванием Вейля, чем натуральный ряд.
7 2.Краткое описание формальных систем. Знания состоят из систем знаний о предметных областях, предметная область при аксиоматическом подходе описывается системой терминов, системой аксиом и правилами умозаключений-с их помощью из нескольких истинных высказываний получается еще одно верное высказывание.
8 Система знаний о данной предметной области есть динамическая (т.е. изменяющаяся во времени) система терминов и высказываний о свойствах этих терминов. Система высказываний есть множество аксиом, теорем, следствий. Аксиомы считаются истинными, хотя очень редко с течением времени могут изменяться. Следствия получаются с помощью логических умозаключений из ранее полученных следствий, аксиом, теорем. Аксиома всегда есть открытие, вообще же открытие есть высказывание, логически не вытекающее из имеющегося знания. Если вывод следствия из имеющегося знания является сложным или длинным, то такое высказывание называется теоремой.
9 В каждой аксиоме, в каждом открытии есть новое знание или просто знание. Вследствие знания не больше, чем в посылках, из которых оно выводится. В высказывании тем больше знания, чем больше следствий из него выводится.
10 Формальная система задается системой аксиом и правил вывода, с помощью которых из одних «истинных» высказываний получаются другие, которые тоже признаются «истинными»( Конечно, при более строгом определении формальной системы надо определить используемые символы, правила построения термов, высказываний и т.п., но скрупулезное следование всем этим правилам увело бы нас слишком далеко). Классическим примером является аксиоматика геометрии Евклида с пятью известными аксиомами и обычными правилами логического вывода, из которых самый известный и наиболее применяемый математиками называется МР (Мodus Ponenc)( А, А->В)/В, т.е. если импликация А->В доказана, то если А доказано, то и В причисляется к доказанным суждениям. По сути, это единственное правило вывода, используемое математиками в их практической деятельности.
11 При задании формальной системы стараются, чтобы система аксиом не была излишней, т.е. чтобы ни одна аксиома не была следствием остальных, тогда она излишняя и ее можно исключить. Иногда это очень нелегко выяснить. Например, для выяснения является ли асиома выбора независимой от остальных аксиом теории множеств, понадобилось примерно 60 лет. (Ответ отрицательный - аксиома выбора не зависит от остальных аксиом теории множеств: Гедель, 1939; Коэн, 1964 – см. соответствующую литературу, например, [3]). Далее, система называется полной, если любое «правильно построенное» высказывание либо доказуемо, т.е. доказуемо из аксиом, либо опровергается-это означает, что доказуемо отрицание этого высказывания. Полные системы редки и являются бедными, т.е. описывают очень просто устроенные предметные области.
12 Теорема Геделя 1938 г. утверждает, что если формальная система достаточно богатая (именно: включает арифметику), а система аксиом не очень большая, например, конечная, то эта система неполна.
13 Т.е. существует (арифметическое) высказывание, которое нельзя доказать, так же как и опровергнуть.
14 Для целей данной статьи эта теорема утверждает, что никакая достаточно богатая конечная система аксиом не содержит всего знания: обязательно найдется высказывание, которое не следует логическим путем из аксиом и, значит, содержит принципиально новое знание
15 Однако формальные системы изучают не только ради них самих. Обычно формальная система вырастает из аксиоматизации некоторой предметной области. Тогда, если какое-то высказывание доказуемо в данной формальной системе, то это значит, что это высказывание содержит что-то новое о данной предметной области.
16 3.Количственное измерение знания в формальной системе. В формальной системе высказывания не имеют смысла, про них интересно только знать: доказуемы они или нет и если доказуемы, то интересуются доказательством: длинное ли оно, какие аксиомы и правила вывода в нем используются. Доказательством называется цепочка формул-высказываний, начинающаяся с аксиомы, а каждая следующая формула есть либо аксиома, либо формула, которая получена из предыдущих в этой цепочке по одному из правил вывода. Доказательство является доказательством последней формулы в цепочке.
17 Рассмотрим какую-нибудь формальную систему. Будем для каждого доказанного высказывания хранить его доказательство . Предположим, что каждому доказанному высказыванию приписано некоторое положительное число - количество содержащегося в нем знания. Длиной доказательства будем считать число высказываний в нем, исключая последнее.
18 Предположим теперь, что получено новое доказательство A1, A2,… An, E. Т.е. ранее не было известно, что E доказуемо. Полагаем D(E) = {A1,…An}, k(E)=n, а величину знания каждого высказывания Ai, i=1,…,n увеличиваем на единицу, т.е. полагаем k(Ai)=k(Ai)+1. Теперь надо обеспечить целостность системы оценки знания. Для каждого Ai, i=1,…,n берем зафиксированное для него доказательство d=(Ai),, пусть его длина есть λ, и увеличиваем на 1/ λ количество знания в каждом высказывании в этом доказательстве. Если со временем вдруг обнаружится другое доказательство высказывания E, например, более короткое, то это может привести к переоценке k(E) и запоминанию этого нового доказательства в качестве d(E).
19 Динамическая система оценки знания в формальной системе построена.
20 4.Сравнение построенной системы с реальным положением. В реальных формальных системах действуют похожие оценки знания. Действительно, теорема считается (в какой-то мере) тем значительнее, чем сложнее и длиннее ее доказательство и чем в большем числе доказательств она (эта теорема) участвует. Часто после доказательства теоремы находят более короткое и легкое новое ее доказательство, тогда ценность теоремы обычно снижается. В реальных системах также хранят доказательства и периодически их ревизуют.
21 Построенная система оценки знания согласуется также и с тем обстоятельством, что только доказанные высказывания содержат знания. Возникает множество новых вопросов. Например, если высказывание A содержит k(A) знания, то сколько знания содержит отрицание этого высказывания? А сколько знания содержит конъюнкция или дизъюнкция двух высказываний? И т.д. Наверное, здесь могут быть полезны некоторые конструкции, связанные с булевозначнымии моделями теории множеств, с нечеткими множествами и т.п.
22 5.Может ли машина создать новое знание? Одним из важнейших понятий новой экономики или экономики знаний является как раз понятие «знание». Все мы вроде знаем, что это такое, но дать точное определение трудно. Немного легче пояснить, что такое «новое знание». Это знание, которого ранее не было, или точнее, это знание, которое может быть выработано, создано в результате анализа, исследования каких-то фактов, какой-то информации. А теперь рассмотрим вопрос-заголовок данного параграфа: Может ли машина создавать новое знание? Этот вопрос тесно связан с вопросом: Может ли машина мыслить? Этот вопрос давно занимал мыслителей и прежде всего математиков, начиная с Тьюринга. Они придумали много тестов, с помощью которых можно было бы распознать машину, пытавшуюся мыслить и человека (См. также превосходную научно-популярную книгу [4]- которая стимулировала написание работы (5) и окончание написания данной заметки).
23 Рассмотрим три высказывания: А. На небе видно солнце; Б. На небе видны звезды; В. Идет дождь. Машине предъявляется много «фотографий» нашего реального мира. Она, машина, способна различить, имеют ли в момент фотографирования события А, Б, В. Через достаточно много просмотров «фотографий» машина уверенно делает три вывода:
24

1. Если A, то не (т.е. если на небе видно солнце, то звезд не видно), символически,

25

;

26

2. Если Б, то не А (т.е. если на небе видны звезды, то солнца не видно). Символически, Б>>Ā;

27

3. Если А, то В маловероятно (т.е. если на небе видно солнце, то дождь маловероятен).

28

Эти выводы представляют собой НОВОЕ ЗНАНИЕ, которое не было заложено в машину! Расскажем о том, как такие выводы делает компьютер. Для анализа вывода X>>Y компьютер отмечает все «фотографии», в которых имеет место X и из них отмечает все «фотографии», в которых к тому же имеет место Y. Деля второе число на первое, получаем относительную частоту выполнения вывода X>>Y: если это число равно 1, то вывод признается справедливым, если это отношение меньше, скажем, 0,2, то признается маловероятным и т.д.

29

Изложенный пример вовсе не является таким уж простым и бессодержательным. Представим человечество, находящееся на этапе массовых межзвездных исследований. Человечество в ходе космической экспансии, ему нужны новые планеты для заселения. На другую планету сбрасывается автоматический зонд, в программу которого заложено много вопросов: Бывают ли землетрясения? Бывают ли засухи? Какова связь этих событий со средней температурой планеты? Каков средний уровень океана? И т.д., и т.п. Через несколько лет наблюдений над планетой зонд сообщает свои выводы - см. выше.

30

А теперь приведем отрывок из книги [6].Он имеет прямое отношение к теме нашей заметки и касается работы нашей разведки за рубежом. Правда, это было написано про советскую разведку примерно 70-х годов прошлого века, но, думается, суть не слишком изменилась.

31

«Для нас бесценны сведения, поступающие от водителей советских грузовиков за рубежом, от проводников советских поездов, от экипажей Аэрофлота, от наших спортсменов и, конечно, от агентуры. Сведения эти отрывочны и не связаны: "Дивизия поднята по тревоге", "Ракетная батарея ушла в неизвестном направлении", "Массовый взлет всех самолетов". Эти кусочки наша электронная машина сопоставляет с активностью в эфире. Замечаются закономерности, учитываются особые случаи, и исключения из правил. И вот в результате многолетнего анализа появляется возможность сказать: "Если вышла в эфир РБ-7665-1, значит, через четыре дня будет произведен массовый взлет в Рамштейне". Это нерушимый закон. А если вдруг заработает станция, которую мы называем Ц-1000, тут и ребенку ясно, что боеготовность американских войск в Европе будет повышена. А если, к примеру...». Это же в точности то, что было написано у нас!

32

6.Может ли машина мыслить? Пусть X,Y - два высказывания. Вышеуказанный вывод X>>Y назовем условной импликацией. Этой условной импликации припишем после просмотра некоторого числа «фотографий» текущую частоту f(X,Y)=k(X,Y)/n, где n- число «фотографий» в которых имеет место X, и в k(Y) из которых (из этих n) имеет место Y.Когда эта текущая частота стабилизируется на величине t(X,Y), то эта величина принимается как значение условной импликации X>>Y (и машина перестает следить за выполнением этой импликации, но может и не перестать, если позволяют ресурсы памяти и вычислительные).

33

(Название условной импликации оправдывается ее отличием от логической импликации X→Y, которая равносильна дизъюнкции ; логическая импликация считается истинной, если истинно или - первое нам не подходит).

34

Вернемся к вопросу: Может ли машина мыслить? Отметим, что условная импликация А>>Б (см. начало статьи) является причинно-следственной, а импликация Б>>Ā не является причинно-следственной!

35

Ведь когда на небе видны звезды, то солнце не видно вовсе не поэтому, а потому что его нет на небе. Но эти импликации и Б>>Ā логически равносильны! Следовательно, так обученная машина не видит разницы между причинно-следственной связью событий и одновременной осуществимостью событий.

36

Способность создавать новое знание нужно признать низшей формой мышления. Но более важной функцией мышления является именно открытие причинно-следственных связей. Описанная выше машина может создавать новое знание, но так как она не может отличить причину от следствия, то этой более важной функции мышления она не имеет.

37

Раздумывая над этими вопросами я спросил свою коллегу Евгению Макарову (во время нашей беседы за чашкой чая с медом : почему, собственно она уверена, что Земля вращается вокруг Солнца, а не наоборот: Солнце вращается вокруг Земли?

38

Поразмыслив, она ответила, что это вообще-то не просто и что для правильного ответа много чего надо знать: более-менее научную картину Солнечной Системы; то, что Солнце-это огромный ядерный реактор, вероятную причину смены дня и ночи и времен года, нужно опираться на какой-никакой собственный опыт и т.д. и т.п.

39

Обобщая можно сказать, что для выявления причинно-следственных связей нужно знать не формально-логическую структуру этих высказываний, а их содержательный смысл.

40

7.Мышление человека. По-видимому, что наш мозг(или целиком или его достаточно значительная часть) очень похож на описанный выше компьютер. В наш мозг в каждый момент времени направляется «фотография» нашего реального мира и он анализирует связи между огромным числом высказываний-гипотез-фактов, накапливает частоты осуществления импликаций и запоминает их. Непонятно только, как он это конкретно делает. Например, когда человек учится кататься на велосипеде, то это довольно мучительный процесс. Но проходит некоторое время и этот человек говорит. «Я научился. Теперь я умею кататься на велосипеде.» Однако, когда его просят сообщить, как же именно он катается на велосипеде, он смущенно говорит: «я не знаю, просто мои руки и ноги сами делают необходимые движения, но я не в состоянии детально все это описать». От себя добавим, что такое «описание» вряд ли помогло бы другому желающему научиться кататься на велосипеде.

41

Но все упирается, в общем, в объем запоминающих устройств человеческого мозга. В нашем примере в начале статьи было всего три высказывания. Пусть таких высказываний миллион- . Тогда импликаций, т.е. двукратных связей между ними уже триллион, т.е., а ячеек для хранения частот должно быть, по крайней мере столько же, так что получаем уже . По подсчетам физиологов, в человеческом мозге имеется примерно нервных клеток, а сколько может храниться информации в одной клетке,пока не знает никто. Но, во всяком случае, видно, что информационные ресурсы мозга с лихвой перекрывают имеющиеся потребности по части переработки и хранения информации.

42

Теперь представим себе компьютер наподобие того зонда, который был оставлен на другой планете для анализа происходящих событий. Даже на современном уровне компьютер нетрудно научить выявлять и оценивать связь различных событий. Более того, компьютер сам может вводить и оценивать связь различных событий. Если этот компьютер имеет параметры памяти и другие, сравнимые с человеческим мозгом, то по прошествии какого-то времени работы этого компьютера мы вряд ли сумеем разобраться, где что у него хранится. Также как и в человеческом мозге, в котором ученые только в ходе труднейших исследований находят участки, ответственные за те или иные функции.

43

В этом смысле никакого принципиального отличия нашего мозга(или его значительной части) от компьютера нет. Все дело в его огромных вычислительных и других ресурсах. Как только компьютер сравнится с мозгом по этим ресурсам, с ним будут те же проблемы.

44

Можно выделить следующие уровни мышления человека: 1) низший-корреляционно-регрессионный, основанный на анализе относительных частот условных импликаций; 2)следующий, основанный на анализе относительных частот условных импликаций с помощью приборов, непосредственно продолжающих наши органы чувств,- микроскопы, телескопы, метры, часы и некоторые другие; 3) отыскание причинно-следственных связей; 4) высший-с помощью абстрактных научных теорий, основные выводы которых не могут быть получены простым анализом фактов, эти выводы недоступны нашему чувственному восприятию и могут быть получены только лишь с помощью математических методов (например, принцип неопределенности Гейзенберга или другие основные результаты квантовой механики).

45

Только человеку доступны 3-й и 4-й уровни; животным, наверное, доступны только 1- 3-й, компьютер можно обучить 1-му и 2-му уровням.