Neural network clustering algorithm with selection of features and bayesian regularization for problems of bankruptcies

Biryukov, Alexandr; Kasimova, Liana

Home>Issue 1-4>Neural network clustering algorithm with selection of features and bayesian regularization for problems of bankruptcies

Table of contents

Annotation Estimate Publication content

References Comments

Neural network clustering algorithm with selection of features and bayesian regularization for problems of bankruptcies

Annotation

PII

S207751800000016-6-2

Publication type

Article

Статус публикации

Published

Authors

Alexandr Biryukov Send message

ORCID: 0000-0001-9180-5709

Liana Kasimova

Edition

Volume 11 Issue 1-4

Abstract

The development of a Bayesian iterative method of clustering on the basis of feature selection allows you to filter the aggregate of cluster-forming characteristics according to their information content and, consequently, produce a "thin" adjustments to the initial partitioning of objects into clusters. The efficiency of the proposed method of feature selection for clustering, expressed in a significant reduction of their number, for modeling decision-making in credit banking technologies.

Keywords

neural network model, clustering, Bayesian approach, selection of characteristics, clusters, and loan technology

Received

18.11.2016

Date of publication

29.12.2016

Number of purchasers

Views

3905

Readers community rating

0.0 (0 votes)

Previous versions

S207751800000016-6-1

Cite Download pdf

GOST	Biryukov A., Kasimova L. Neural network clustering algorithm with selection of features and bayesian regularization for problems of bankruptcies // Artificial societies. – 2016. – V. 11. – Issue 1-4. URL: https://artsoc.jes.su/s207751800000016-6-1/
MLA	Biryukov, Alexandr, Kasimova, Liana "Neural network clustering algorithm with selection of features and bayesian regularization for problems of bankruptcies." Artificial societies. 11.1-4 (2016).
APA	Biryukov A., Kasimova L. (2016). Neural network clustering algorithm with selection of features and bayesian regularization for problems of bankruptcies. Artificial societies. vol. 11, no. 1-4

Additional services access

Additional services for the article

Services benefits

100 RUB / 1.0 SU

Comments

No posts found

Write a review

Translate

ISSN 2079-8784

Founder

State Academic University for the Humanities
119049, Moscow, Maronovsky st., 26<

gaugn.ru

Founder / Publisher

Central Economics and Mathematics Institute RAS
117418, Moscow, Nachimovky prospect 47

cemi.rssi.ru


1	Актуальность задач кластеризации в скоринговых технологиях	<p><strong>Актуальность задач кластеризации в </strong><strong>скоринговых</strong><strong> технологиях</strong></p> <p><strong>Актуальность задач кластеризации в </strong><strong>скоринговых</strong><strong> технологиях</strong></p>

2	Актуальность задачи кластеризации в скоринговых кредитных банковских технологиях обусловлена следующими соображениями. Решение о выдаче кредита и схеме кредитования принимается на основе оценки кредитоспособности заемщика на базе построенной ранее (по ретроспективным данным) модели для совокупности «подобных» заемщиков. Термин «подобных» здесь интерпретируется как сходственность заемщиков в кластере по виду деятельности, финансово-экономическому состоянию, поведенческим качественным показателям в отношении дисциплины погашения кредита. Источником информации для построения ретроспективной логистической модели вида: при этом служит база данных из Российского национального бюро кредитных историй, а также стандартная публично доступная бухгалтерская отчетность.	<p><strong> </strong>Актуальность задачи кластеризации в скоринговых кредитных банковских технологиях обусловлена следующими соображениями. Решение о выдаче кредита и схеме кредитования принимается на основе оценки кредитоспособности заемщика на базе построенной ранее (по ретроспективным данным) модели для совокупности «подобных» заемщиков. Термин «подобных» здесь интерпретируется как сходственность заемщиков в кластере по виду деятельности, финансово-экономическому состоянию, поведенческим качественным показателям в отношении дисциплины погашения кредита. Источником информации для построения ретроспективной логистической модели вида: <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image1.png" alt="" /> при этом служит база данных из Российского национального бюро кредитных историй, а также стандартная публично доступная бухгалтерская отчетность.</p> <p><strong> </strong>Актуальность задачи кластеризации в скоринговых кредитных банковских технологиях обусловлена следующими соображениями. Решение о выдаче кредита и схеме кредитования принимается на основе оценки кредитоспособности заемщика на базе построенной ранее (по ретроспективным данным) модели для совокупности «подобных» заемщиков. Термин «подобных» здесь интерпретируется как сходственность заемщиков в кластере по виду деятельности, финансово-экономическому состоянию, поведенческим качественным показателям в отношении дисциплины погашения кредита. Источником информации для построения ретроспективной логистической модели вида: <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image1.png" alt="" /> при этом служит база данных из Российского национального бюро кредитных историй, а также стандартная публично доступная бухгалтерская отчетность.</p>

3	Функция вычисляется по известным своим аргументам и с помощью адаптивной (обучаемой на примерах для различных объектов – корпораций) нейросетевой модели типа «Многослойный персептрон» (Multi Lаuеr Реrsерtrоn (MLР)) [8]: где оператор нейросетевого отображения «вход-выход»; – матрица настраиваемых в процессе обучения сети на примерах синаптических весов связей между нейронами. При этом в каждом обучающем примере должны быть известны как значения входных переменных где – дискретное время («временные срезы» наблюдений), так и значения выходной переменной число «временных срезов» наблюдений.	<p>Функция <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image2.png" alt="" /> вычисляется по известным своим аргументам <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image3.png" alt="" />и <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image4.png" alt="" /> с помощью адаптивной (обучаемой на примерах для различных объектов – корпораций) нейросетевой модели типа «Многослойный персептрон» (Multi Lаuеr Реrsерtrоn (MLР)) [8]: где <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image5.png" alt="" /> оператор нейросетевого отображения «вход-выход»; <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image6.png" alt="" /> – матрица настраиваемых в процессе обучения сети на примерах синаптических весов связей между нейронами. При этом в каждом обучающем примере должны быть известны как значения входных переменных <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image7.png" alt="" />где <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image8.png" alt="" /> – дискретное время («временные срезы» наблюдений), так и значения выходной переменной <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image9.png" alt="" /> <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image10.png" alt="" />число «временных срезов» наблюдений.</p> <p>Функция <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image2.png" alt="" /> вычисляется по известным своим аргументам <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image3.png" alt="" />и <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image4.png" alt="" /> с помощью адаптивной (обучаемой на примерах для различных объектов – корпораций) нейросетевой модели типа «Многослойный персептрон» (Multi Lаuеr Реrsерtrоn (MLР)) [8]: где <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image5.png" alt="" /> оператор нейросетевого отображения «вход-выход»; <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image6.png" alt="" /> – матрица настраиваемых в процессе обучения сети на примерах синаптических весов связей между нейронами. При этом в каждом обучающем примере должны быть известны как значения входных переменных <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image7.png" alt="" />где <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image8.png" alt="" /> – дискретное время («временные срезы» наблюдений), так и значения выходной переменной <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image9.png" alt="" /> <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image10.png" alt="" />число «временных срезов» наблюдений.</p>

4	Банки занимаются кредитованием корпораций из различных отраслей экономики. Следовательно, для повышения объективности и качества принимаемых решений о кредитовании банки должны иметь спектр ретроспективных кластерных моделей оценки кредитоспособности заемщиков: для строительной отрасли, торговли, машиностроения, сельского хозяйства, транспортных компаний и др.	<p>Банки занимаются кредитованием корпораций из различных отраслей экономики. Следовательно, для повышения объективности и качества принимаемых решений о кредитовании банки должны иметь спектр ретроспективных кластерных моделей оценки кредитоспособности заемщиков: для строительной отрасли, торговли, машиностроения, сельского хозяйства, транспортных компаний и др.</p> <p>Банки занимаются кредитованием корпораций из различных отраслей экономики. Следовательно, для повышения объективности и качества принимаемых решений о кредитовании банки должны иметь спектр ретроспективных кластерных моделей оценки кредитоспособности заемщиков: для строительной отрасли, торговли, машиностроения, сельского хозяйства, транспортных компаний и др.</p>

5	Особенности постановки задач классификации и кластеризации в аспекте байесовского подхода	<p><strong>Особенности постановки задач классификации и кластеризации в аспекте байесовского подхода</strong></p> <p><strong>Особенности постановки задач классификации и кластеризации в аспекте байесовского подхода</strong></p>

6	Задача классификации ставится так. Имеется обучающая выборка данных где вектор - строки (объекты) снабжены метками (прецедентами) о принадлежности объектов к классам: . При этом число классов априори известно. Модель должна разбивать объекты на непересекающихся множеств (классов) оптимальным по выбранному критерию способом. Критерий разбиения должен быть построен так, чтобы расстояния, в частности евклидовы, между объектами внутри классов были как можно меньше, а из разных классов – как можно больше. Новый вектор , предъявленный обученной модели, должен быть отнесен к одному наиболее вероятному из классов .	<p><strong> </strong>Задача классификации ставится так. Имеется обучающая выборка данных <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image11.png" alt="" /> где вектор - строки (объекты) <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image12.png" alt="" />снабжены метками (прецедентами) о принадлежности объектов к классам: <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image13.png" alt="" /><img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image14.png" alt="" />. При этом число классов <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image15.png" alt="" /> априори известно. Модель должна разбивать объекты на непересекающихся множеств (классов) оптимальным по выбранному критерию способом. Критерий разбиения должен быть построен так, чтобы расстояния, в частности евклидовы, между объектами внутри классов были как можно меньше, а из разных классов – как можно больше. Новый вектор <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image16.png" alt="" />, предъявленный обученной модели, должен быть отнесен к одному наиболее вероятному из классов <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image17.png" alt="" />.</p> <p><strong> </strong>Задача классификации ставится так. Имеется обучающая выборка данных <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image11.png" alt="" /> где вектор - строки (объекты) <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image12.png" alt="" />снабжены метками (прецедентами) о принадлежности объектов к классам: <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image13.png" alt="" /><img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image14.png" alt="" />. При этом число классов <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image15.png" alt="" /> априори известно. Модель должна разбивать объекты на непересекающихся множеств (классов) оптимальным по выбранному критерию способом. Критерий разбиения должен быть построен так, чтобы расстояния, в частности евклидовы, между объектами внутри классов были как можно меньше, а из разных классов – как можно больше. Новый вектор <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image16.png" alt="" />, предъявленный обученной модели, должен быть отнесен к одному наиболее вероятному из классов <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image17.png" alt="" />.</p>

7	Задачи кластеризации являются частным случаем задач классификации: в данных нет меток о принадлежности объектов к определенным классам и априори неизвестно число классов . Разбиение осуществляется на основе выбранного критерия, выражающегося через те или иные внутриклассовые и междуклассовые расстояния. При предъявлении новых объектов модель кластеризации перестраивается, и анализируемые объекты относятся к соответствующим кластерам.	<p>Задачи кластеризации являются частным случаем задач классификации: в данных нет меток о принадлежности объектов к определенным классам и априори неизвестно число классов <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image15.png" alt="" />. Разбиение осуществляется на основе выбранного критерия, выражающегося через те или иные внутриклассовые и междуклассовые расстояния. При предъявлении новых объектов модель кластеризации перестраивается, и анализируемые объекты относятся к соответствующим кластерам.</p> <p>Задачи кластеризации являются частным случаем задач классификации: в данных нет меток о принадлежности объектов к определенным классам и априори неизвестно число классов <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image15.png" alt="" />. Разбиение осуществляется на основе выбранного критерия, выражающегося через те или иные внутриклассовые и междуклассовые расстояния. При предъявлении новых объектов модель кластеризации перестраивается, и анализируемые объекты относятся к соответствующим кластерам.</p>

8	Модели классификации и кластеризации могут строиться на основе традиционных методов параметрической статистики. Данная группа методов позволяет строить обоснованные модели кластеризации систем в случае большого набора экспериментальных данных (достаточного для доказательства статических гипотез о характере закона распределения) и при относительно равномерном их распределении в пространстве параметров. Однако при высокой стоимости экспериментальных данных, или невозможности получении достаточного их количества, их высокой зашумленностью, неполноте и противоречивости, нейросетевые модели оказываются более предпочтительными. Нейронная сеть как инструмент кластеризации оказывается избирательно чувствительной в областях скопления данных.	<p>Модели классификации и кластеризации могут строиться на основе традиционных методов <em>параметрической статистики</em>. Данная группа методов позволяет строить обоснованные модели кластеризации систем в случае большого набора экспериментальных данных (достаточного для доказательства статических гипотез о характере закона распределения) и при относительно равномерном их распределении в пространстве параметров. Однако при высокой стоимости экспериментальных данных, или невозможности получении достаточного их количества, их высокой зашумленностью, неполноте и противоречивости, нейросетевые модели оказываются более предпочтительными. Нейронная сеть как инструмент кластеризации оказывается избирательно чувствительной в областях скопления данных.</p> <p>Модели классификации и кластеризации могут строиться на основе традиционных методов <em>параметрической статистики</em>. Данная группа методов позволяет строить обоснованные модели кластеризации систем в случае большого набора экспериментальных данных (достаточного для доказательства статических гипотез о характере закона распределения) и при относительно равномерном их распределении в пространстве параметров. Однако при высокой стоимости экспериментальных данных, или невозможности получении достаточного их количества, их высокой зашумленностью, неполноте и противоречивости, нейросетевые модели оказываются более предпочтительными. Нейронная сеть как инструмент кластеризации оказывается избирательно чувствительной в областях скопления данных.</p>

9	Эта особенность нейросетевых моделей основывается на более общем принципе – адаптивной кластеризации данных. Одной из первых сетей, обладающих свойствами адаптивной кластеризации, была карта самоорганизации Т. Кохонена [11]. Задачей нейросети Кохонена является автоматизированное построение отображения набора входных векторов высокой размерности в карту кластеров меньшей размерности, причем, таким образом, что близким кластерам на карте отвечают близкие друг к другу входные векторы в исходном пространстве. Таким образом, при значительном уменьшении размерности пространства сохраняется топологический порядок расположения данных. При замене всех векторов каждого кластера его центром достигается высокая степень сжатия информации при сохранении ее структуры в целом.	Эта особенность нейросетевых моделей основывается на более общем принципе – адаптивной кластеризации данных. Одной из первых сетей, обладающих свойствами адаптивной кластеризации, была карта самоорганизации Т. Кохонена [11]. Задачей нейросети Кохонена является автоматизированное построение отображения набора входных векторов высокой размерности в карту кластеров меньшей размерности, причем, таким образом, что близким кластерам на карте отвечают близкие друг к другу входные векторы в исходном пространстве. Таким образом, при значительном уменьшении размерности пространства сохраняется топологический порядок расположения данных. При замене всех векторов каждого кластера его центром достигается высокая степень сжатия информации при сохранении ее структуры в целом. Эта особенность нейросетевых моделей основывается на более общем принципе – адаптивной кластеризации данных. Одной из первых сетей, обладающих свойствами адаптивной кластеризации, была карта самоорганизации Т. Кохонена [11]. Задачей нейросети Кохонена является автоматизированное построение отображения набора входных векторов высокой размерности в карту кластеров меньшей размерности, причем, таким образом, что близким кластерам на карте отвечают близкие друг к другу входные векторы в исходном пространстве. Таким образом, при значительном уменьшении размерности пространства сохраняется топологический порядок расположения данных. При замене всех векторов каждого кластера его центром достигается высокая степень сжатия информации при сохранении ее структуры в целом.

10	Карты Кохонена применяются в основном для двух целей. Первая из них – наглядное упорядочивание многопараметрической информации. На практике обычно используется одномерная и двумерная карты. Кластеры, задаваемые узлами карты, содержат группы в некотором смысле похожих наблюдений, которым может быть приписан групповой семантический смысл.	<p>Карты Кохонена применяются в основном для двух целей. Первая из них – наглядное упорядочивание многопараметрической информации. На практике обычно используется одномерная и двумерная карты. Кластеры, задаваемые узлами карты, содержат группы в некотором смысле похожих наблюдений, которым может быть приписан групповой семантический смысл.</p> <p>Карты Кохонена применяются в основном для двух целей. Первая из них – наглядное упорядочивание многопараметрической информации. На практике обычно используется одномерная и двумерная карты. Кластеры, задаваемые узлами карты, содержат группы в некотором смысле похожих наблюдений, которым может быть приписан групповой семантический смысл.</p>

11	Применительно к моделированию экономических систем, карты Кохонена могут использоваться для выявления различий в режимах поведения системы. При этом могут выявляться аномальные режимы. Важно, что при этом могут быть обнаружены неожиданные скопления близких данных, последующая интерпретация которых пользователем может привести к получению нового знания об исследуемой системе.	<p>Применительно к моделированию экономических систем, карты Кохонена могут использоваться для выявления различий в режимах поведения системы. При этом могут выявляться аномальные режимы. Важно, что при этом могут быть обнаружены неожиданные скопления близких данных, последующая интерпретация которых пользователем может привести к получению нового знания об исследуемой системе.</p> <p>Применительно к моделированию экономических систем, карты Кохонена могут использоваться для выявления различий в режимах поведения системы. При этом могут выявляться аномальные режимы. Важно, что при этом могут быть обнаружены неожиданные скопления близких данных, последующая интерпретация которых пользователем может привести к получению нового знания об исследуемой системе.</p>

12	Акцентируем внимание на общей постановке задачи кластеризации многомерных данных, особенно на двух ее особенностях: В данных в вектор-строках наблюдений, переменные (кластеризующие признаки) не разделяются на объясняющие и результативные. Соответственно не выделяются шумовая составляющая η в записи: , (1) где - измеренное значение результативного признака в i-ом наблюдении; - регулярная часть случайной величины Y в i-ом измерении; - функция шума; β – амплитуда шума.	<p>Акцентируем внимание на общей постановке задачи кластеризации многомерных данных, особенно на двух ее особенностях: В данных <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image18.png" alt="" /> в вектор-строках наблюдений<img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image19.png" alt="" />, <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image20.png" alt="" /> переменные (кластеризующие признаки) не разделяются на объясняющие и результативные. Соответственно не выделяются шумовая составляющая <em>η </em>в записи: <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image21.png" alt="" />, (1) где <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image22.png" alt="" /> - измеренное значение результативного признака в <em>i</em>-ом наблюдении; <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image23.png" alt="" />- регулярная часть случайной величины <em>Y</em> в <em>i</em>-ом измерении;<img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image24.png" alt="" /> - функция шума<em>; β</em> – амплитуда шума.</p> <p>Акцентируем внимание на общей постановке задачи кластеризации многомерных данных, особенно на двух ее особенностях: В данных <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image18.png" alt="" /> в вектор-строках наблюдений<img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image19.png" alt="" />, <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image20.png" alt="" /> переменные (кластеризующие признаки) не разделяются на объясняющие и результативные. Соответственно не выделяются шумовая составляющая <em>η </em>в записи: <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image21.png" alt="" />, (1) где <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image22.png" alt="" /> - измеренное значение результативного признака в <em>i</em>-ом наблюдении; <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image23.png" alt="" />- регулярная часть случайной величины <em>Y</em> в <em>i</em>-ом измерении;<img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image24.png" alt="" /> - функция шума<em>; β</em> – амплитуда шума.</p>

13	Наиболее полным статистическим описанием наблюдаемых многомерных данных является совместная плотность распределения вероятности в n-мерном пространстве признаков.	<p>Наиболее полным статистическим описанием наблюдаемых многомерных данных <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image18.png" alt="" /> является совместная плотность распределения вероятности <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image25.png" alt="" /> в <em>n</em>-мерном пространстве признаков.</p> <p>Наиболее полным статистическим описанием наблюдаемых многомерных данных <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image18.png" alt="" /> является совместная плотность распределения вероятности <img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image25.png" alt="" /> в <em>n</em>-мерном пространстве признаков.</p>

14	Эти две особенности значительно расширяют возможности различных аналитических построений в рамках байесовского подхода к решению задачи кластеризации. Например, не надо делать никаких предположений о законе распределения шумовой составляющей в измерениях. Если дополнительно ввести допущение о гауссовом распределении векторов, то можно воспользоваться результатами теории байесовской кластеризации из [10].	<p>Эти две особенности значительно расширяют возможности различных аналитических построений в рамках байесовского подхода к решению задачи кластеризации. Например, не надо делать никаких предположений о законе распределения шумовой составляющей в измерениях. Если дополнительно ввести допущение о гауссовом распределении векторов<img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image26.png" alt="" />, то можно воспользоваться результатами теории байесовской кластеризации из [10].</p> <p>Эти две особенности значительно расширяют возможности различных аналитических построений в рамках байесовского подхода к решению задачи кластеризации. Например, не надо делать никаких предположений о законе распределения шумовой составляющей в измерениях. Если дополнительно ввести допущение о гауссовом распределении векторов<img class="image-formula" src="http://artsoc.jes.su/images/publication_images/2388/image26.png" alt="" />, то можно воспользоваться результатами теории байесовской кластеризации из [10].</p>

15	Элементы теории классификации на основе байесовского подхода к принятию решений	<p><strong>Элементы теории классификации на основе байесовского подхода к принятию решений</strong></p> <p><strong>Элементы теории классификации на основе байесовского подхода к принятию решений</strong></p>

16	В монографии [1] рассмотрены как задачи классификации, так и задачи кластеризации, которые являются частным случаем задач классификации: в задачах кластеризации отсутствуют «метки» (преценденты), т.е. достоверная априорная информация о принадлежности векторов данных к тем или иным классам, а также о числе М классов.	В монографии [1] рассмотрены как задачи классификации, так и задачи кластеризации, которые являются частным случаем задач классификации: в задачах кластеризации отсутствуют «метки» (преценденты), т.е. достоверная априорная информация о принадлежности векторов <img src="http://artsoc.jes.su/images/publication_images/2388/image27.png" class="image-formula"/> данных к тем или иным классам, а также о числе <em>М</em> классов. В монографии [1] рассмотрены как задачи классификации, так и задачи кластеризации, которые являются частным случаем задач классификации: в задачах кластеризации отсутствуют «метки» (преценденты), т.е. достоверная априорная информация о принадлежности векторов <img src="http://artsoc.jes.su/images/publication_images/2388/image27.png" class="image-formula"/> данных к тем или иным классам, а также о числе <em>М</em> классов.

17	Рассмотрим вначале общие идеи классификации на основе байесовской теории решений [6,7]. Байесовский подход к задачам классификации исходит из статистической природы измеренных значений вектора {}, содержащихся в данных D. За основу берется предположение о существовании вероятностной меры на пространстве распознаваемых образов, которая либо известна, либо может быть оценена. Цель состоит в подборе такого классификатора, который будет определять правильно наиболее вероятный класс для нового предъявляемого образа.	Рассмотрим вначале общие идеи классификации на основе байесовской теории решений [6,7]. Байесовский подход к задачам классификации исходит из статистической природы измеренных значений вектора {<img src="http://artsoc.jes.su/images/publication_images/2388/image28.png" class="image-formula"/>}<img src="http://artsoc.jes.su/images/publication_images/2388/image29.png" class="image-formula"/>, содержащихся в данных <em>D</em>. За основу берется предположение о существовании вероятностной меры на пространстве распознаваемых образов<img src="http://artsoc.jes.su/images/publication_images/2388/image30.png" class="image-formula"/>, которая либо известна, либо может быть оценена. Цель состоит в подборе такого классификатора, который будет определять правильно наиболее вероятный класс для нового предъявляемого образа<img src="http://artsoc.jes.su/images/publication_images/2388/image27.png" class="image-formula"/>. Рассмотрим вначале общие идеи классификации на основе байесовской теории решений [6,7]. Байесовский подход к задачам классификации исходит из статистической природы измеренных значений вектора {<img src="http://artsoc.jes.su/images/publication_images/2388/image28.png" class="image-formula"/>}<img src="http://artsoc.jes.su/images/publication_images/2388/image29.png" class="image-formula"/>, содержащихся в данных <em>D</em>. За основу берется предположение о существовании вероятностной меры на пространстве распознаваемых образов<img src="http://artsoc.jes.su/images/publication_images/2388/image30.png" class="image-formula"/>, которая либо известна, либо может быть оценена. Цель состоит в подборе такого классификатора, который будет определять правильно наиболее вероятный класс для нового предъявляемого образа<img src="http://artsoc.jes.su/images/publication_images/2388/image27.png" class="image-formula"/>.

18	Байесовское правило классификации	<em><strong>Байесовское правило классификации</strong></em> <em><strong>Байесовское правило классификации</strong></em>

19	Пусть задано М классов. Будем также считать известными априорные вероятности классов Р (), которые могут быть легко оценены по прецендентам (меткам): , (2) где - число прецендентов из класса; N – общее число прецендентов в данных.	Пусть задано <em>М</em> классов<img src="http://artsoc.jes.su/images/publication_images/2388/image31.png" class="image-formula"/>. Будем также считать известными априорные вероятности классов <em>Р</em><em> </em>(), которые могут быть легко оценены по прецендентам (меткам): <em> </em><img src="http://artsoc.jes.su/images/publication_images/2388/image33.png" class="image-formula"/><em>,</em> (2) где <img src="http://artsoc.jes.su/images/publication_images/2388/image34.png" class="image-formula"/>- число прецендентов из класса<img src="http://artsoc.jes.su/images/publication_images/2388/image35.png" class="image-formula"/>; <em>N</em><em> </em>– общее число прецендентов в данных. Пусть задано <em>М</em> классов<img src="http://artsoc.jes.su/images/publication_images/2388/image31.png" class="image-formula"/>. Будем также считать известными априорные вероятности классов <em>Р</em><em> </em>(), которые могут быть легко оценены по прецендентам (меткам): <em> </em><img src="http://artsoc.jes.su/images/publication_images/2388/image33.png" class="image-formula"/><em>,</em> (2) где <img src="http://artsoc.jes.su/images/publication_images/2388/image34.png" class="image-formula"/>- число прецендентов из класса<img src="http://artsoc.jes.su/images/publication_images/2388/image35.png" class="image-formula"/>; <em>N</em><em> </em>– общее число прецендентов в данных.

20	Для расчета по формуле Байеса нам потребуется также знание функции распределения вектора признаков для каждого класса, которые называются функциями правдоподобия (Likelihood) по отношению к классу. Если плотность вероятности распределения векторов в классах соответствует совместному нормальному закону, то для функции правдоподобия можно получить аналитическое выражение. В противном случае можно приближенно оценить гистограммой распределения векторов признаков для процентов из класса.	Для расчета по формуле Байеса нам потребуется также знание функции распределения вектора признаков для каждого класса<img src="http://artsoc.jes.su/images/publication_images/2388/image36.png" class="image-formula"/><em>,</em> которые называются функциями правдоподобия (Likelihood) <img src="http://artsoc.jes.su/images/publication_images/2388/image27.png" class="image-formula"/>по отношению к классу<img src="http://artsoc.jes.su/images/publication_images/2388/image35.png" class="image-formula"/>. Если плотность вероятности распределения векторов <img src="http://artsoc.jes.su/images/publication_images/2388/image37.png" class="image-formula"/> в классах соответствует совместному нормальному закону, то для функции правдоподобия можно получить аналитическое выражение. В противном случае <img src="http://artsoc.jes.su/images/publication_images/2388/image38.png" class="image-formula"/> можно приближенно оценить гистограммой распределения векторов признаков для процентов из класса. Для расчета по формуле Байеса нам потребуется также знание функции распределения вектора признаков для каждого класса<img src="http://artsoc.jes.su/images/publication_images/2388/image36.png" class="image-formula"/><em>,</em> которые называются функциями правдоподобия (Likelihood) <img src="http://artsoc.jes.su/images/publication_images/2388/image27.png" class="image-formula"/>по отношению к классу<img src="http://artsoc.jes.su/images/publication_images/2388/image35.png" class="image-formula"/>. Если плотность вероятности распределения векторов <img src="http://artsoc.jes.su/images/publication_images/2388/image37.png" class="image-formula"/> в классах соответствует совместному нормальному закону, то для функции правдоподобия можно получить аналитическое выражение. В противном случае <img src="http://artsoc.jes.su/images/publication_images/2388/image38.png" class="image-formula"/> можно приближенно оценить гистограммой распределения векторов признаков для процентов из класса.

Comments

Via social network