в среднем одной альтернативой, т.


 

Классы, образованные объектами S5—S7 и S1—S3, а также S2—S4 и S6—S8, сходны между собой в среднем одной альтернативой, т. е.

 

G(S5-7, S1-3) = G(S2-4, S6-8) = 0,5.

 

На вид дендрограммы влияет не только метод определения сходства между классами, но и порядок извлечения классов из матрицы сходства для тех случаев, когда указанные матрицы содержат несколько одинаковых максимальных значений. В этих случаях возможны два способа извлечения классов из матрицы. Первый способ основан на случайном выборе двух классов, на пересечении которых в матрице сходства стоит одно из максимальных значений. Второй способ предполагает осуществление одновременного выбора всех классов, имеющих максимальные значения в матрице сходства.

Наиболее распространен в практике кластерного анализа первый способ извлечения классов из матрицы. Таким образом, при наличии в матрице сходства не единственного максимального значения меры сходства анализируемых классов число дендрограмм, которое может быть построено на основе такой матрицы, также не равно единице. Примером является рассмотренная ранее матрица сходства, имеющая двенадцать пар классов с равным максимальным значением. Следовательно, для такой матрицы уже на первом шаге алгоритма построения иерархической классификации возможны двенадцать вариантов ее построения. При этом на последующих шагах обработки матрицы сходства также не исключена многовариантность при выборе пары классов с максимальным значением. Альтернативная дендрограмма для рассматриваемой матрицы приведена на рис. 5.6.

 

Она построена для случая, когда из матрицы сходства первой извлекалась пара S1 и S2.

 



 

Сравнительный анализ двух дендрограмм показывает, что их структуры идентичны, однако наблюдается перегруппировка классов на всех иерархических уровнях сходства.

С учетом проведенного анализа можно рекомендовать для исследования морфологических множеств методы медианы и средней группы.


Содержание раздела