// Материалы ХV конференции по философии техники и технетике и семинара по ценологии (Москва, 19 ноября 2010 г.). Вып. 47. «Ценологические исследования». – М.: Технетика, 2011. – 400 с.

 

ИСПОЛЬЗОВАНИЕ МОДЕЛЕЙ H-i-РАСПРЕДЕЛЕНИЯ

КАК РАЗВИТИЕ ЦЕНОЛОГИЧЕСКОГО ПОДХОДА

Жилин Б. В.

 

Существование общих закономерностей в структуре больших систем различной природы сейчас уже является практически общепризнанным фактом. Эта закономерность проявляется в описании схожими распределениями структуры систем, количество элементов которых достаточно большое, и имеющих ряд особенностей, о которых речь пойдёт ниже. В общем случае речь идёт о применении для описания структуры степеннóй функции (или несколько модифицированной), которое в различных отраслях знания носит названия законов, самые известные из которых: Ципфа, Мальдельброта, Лотки, Парето и т.д. Указанные законы описывают естественные системы в том смысле, что структура таких систем либо относится к объективно существующим системам (неживая природа, сообщество живых организмов и др.), либо – если в её создании участвовал человек, то не с целью создать какую-либо структуру, т. е. система сложилась независимо, объективно (например, распределение структуры доходов населения – Парето, частота встречаемости слов в тексте – Ципф, частота обращения к сайтам Интернета и др.).

Несколько труднее идёт признание наличия аналогичных структурных закономерностей для технических систем, так как традиционный подход предполагает, что структура системы является следствием реализации тех целей, для которых она создавалась. Так как цели выбирает и реализует человек – проектировщик, инвестор, чиновник – то существует полное "здравого смысла" убеждение, что структура систем также в полной мере определяется её создателем, может быть субъективно изменена и не может иметь объективно значимых закономерностей в построении структуры различных систем, а тем более не может быть аналогична естественным системам (Почему распределение электродвигателей по маркам на промышленном предприятии должно быть аналогично частоте встречаемости главных героев в "Евгении Онегине"?! – по Кудрину Б. И.). Исследования структуры технических систем, использующие такие закономерности, получили название техноценологического подхода.

Техноценологический подход к исследованию структуры технических систем (с точки зрения традиционных статистических методов) достаточно молод. Сам термин ввёл в начале 70-х годов ХХ в. профессор Борис Иванович Кудрин [1], который указал критерии, объяснил существование общности в структуре систем законом информационного отбора, также впервые им же предложенным, и обосновал выделение среди сообществ объектов, описываемых универсальным термином "система" – то, что теперь получило практически общепризнанное название техноценоз. (Обратной стороной такого признания является появление претендентов на авторство этого термина, которые, правда, "почему-то" не имеют приоритетных публикаций). Существование закономерностей в формировании структуры систем, для которых характерны процессы, аналогичные естественному отбору в живой природе (биоценозы), в разных областях знания для естественных систем ранее обнаружил ряд учёных, часть которых указана выше. В этой связи, на мой взгляд, для описания структуры техноценозов давно пора вводить термин "закон Кудрина", так называемое Н-распределение.

Закономерным является то, что открытие общности в построении структуры технических систем обнаружилось в описании электрохозяйств промышленных предприятий. Так как даже в рамках одного предприятия (техноценоза), проектируемого и создаваемого одномоментно (в отличие, например, от энергосистем, проектируемых и развивающихся на протяжении десятков лет), количество элементов (объектов), составляющих техноценоз, достигает 105–107.

В свою очередь структура систем-ценозов может выявляться по разным параметрам, соответственно и распределения носят разные названия. Нетривиально видовое Н-распределение (зависимость числа видов от количества особей в виде), так как не каждая система-ценоз отвечает таким закономерностям. С другой стороны, для решения ряда задач нецелесообразно выделять в системе-ценозе особи и виды. Поэтому для многих практических задач актуально выявление ценологической структуры в системах, для которых возможно применение ранговидовых (ранжированных по убыванию численности особей в виде) и ранговых по параметру (ранжированных по убыванию значения параметров видов) распределений, для которых и будем вести дальнейшее изложение. Одна из возможных форм записи Н-распределения (ранговое по параметру) – показательной функции

Wr=W1/rβ ,       r=1, ..., S ,                                                         (1)

где r – целочисленное значение ранга (ранг – номер по порядку при расположении объектов в порядке уменьшения параметра), Wr – ранжированные значения непрерывного параметра (ранги расположены в порядке уменьшения значения параметра), W1, β – константы распределения, S – общее количество рангов.

Наличие ценологической структуры исследуемого объекта-системы позволяет использовать максимум имеющейся информации о системе, невостребованной другими методами. В частности, позволяет использовать существующие и разрабатывать новые практические методы, снижающие неопределённость информации, характерную, в частности, для задач проектирования и прогнозирования объектов электроэнергетики, систем электроснабжения.

Отметим, что характерное для начального описательного этапа изучения ценологических структур простое получение методом наименьших квадратов (МНК) констант степенной функции (Н-распределения) для принудительно ранжированных данных, не всегда даёт основания для вывода об объективном существовании такой структуры. С одной стороны, проф. Б. И. Кудрин и его ученики (к коим, безусловно, относят себя и авторы) проанализировали десятки тысяч эмпирических данных реальных ценозов с выявлением структуры и определением констант Н-распределения. И в абсолютном большинстве эти константы согласуются с новой предлагаемой моделью. С другой стороны, такой подход встречает определённые трудности.

Во-первых, не ясно, какой МНК использовать (линейный или не линейный), приводящий к разным значениям констант в (1), не ясно как сравнить два ценоза, например, при отличающемся количестве видов.

Во-вторых, ранжированные данные можно описывать и другими двухконстантными функциями (например, экспонентой), при этом доказать, какое описание в конкретном случае лучше – весьма затруднительно.

В-третьих, такой упрощённый подход позволяет получить константы распределения для любого набора данных, т. е. любой ранжированный набор данных более менее успешно описывается таким способом, а общее количество видов вообще никак не влияет на эти константы, соответствие реальной структуры такому описанию тривиально и практически не знает исключений. С другой стороны, по величинам констант, получаемым МНК, невозможно сделать какие-либо объективные выводы, нет обоснованных предельных значений для констант в (1). (Встречаются работы описывающие структуру ценоза с показателем 0,18, что явно мало, а структура описывается почти прямой линией с малым наклоном; и около четырёх, что нереально высокое значение). Такая "универсальность", а точнее неразборчивость, рождает справедливые возражения по новизне и нетривиальности получаемых результатов, что позволяет оппонентам подвергать сомнению весь ценологический подход в целом.

Напомним "традиционный" подход к получению констант (1): первая константа W1 принимается равной эмпирическому значению – максимальное значение, соответствующее первому рангу. Вторая константа β определяется из линейного МНК (минимизацией суммы квадратов отклонений логарифмов фактических значений от степенной функции (1)). Общее количество рангов S участвует в МНК, но практически не влияет на результат, т.е. если добавить к существующим данным любое количество рангов – увеличить S – например, со значениями, точно ложащимся на степенную функцию, то это не повлияет на константы W1 и β.

Заметим, что использование линейного МНК вызывает большие сомнения. В силу того, что для минимизации используется сумма квадратов отклонений логарифмов значений параметра, оказывается, что вклад в эту сумму последних рангов в десятки раз больше, чем вклад начальных. Вряд ли этот факт является преимуществом этого метода.

На наш взгляд, необходим переход к моделям ценологической структуры другого уровня, имеющим логические и математические основания, позволяющие обосновать применение для описания именно Н-распределения. К таким моделям относится так называемое "идеальное" Н-распределение – H-i-распределение[1]. В зависимости от используемых ограничений возможны различные способы получения его констант.

Предложенное в [2] (где она носит название "идеальной" гиперболы) H-i-распределение предполагает, что можно получить некоторую "идеальную" степенную функцию (даже не используя эмпирических данных), константы которой определяются только из ограничений, которые могут выступать в разном сочетании. В этом случае в зависимости от используемых ограничений мы имеем дело с несколькими способами получения H-i-распределения, которые жёстко связывают значения констант W1, β и S между собой. Заметим, что безусловным преимуществом модели H-i-распределения является тот факт, что если мы имеем дело с эмпирическими данными, которые очень близки к "идеальному" распределению, то любой способ получения констант модели H-i-распределения даст одинаковые значения. При этом они будут совпадать с эмпирическими константами H-распределения, полученными нелинейным МНК. Мы утверждаем, что по совпадению эмпирических констант, полученных МНК, и констант H-i-распределения, которые получены из решения системы уравнений (ограничений в виде равенств) без использования МНК, можно судить о наличии ценологической структуры. Другими словами, структура ценоза стремится к соотношению констант H-i-распределения. Соответствие структуры реальных систем такому описанию – нетривиально, так как далеко не любая ранжированная по убыванию последовательность подпадает под указанные соотношения, что является косвенным признаком сделанного выше утверждения.

Введение H-i-распределения имеет два аспекта. Первый – это преимущества, которые даёт жёсткая связка констант H-i-распределения для использования в методах прогнозирования суммарного ресурса, методах восстановления полной структуры системы-ценоза при отсутствии части информации и разработке аналогичных конструктивных методов. То есть, если мы имеем дело с системой-ценозом, эмпирические данные которой отвечают указанным соотношениям, то это позволяет по известным значениям одних констант получать "недостающую" константу, со всеми вытекающими отсюда положительными последствиями. Это положение неоднократно подтверждено в работах автора.

Однако существует и другой аспект, более значимый, приводящий к фундаментальным последствиям. Если признать факт существования H-i-распределения как предельного для структуры ценозов, то это:

•позволяет говорить об обнаружении механизма формирования ценозов;

•объяснить использование степеннóй функции (Н-распределения) для описания структуры ценозов;

•определить области применимости распределения Гаусса (нормального) и Н-распределения;

•обосновать (не на отдельных примерах, а в принципе) использование указанных соотношений для разработки практических методов.

Доказательство существования H-i-распределения как фундаментального свойства ценологических структур необходимо выполнять двумя путями: статистическим и логическим. Статистическое обоснование – это выявление реальных примеров, подтверждающих "стремление" структуры ценозов к H-i-распределению. Например, несоответствие эмпирических констант H-i-распределению уменьшается после исключению из рассматриваемой отчетности "двойного" включения объектов в форме "в том числе". Другие примеры показаны в работах автора, и в результате дальнейших исследований их список продолжает пополняться (видимо, по мере распространения описанного подхода число примеров будет возрастать).

Здесь покажем логические обоснования, имеющиеся в настоящее время, их связь с известными положениями, обнаруженными проф. Б.И. Кудриным и другими учёными, часть которых уже ранее опубликована автором.

Рассмотрим первое ограничение как в традиционном подходе – принимаем значение константы W1 равным максимальному эмпирическому (фактическому) значению (соответствующее r=1). Второе – ограничение по суммарному ресурсу:

WΣМ=WΣФ,                                                                                           (2)

где WΣМ – сумма параметров всех рангов r=1, ..., S модели; WΣФ – сумма параметров всех рангов r=1, ..., S фактическая.

Известно из аналогий с биоценозами: в техноценозах происходит борьба видов за предоставленный ресурс (точнее, проявляет себя закон информационного обора), что и является причиной Н-распределения для структуры (Кудрин Б. И.). Ограничение (2) как раз и "создаёт условия" для борьбы за этот ресурс. Например, если ресурс WΣ будет достаточно велик, то все значения параметров могут быть равны между собой или даже больше W1, и никакого Н-распределения (степеннóй функции) при этом не получится. Поэтому при заданных W1 и S только при определённых малых значениях WΣ можно получить значения β, приемлемые для степеннóй функции.

Ответить на ряд других фундаментальных вопросов позволяет использование указанных ограничений и введение в качестве целевой функции – максимизация статистической энтропии:

H(W1, W2, ..., WS)=Σ(W /WΣ) ln(Wr/WΣ) → max.                                         (3)

Понятие статистической энтропии (энтропия по Шеннону) определено для вероятностей в (3), и поэтому логично для использования с ранговидовым распределением (зависимость ранжированной численности особей по видам-рангам), т. е. там, где значением параметра в (1), (3) является численность, а в относительных единицах – относительная частота или вероятность. Переход к значению непрерывного параметра, хотя не строгий, но на части примеров имеет логическое объяснение (например, от количества установленных электроприёмников можно перейти к значению мощности и электроэнергии, потребляемых ими).

Использование статистической энтропии в качестве целевой функции, с одной стороны, можно рассматривать как развитие гипотезы об универсальности первого (в наших обозначениях – это (2)) и второго (3) начал термодинамики и распространения их на системы, не связанные с термодинамическими процессами.

С другой стороны, именно этот подход позволяет подтвердить обоснованность (см. ниже) использования Н-распределения (степеннóй функции), адекватность которого доказана на многочисленных примерах.

Надо заметить, что использование указанной целевой функции производится не впервые, такие попытки предпринимались неоднократно. Однако, решение задачи оптимизации с целевой функцией (3) и ограничением (2) приводит к экспоненциальному распределению. Впервые предлагается именно такая постановка задачи, которая позволяет логически связать многократно доказанное на эмпирических данных Н-распределение (степенную функцию) с моделью H-i-распределения.

Следует иметь в виду, что максимизация энтропии структуры системы без ограничений приведёт к случаю, когда значения параметров (или численности особей) всех видов будут равны друг другу, а в сумме давать суммарный ресурс, предоставленный системе, что не соответствует реальным системам. Поэтому константы в модели H-i-распределения определяются через два ограничения: например, по суммарному ресурсу и фиксацией структуры ценоза, например, "закреплением" первой точки. Это ограничение предопределяет существующую структуру ценоза, "закрепляя" степеннỳю функцию в одной из точек (или группе точек для уменьшения влияния случайных факторов). Такое положение приводит к выводу, что структура ценозов не получается одномоментно. Но к существующему ценозу, с фиксированными на какой-то момент времени значениями параметров, происходит добавление/вычитание особей, видов, ресурсов, что и приводит к структуре, адекватно описываемой степенным распределением. Таким образом, напрашивается вывод, что ценоз – это динамическая структура, которая не может существовать в фиксированном состоянии, а только при изменении внешних воздействий на ценоз, сохраняя такую структуру H-i-распределения (может быть и со значительным изменением констант). Другими словами, степеннáя функция, описывающая структуру системы, характерная для ценоза, складывается там, где присутствуют явления самоорганизации, позволяющие существовать ценозу под воздействием внешних возмущений, которые проявляются в изменении ограничений внешних ресурсов.

Из анализа H-i-распределения следует ряд выводов, часть из которых ранее декларировалась, а при использовании этой модели они получены в результате расчётов.

Например, пока остаётся открытым вопрос: почему мы используем именно степенную функцию (1)? Выбрав другой вид зависимости, можно аналогичным образом из решения системы уравнений получить константы и для неё. Заметим, что при использовании МНК вообще невозможно обосновать использование степеннóй функции (а некоторые эмпирические данные описываются экспонентой или другими убывающими функциями с меньшим среднеквадратичным отклонением). Подтвердим правомерность использования для моделирования разнообразия ценозов именно Н-распределения (степеннóй функции). С этой целью были получены выражения для определения констант из условия соблюдения ограничений для функций другого вида (для единообразия обозначения констант оставлено как в (1)): одно ограничение получено из условия, что каждая из кривых проходит через точку с максимальным значением параметра (соответствует рангу r=1), другая константа получена из условия соблюдения ограничения по суммарному ресурсу (2). Используя константы, рассчитывали значения параметров всех рангов Wr в системе-ценозе. Затем рассчитывали значение статистической энтропии по (3), получаемое при моделировании структуры системы-ценоза различными функциями. Были проанализированы "подходящие" для описания убывающей функции двухконстантные (кроме закона Юла) кривые: степеннáя (Н-распределение) – Wr=W1rβ, экспонента – Wr=W1exp(βr), показательная – Wr=W1βr, "гиперболическая" – Wr=W1/r, логарифмическая – Wr=W1+βln(r), закон Мандельброта – Wr=W1/(β+r), закон Юла – Wr=W1rβсr, где r=1, ..., S; а W1, β и с – константы, определяемые из ограничений.

Рассматривали практически весь возможный диапазон значений W1 (от 0,1 до 0,9) и весьма широкий диапазон для S (от 20 до 1000). Расчёты показали: "гиперболическая" и логарифмическая функции имеют очень ограниченную область существования (близкую к меньшим значениям, указанного диапазона), соответствующую выполнению обоих ограничений; учёт ограничений приводит к единой кривой для показательной и экспоненциальной функций (но с отличающимися константами). Во всём возможном диапазоне изменения перечисленных ранее параметров Н-распределению соответствует большее значение энтропии. Отметим, что закон Мандельброта имеет близкие значения энтропии, а в некотором ограниченном диапазоне даже чуть выше, чем у Н-распределения. Учитывая ограниченность этого диапазона и малое отличие значений энтропии, можно утверждать, что именно Н-распределение соответствует максимизации (3). То есть разнообразие структуры ценоза стремится к Н-распределению в соответствии с максимизацией энтропии в условиях ограниченного ресурса. Другими словами, максимизация целевой функции (3) требует использования именно степеннóй функции, т. е. Н-распределения, а две константы этой функции определяются из двух (возможны различные сочетания) ограничений (H-i-распределение), что позволяет разрабатывать различные методы, реализующие техноценологический подход.

Как указывалось, модель H-i-распределения накладывает строгие ограничения на соотношение констант разнообразия: значение параметра первого ранга (или группы начальных рангов), величины показателя степени, общего количества видов. Получить такие зависимости можно только численно [3], а здесь покажем аппроксимирующую зависимость результатов таких расчётов для показателя степени H-i-распределения в обозначениях (1):

 

β=0,153+0,405·10W1+0,092lgS         ,                                                (4)

 

где W1 – константа распределения, соответствующая значению параметра первого ранга, S – общее количество видов. В диапазоне W1=0,1…0,9, S=20…1000 погрешность аппроксимирующего выражения (4) в определении β не превышает 10 %.

Исследуя структуры реальных систем и используя нелинейный МНК, можно оценить соответствие получаемых эмпирических констант и констант H-i-распределения по (4). Мы утверждаем, что если между константами (1), полученными обработкой эмпирических данных, соблюдается соотношение (4), то это система ценологического типа. Если отклонения констант от соотношения (4) велики – это не ценоз. (Уважаемые коллеги могут проверить по (4) исследуемые объекты, я уверен, что в большинстве случаев будет обнаружено такое соответствие, так как для рассмотрения выбираются ценозы, соответствующие неформализованным, но "работающим" признакам). Иными словами, данное положение является необходимым условием наличия ценоза. Достаточное условие, скорее всего, не удастся формализовать, это будет набор свойств, черт, в том числе и перечисленных ниже.

Использование H-i-распределения позволяет формально оценить области применения Н-распределения и гауссова (нормального) распределения. С этой целью при разных комбинациях констант H-i-распределения осуществлялась проверка на соответствие распределению Гаусса. Было установлено, что на результаты проверки слабо влияет общее количество рангов S, а решающее влияние оказывает величина показателя степени β (при заданных S и β значение W1 определяется однозначно). При β<0,5...0,6 (что зависит от S и от уровня значимости критерия согласия) для описания значений рангов H-i-распределения может быть использовано гауссово (нормальное) распределение. При увеличении β свыше 0,5–0,6 гауссово распределение для описания значений H-i-распределения – не адекватно.

Применение указанного выше подхода, использование понятия H-i-распределения позволяют ответить на ряд вопросов, сформулированных на описательном этапе изучения ценозов. Решается проблема сравнения двух ценозов (если её понимать как ответ на вопрос: "Какой ценоз лучше, ближе к оптимальному?"). Такой вопрос вполне правомерен при анализе нескольких вариантов структуры создаваемого техноценоза, например, промышленного предприятия. Ответ, вытекающий из изложенного выше материала, такой: "Лучше тот ценоз, структура которого ближе к H-i-распределению. Причём, может оказаться, что два ценоза, имеющих разную структуру, содержащих разное количество видов, в одинаковой мере соответствуют H-i-распределению. И это не является недостатком предложенной модели; скорее наоборот – больше отвечает здравому смыслу: оптимальное решение, как правило, в задачах многофакторной, многоцелевой оптимизации с ограничениями (какой является задача создания крупного промышленного предприятия) не является единственным. Верно и обратное утверждение: если соотношение параметров Н-распределения, полученных по эмпирическим данным, не соответствует H-i-распределению (4), то эта система либо не ценоз, либо этот ценоз ждут большие "потрясения", направленные на восстановление структуры.

 

Выводы

1. Необходим переход к моделям идеального H-распределения (H-i-распределения), так как они позволяют: однозначно трактовать и сравнивать результаты, полученные разными авторами; накладывают однозначное ограничение на константы распределения, что позволяет значительно расширить область применения ценологического подхода.

2. Модели H-i-распределения имеют несколько вариантов реализации, но стремятся к единственному варианту структуры для названных условий, имеют хорошее логическое обоснование, нетривиальны, т. е. неадекватны для произвольной ранжированной последовательности параметров.

3. Признание наличия H-i-распределения позволяет формализовать процедуру выявления ценологической структуры, многие свойства ценозов, декларируемые ранее, а также прогнозировать их поведение и восстанавливать структуру при нехватке информации.

 

Литература

1.      Кудрин Б. И. Исследования технических систем как сообществ изделий – техноценозов. Системные исследования. Методологические проблемы. Ежегодник 1980. М.: Наука, 1981. С. 236–254.

2.      Жилин Б. В. Модели формирования структуры ценозов. Вып. 1. "Ценологические исследования". Математическое описание ценозов и закономерности технетики. Материалы Первой Междунар. конф., Новомосковск 24–26 января 1996 г. М. Центр системных исследований, 1996. С. 142–156.

3.      Жилин Б. В. Проблемы расчёта электрических нагрузок (по матер. дискус. по комплексному методу Б. И. Кудрина). Тула: Приок. кн. изд-во, 1996. 129 с.

 



[1] От ред. Обычно Н (аш) записывается обычным шрифтом. В данном случае автор использует полужирный шрифт, вводя новый индекс.