//Общая и прикладная ценология. – 2007. – № 4.– С. 25-33.
мои семь отличий от ципфа
Сформулированы
свойства ценоза и предложены две Н-модели для
дискретных и одна – для непрерывных величин, имеющих в основе пойнтер-точку R и факториал,
где вид – простое число.
My seven differences from Zipf theory
Here are formulated the
properties of cenoses and H-models are offered: two –
for discrete and one – for undiscrete quantities
having in their base an indicator-point R and a factorial,
where species is a simple number.
Введение Мёбиусом (1877) термина биоценоз дало наполнение термина экология Геккеля (1866), а термины экосистема Тенсли
(1931) и биогеоценоз Сукачёва (1940)
привели к сегодняшней экологии в её классической форме, например, по Одуму (породив десятки различных экологий). Это направление ценологии замкнулось на
самоё себя, не были увидены общность с работами Парето, Ципфа, Брэдфорда, Мандельброта; фундаментальность теоремы Гнеденко–Дёблина (см. также опубликованные нами статьи Трубникова; Арапова, Ефимовой, Шрейдера; Хайтуна); практическая
важность того, что для устойчивых
распределений неустойчивых частот почти все устойчивые плотности не
выразимы в элементарных функциях (через обычные формулы). Но все
устойчивые плотности (кроме гауссовой) убывают при больших значениях аргумента приблизительно как гиперболы, что и
составляет формальное представление ценологического подхода.
Одна из основных целей журнала –
конвенционное введение единой терминологии, приемлемой для решения
теоретических и прикладных задач ценологии. В связи с
этим рассмотрим обобщённую математическую постановку сегодняшнего времени (но в
наших обозначениях), называемую (в том числе и в Интернете) первым и вторым
законами Ципфа.
Первый закон Ципфа утверждает, что
произведение вероятности λ(r) обнаружения особи ui в тексте длиной Т (словарь которого объёмом V), и ранга частоты r даёт
константу b. Ципф каждую особь относил к
какому-либо виду, объединяя особи одного вида в группы
(популяции). Наибольшей по численности популяции присваивается первый ранг r1=1, вероятность которой λ(1),
и далее по убывающей Λ(r) выстраивают все популяции, число
которых оказывается равным числу видов S: в первом
"ранго-вероятностном" законе Ципфа речь
идёт о вероятности:
, (z1)
а сам закон (β=1):
b=rλ(r). (z2)
Функция (z2) – равносторонняя гипербола,
значение параметров которой различно при исследовании Ципфом различных языков;
выражение (z1) нами названо ранговидовым гиперболическим Н-распределением.
Если Т – длина текста Т; V – объём
словаря; β – характеристический коэффициент, то
второй закон Ципфа "количество–частота":
Т=βVlnV (z3)
объединяет популяции одной численности i (виды, представленные одинаковым
количеством особей) в группу kÎK, называемую кастой, и утверждает, что между
значениями i=1, 2, … и частотой (вероятностью
появления группы – касты) есть зависимость, отражаемая кривой
(гиперболической), параметры которой сохраняются для всех без исключения
текстов, созданных человеком. Но кроме дискретности слов языка есть непрерывные
величины. Объекты, характеризующиеся одной из таких величиной, могут быть проранжированы. Это приводит к Н-распределению по параметру. Второй закон Ципфа, в нашей
терминологии, есть видовое
гиперболическое Н-распределение.
Обобщая, сведём все
три варианта технического применения математического аппарата Н-распределений в таблицу и будем
пользоваться приведёнными обозначениями в дальнейшем.
Математическое представление
аппарата Н-распределения
Распределение |
Ось
абсцисс |
Ось
ординат |
Форма
записи |
Видовое |
Число особей в виде
(численность популяции) |
Количество видов с
одинаковым количеством особей |
|
Ранговидовое |
Ранг |
Количество особей в
виде |
|
Ранговое по параметру |
Значение параметра |
W(r)=W1/rβ |
Итак, показав подход,
связанный с ципфовскими распределениями, предложим
обнаруженные отличия, опирающиеся на специфическую статистику, позволяющую
увидеть различные стороны Н-распределения,
открыв возможность нового взгляда на лингвистические,
биологические и др. ценозы.
Объективация субъект-объектного отношения в рациональной форме понятий, суждений, умозаключений предполагает возможность объективации индивидуальных знаний, их обобщение и трансляцию для психологической уверенности субъекта в осуществлении наиболее эффективной практической деятельности. Однако, существенные различия сознательно-исторических, практических и психологических интересов субъекта оставляют открытой возможность даже в отношении понятий: ценоз (cénose, фр; cenosis, англ.), ценологические исследования, ценологический анализ, ценологическое мировоззрение.
Поэтому, не определяя вначале ценоз как онтологический объект и объект гносеологии, используем познавательно-творческие способности индивида для интуитивного единовременного, одномоментного, однозначного триединого выделения: собственно ценоза; одного из вещественных или виртуальных (информационных) семейств, сущностно образующих структуру этого ценоза; именованной или неименованной единицы-элемента для различия или тождественности между собой этих элементарных штук, особей, образцов, словоформ.
Исследование ценоза как целостности предполагает его системное описание словесно
и иерархической практически разумной системой показателей (что обязательно для выделения
ценоза как такового), а затем выполнение структурного
ценологического анализа, полагая что ценологические
представления есть новая ступень познания, гносеологически опирающаяся на
третью научную картину мира. Необходимость формализованного описания ценоза (и реализации модели, как это сделано для
технической реальности) есть первое
отличие моего подхода. Это должно быть сделано до идентификации элементов-особей.
Идентификация же предполагает возможность классифицировать
особи: 1) по видовым признакам (как у Линнея), дискретизируя
тем самым элементы-особи, или 2) по параметру, непрерывным рядом на отрезке,
характеризующим все особи (отметим факт: рост людей, расход горючего на
Говоря о показателях, выделяющих ценоз (вне зависимости от их вербального или формализованного представления), следует иметь в виду мною сформулированное: 1) ценоз не может быть адекватно описан системой показателей, любая система – не чёткая и не полная, увеличение количества показателей и кажущееся повышение точности (достоверности) каждого не приближает или мало приближает к самомý акту выделения ценоза; 2) два ценоза, описанных одной системой показателей, совпадающих в пределах точности, принятой для данного класса измерений, могут различаться по существу (другими характеристиками, параметрами, представлениями) сколь угодно сильно; 3) ценологическое время – время феноменологическое; оно необратимо; ценоз, даже описываемый не изменившимися качественно и количественно показателями, через время Δt уже иной; но это время t<Δt не измеряется малыми промежутками (для одного ценоза – секундами, для другого – годами), а сравнимо по порядку со временем жизни особей тех видов, что группируются вокруг пойнтер-точки R (о ней – далее); 4) ценологическая фрактальность проявляется вложенностью ценозов такой, что она иерархически ограничена 5–7 уровнями (в отличие от бесконечности Мандельброта, представленной, например, кривой Коха); 5) ценологическое пространство неоднородно, нужномерно, в отличие от конечного евклидова или неевклидовых геометрий.
Для случая, когда особь выделяема и различаема по видовой принадлежности, основой ценологической методологии исследования являются математические модели структуры, опирающиеся на гиперболические H-распределения в видовой и ранговидовой формах. В этом случае структурное описание основано на понятии эквивалентности: ценоз образован элементами-особями, каждые два из которых неотличимы, но могут быть идентифицированы поштучно, т. е. иметь номер-паспорт, оставаясь одного вида или различимы (разных видов):
uisj≡uksj; i≠k, sj≠sm, (1)
т. е. каждый
элемент-особь помечается парой чисел: номером, присваиваемым особи ui=1, 2, …, U, где U – число особей одного семейства, образующих текст длиной Т, и номером вида sj=1,
2, ..., S, где S – число видов, образующих словарь объёмом V.
Особи одного вида неразличимы и образуют популяцию. Виды,
каждый из которых представлен равным количеством особей, образуют касты kk=1, 2, …, K, т. е. каждая из каст есть множество, образованное популяциями
одинаковой численности. Распределение видов (видовое
гиперболическое Н-распределение:
термин Фишера, подход C.
B. Williams) – это распределение популяций одинаковой численности по кастам.
Каузальность и однозначность физических
Ньютона–Максвелла законов мировоззренчески предполагали существование "оптимального
объёма" и самогó "закона"
Ципфа. Предполагалась возможность отыскания некоторого "идеального"
видового распределения, которое и есть Н-распределение,
имеющее идеальные Н-параметры, в том
числе идеальное значение характеристического показателя α,
идеальное значение касты ноевой (первой точки – начала
гиперболы) и саранчёвой (её последних точек). Как-то
игнорировалось множество физических, биологических, технических и иных
наблюдений. Williams,
упоминая тропики, писал о сравнительно малом видовом разнообразии москитов в
тундре (при неуступающем количестве гнуса, мошки), о
сезонном изменении соотношения "вид–численность" популяции в Англии.
Да и сам я наблюдал сплошняк Chamaenerium angustifolium
(L.) Scop. в тайге на месте пожарища, Urtica dioica (L.) – в уничтоженных деревнях,
Rheum palmatum (L.) – ковёр на границе таяния вечного снега – лакомства
медведя (конечно, ревень оказался другого вида: var. altaicum (Losinsk.). Другими словами, нет a priori параметров, которые можно назвать оптимальными (идеальными).
Пусть i=1,
2, 3, ... – возможная численность популяции; ai
– реализованная численность популяции (i
– ряд, соответствующий натуральному ряду чисел; ai
– эмпирически найденные значения). Видовое распределение может быть получено из
текста Т непосредственно, если выбрать вначале
все виды, встретившиеся по одному разу, т. е. популяции, состоящие из одной
особи ai=1; они образуют тем самым первую (ноеву) касту k=1, общее число видов s
в которой w1, эмпирическая численность особей в касте a1w1.
Затем – все виды, представленные двумя особями, тремя и т. д. (если все знáчимые строки нумеровать по порядку, то в этом
случае число строк равно числу каст К, где К есть наличествующие популяции).
Последовательность wi назовём
эмпирическим видовым распределением (распределением видов). Будем упрощённо
считать однозначными обозначения Ω(wi)=Ω(i)=Ω(х):
Ω(х)=, (2)
где x[1,∞) – непрерывный аналог мощности (численности) популяций i (i – всегда
дискретная величина, i=[x]);
α>0 – характеристический показатель; постоянная
распределения – γ=1+α;
W0=AS, W1=[W0],
где W0 – теоретическое, не обязательно дискретное значение, и
W1 – фактическое (экспериментальное) значение первой точки; А
– постоянная распределения, которую находят из условий нормировки (хотя это теоретически
и ошибочно из-за отсутствия математического ожидания и бесконечности дисперсии).
Обозначим
через N0 самую мощную (саранчёвую)
популяцию (касту), т. е. численность вида, представленного наибольшим количеством
особей. Тогда численность популяций в ценозе может
иметь значения i=1, 2, …, N0, фактически принимая лишь
значения аi.
Запишем очевидные соотношения для объёма словаря – перечня (списка) всех
встретившихся видов выделенного семейства в исследуемом
ценозе:
V=|S|==, (3)
длины текста – списка
всех и каждого "отловленного", охватывающего общее количество
встретившихся (идентифицируемых) штук-особей:
T=|U|=Σui= (4)
и относительной частоты
появления касты, определяемой эмпирически ωi=wi/V и описываемой непрерывной
кривой
ωi=A/xα, (5)
где 1>A>0; α>0 – константы, соответствующие (2).
Заметим, что
ωi=wi/Σwi=wi/S=A/xα и ωiS=Ω(х)=Ω(wi). Тогда
Ω(х)==, (6)
что и приводит к (2).
Видовые
распределения отличаются характером изменения wi. Устойчивую зависимость показывают: "гипербола" Ω(х); S(U) – относительно более
медленное увеличение количества видов при увеличении выборки штук-особей (характер
кривой объясняет уменьшение А в выражениях (2)
и (5) и увеличение повторяемости d=U/S);
W1(S) – ноева
каста (при увеличении выборки эта величина медленно уменьшается, как того требует
теорема Гнеденко–Дёблина). Выражения (2), (5) и
статистика моей научной школы – позволяют сформулировать второе отличие от законов Ципфа: частотным представлением (5) пользоваться не следует.
Преобразование (6) показывает потерю информации при переходе от (2) к (5).
Теоретически это означает утрату представлений о "размере" ценоза:
исчезают сведения о суммарном U – количестве особей (длине
текста Т=Σui) и объёме словаря (количестве видов в
выборке V=Σsi). Второе утверждение
подтверждают свыше 1000 выборок и генеральных совокупностей различных технических
изделий большинства отраслей экономики, охватывающих более 2,5 млн единиц-особей. Значения W0 первой точки (ноева каста) в относительных единицах лежит в интервале от 0,7–0,9
до 0,2–0,3. Сравнение близких частот – вероятности ω1 (для
практических целей – равных) одного завода, но с разницей в 25 лет, или разных
отраслей – не сопоставимы по абсолютным U и S.
Ценозы, равные по количеству особей, совершенно не
сопоставимы по ω1 и повторяемости d. Общая тенденция –
снижение численности первой касты с увеличением объёма выборки прослеживается,
но возможно и обратное.
Следовательно,
ошибочно предположение о существовании априори определяемых параметров закона
видового распределения Ω(х), которые
задают некоторую величину, определяемую S, U. Ошибочно считать, что при заданных S, U ряд единственный (оптимальный по "объёму Ципфа"). Физика ценозов показывает, что из одного объёма словаря можно
получить множество значений U (множество текстов): для известного числа
установленных видов единиц-особей изделий количество штук-особей может быть
различно.
Предпочтение,
отданное видовому распределению (2), объясняется неочевидностью того, что ноева каста (группа видов, каждый из которых представлен
строго одной особью) должна быть наиболее многочисленной. Здесь мы не делаем
насилия над фактическими данными, выделяя уникальные единичные виды, затем – встреченные дважды и т. д. Нет никаких оснований до
опыта утверждать, что при этом должна образоваться гипербола.
Теперь, охватив все виды S словаря
V, проранжируем данные текста T, расположив все виды принудительно в порядке уменьшения
численности каждого вида (численности популяций), естественно получим спадающую
кривую, называемую гиперболическим ранговидовым H-распределением.
Третье выделяемое мною отличие от ципфовских
представлений – в приоритетной естественности для дискретных величин видового
распределения перед ранговидовым. И если мы ставим
задачу выявить фундаментальные причины подчинённости физико-химических,
биологических, технических (технетических),
информационных, социальных ценозов гиперболическим Н-ограничениям, то должны связать идеи глобального эволюционизма с
негауссовой статистикой, с вúдением мира, где
отсутствует математическое ожидание (среднее), а дисперсия бесконечна (сколь
угодно большая ошибка при определении в точке).
Вторая форма H-распределения: ранговидовое
распределение Λ(r).
Оно по определению получается из видового (ранговое распределение "свёртывается"
в видовое, образуя обычно более короткую запись, и обратно): ur – количество особей вида sr (численность популяции sr вида), соответствует
рангу r при
общем числе особей U (длина текста Т=|U|). Ранг вида s=1, 2, ..., sr,
..., S – это его порядковый номер
(номер строки). Последний номер S
определяет объём словаря V, можно
записать V=|S|. Функция ur=Λ(r) записывается в виде:
Λ(r)=B/rβ; ω(r)=ur/U;
U=ur, (7)
где В – абсолютная величина и
характеристический показатель β>0 – константы ранговидового гиперболического Н-распределения (в наших исследованиях 0,5>β>1,5).
В процессе
познания человек достаточно уверенно стал различать дискретное и непрерывное.
Оказалось, что для одних целей Н-анализа
необходимо учитывать дискретность (отличать особь от особи); для других
существует непрерывный ряд такой, что понятие "вид" смазывается, и
следует вводить балльную или ранговую оценку (или, например, децильную Парето). Такими непрерывными величинами,
исследуемыми Н-распределением по
параметру, могут быть активы банков, творческие способности, расходы
энергоресурсов, численность работающих (проживающих). Тогда, в порядке убывания
какого-либо параметра располагают (ранжируют), например, цехи, заводы, отрасли;
города, регионы, стрáны
(в обычно применяемой нами записи):
W(r)=W1/rβ. (8)
где r=1,
2, … – ранг; для r=1 первая точка W1 – объект (особь) с
наибольшим значением параметра.
Таким
образом, я говорю о трёх формах Н-распределения:
(2) и (7) применимы при исследовании ценозов, образованных дискретными величинами;
(8) – для непрерывных величин. Для всех ценозов существуют только видовое, ранговидовое и ранговое
по параметру Н-распределения. Промежуточная
форма (5), собственно и связываемая с Ципфом, несмотря на соответствие её эмпирическим
данным, вызывает трудности применения: 1) параметры А,
α зависимы и не обнаруживают сходимости при
увеличении выборки, причём, для α существуют
ограничения 0<α<2 (постоянная А
снижается, но не линейно); 2) отсутствие математического ожидания и
бесконечность дисперсии не дают возможности сравнить два ценоза.
Зависимость S(ui) обладает общей закономерностью: словарь
пополняется медленнее, чем растёт текст (появление каждого нового вида всё
менее вероятно). Следовательно, увеличение объёма выборки из одной генеральной
совокупности не приближает к некоторой "стандартной", "идеальной" кривой Н-распределения. Относительная
частота ω, оперируя рядом, каждый член которого делится на S, теряет часть информации
и делает применение (5) малопригодным для практики.
Дискретные
значения Ω(wi) видового распределения
и их непрерывный аналог Ω(х) хорошо аппроксимируются (2) на отрезке [1,R1], где i=1, 2, …, R1 – целочисленные
значения х, i=[x], R1=[R].
Это позволило мне ввести важное понятие: особую точку, точку перегиба,
пойнтер-точку R. Можно рассматривать касты как характеристику ценоза
и говорить об однородности. Всегда Ω(x)>1
или Ω(х)<1; и лишь в точке R строго Ω(x)≡1.
Гипербола делится точкой R на две ветви: слева i=1,
2, ..., R – неоднородные касты, где каждая образована множеством видов;
справа i=R+1, R+2, ..., K – однородные касты. В
каждой – теоретичеcки рoвно один вид (i
соответствует числу особей этого вида), N0 – численность последней
(саранчёвой). Kоличество
каст статистически связано с пойнтер-точкой.
Введение пойнтер-точки R даёт возможность предложить
следующую мо-дель: назовём этажом часть ценоза, занимаемого кастой.
Пронумеруем этажи. Площадь этажа с любым номером равнa R2. Число этажей в предполагаемой
к рассмотрению системе равняется 2R. Объём системы V=2R3.
Cистема распределяет объём
равномерно по всем этажам. Каждая каста заселяет один этаж. Характеристика
рассеяния объёма системы по этажам при этом максимальна. Виды, группирующиеся
вокруг i=R, есть виды-определители.
Отметим, что наличие точки, имеющей особый характер, математически
несомненно.
Если взять
∫хdx от бесконечности и
уменьшать х, то в какой-то точке х=аi,
обозначенной j=1, интеграл станет равным единице:
появился вид. Целочисленное значение [x] будет означать
количество особей в образовавшейся касте. Аналогично образуются другие однородные
касты в интервале j=1, 2, …, R2, где j
– номер однородной касты. Для обработки эмпирических распределений и вычисления
W0, α в выражении (2)
использовали метод наименьших квадратов и метод минимального различия между
расчётными U, S, K=R1+R2 и наблюдаемыми значениями
этих величин.
Достаточно
полно гиперболическое Н-распределение
описывается обобщающими показателями V=|S|,
T=|U|, K, W1, N0, что позволяет
сформулировать четвёртое отличие от
частотных законов Ципфа: сравнение ценозов более информативно (продуктивно) по
обобщающим показателям, чем по характеристическим α (или β)
и первой точке (или W1).
Для
частотной формы Ципфа параметры А, α могут совпадать, но, если S, U, W1, N0 (абсолютные значения)
различаются значительно, значит, и структура этих ценозов различна. Построчное
деление на V=Σwi для видового или на Т=Σur для ранговидового уничтожает
характеристику "размер" ценоза, отражённую
в оценках Шеннона, Симпсона, Маргалефа, Менхиника.
Рассматривая
повторяемость d=U/S
с точки зрения теории и практики, встречаемся с противоположными позициями: с
общесистемных – устойчивость и эффективность ценоза
тем выше, чем бóльшим разнообразием элементов ценоз
характеризуется; с точки зрения унификации – всё сделать одинаковым. Заметим,
что для творчества – чем меньше унификации, ординарности, тем лучше. Александр
Сергеевич, и не подозревавший, что он реализует видовое H-распределение, для
20732 особей-слов "Евгения Онегина" (статобработка
моя), использовал словарь объёмом 4596 видов-слов. В то время как Гипромез (и я, как его работник) установил в Караганде
24721 электродвигатель (текст) лишь 1968 видов (объём словаря). Не гениально, конечно.
Введение понятия пойнтер-точки для
видового Н-распределения (для рангового
по параметру это сделал Фуфаев В. В.) позволяет
сформулировать пятое существенное
отличие: структура ценозов не описывается единой гиперболой. Самоорганизуется
точка перегиба R
такая, что гипербола дискретно-непрерывно существует до этой точки, вырождаясь
в ней Ω(R)≡1
в прямую так, что далее все виды единичны WR,…,WK, где WR – значение численности популяции в пойнтер-точке; WK – численность наибольшей популяции (саранчёвый вид: WK=N0). Существует теоретический запрет на возможность совпадения после
R
численности популяций двух видов. Пятое отличие
кратко: структура ценозов описывается числом каст К
и пойнтер-точкой R.
Наличие области, тяготеющей к R
, пояснялась мною С. В. Мейену на примере
таёжного распадка, где сравнение фитоценоза по часто встречающимся видам
деревьев и травянистых растений не может быть проведено (они есть и на
северной, и на южной стороне распадка). Нельзя сравнить и по
уникальным видам (они не пересекаются). Конструктивность идеи была подтверждена
Е. Кудриной при обработке "Мастера и Маргариты" как неформализуемой модели
видового распределения персонажей (V=401; T=2089), где к пойнтер-точке R=34 примыкают: Левий Матвей – встретившийся на 24
страницах; Гелла – 28; Н. И. Босой – 29; Варенуха – 34; Римский – 41; Стёпа Лиходеев
– 42; Га-Ноцри – 50. Именно эти персонажи и отражают булгаковскую специфику и отличие от "Фауста" Гёте.
Здесь
мой результат пересекается с использованием закона Ципфа для извлечения из
текста слов, отражающих смысл (ключевых слов). Но теоретическое обоснование
различно: у меня не средняя часть гиперболы (как у Ципфа), а точка перегиба R, сдвинутая, кстати, относительно "середины".
Все
рассматриваемые модели – модели статические. Фуфаев обобщил статику Н-распределений
и предложил структурно-топологическую динамику Н-распределения, позволяющую следить за поведением каждого вида во
времени и оценить видовую надёжность по относительному движению точки по кривой
Н-распределения.
Управление
структурой предполагает возможность сравнения двух ценозов, включая сравнение
ценозов различной природы. Здесь вновь передо мной встал вопрос об идеальной форме
кривой законов Парето, Лотки, Бредфорда, Ципфа, Мандельброта; о построениях Арапова, Шрейдера, Крылова,
Орлова, Чайковского, Хайтуна. Необходимость в
эталонном распределении привела мена в
Примем
в качестве канонического дискретное распределение простых сомножителей в
факториале некоторого числа N. Назовём
видом любое простое число qr, где r – номер простого числа натурального ряда чисел, абстрактно воспринимаемое, из ряда: 2, 3, 5, 7, ..., 137,
139, 149, 151, ..., 509, 521, 523, 541, ...(2756839–1), ..., а
особью – появление этого простого числа как сомножителя (единица исключается) в
любом из чисел натурального ряда. Тогда каждое натуральное число Ni>1 представимо следующим образом:
Ni=q, q,
…, q, mj≥0, (j=0, 1, 2, …, m) (9)
где m
– степень (встречаемость) простого числа; r –
ранг простого числа. Например, Ni=101!
двойка (саранчёвый вид) q1=1
встретилась (как особь) m1=97 раз, тройка – 48 раз (q2=3,
m2=48) и т. д., 11 простых чисел встретилось 1 раз (ноева каста). Последний номер r (для Ni=101! r=26)
определяет число видов в системе S. Cумма чисел 97+48+24+…+1+1+1 (сумма особей всех
видов) определяет число особей ценоза. Оценка
численности первой касты производится с использованием теоремы о простых числах
W1=N/2lnN (с простыми числами много работал
Эйлер, который близко подошёл к моей модели, но не описал её). Остальные числа
ряда также получаются аналитически, но проще и точнее (из-за дискретности
величин) получать их прямым счётом.
Нумерация каст в видовом распределении
имеет физический смысл: это своеобразное ранжирование (по порядку без прóпусков) экспериментально
полученных результатов наблюдений, т. е. классификация, в данном случае, естественная.
Ошибки для редких видов (экспериментальные) перемещают вид из касты в соседнюю
(также популяционно малочисленную); ошибки в определении числа особей для
многочисленных видов, как правило, даже не меняют номера касты. Это даёт однозначное
распределение каст, канонизированное в виде ряда простых чисел, т. е. при заданном S все остальные параметры получаются по
(9) однозначно (например, N0 – число двоек в факториале 1023!, равное 1013).
Модель простых чисел даёт шестое отличие: для заданного количества
видов существует единственный ряд, однозначно определяющий гиперболическое Н-распределение и его параметры. Могут
быть предложены теорема, подобная теореме Вейерштрасса, и алгоритмическая
процедура определения ряда, по Калашникову–Фуфаеву. При
разложении каждого числа Ni
натурального ряда на простые
сомножители существует алгоритм преобразования факториала Ns,
где S – номер наибольшего простого числа в факториале такой, что начиная с некоторого произвольного числа исключением
некоторых видов можно получить ряд, идентичный гиперболическим Н-рядам с поправкой, связанной с изменением
числа сомножителей, равных их числу между Ns-1 и Ns+1.
Модели простых чисел
позволяют сформулировать седьмое
отличие, замеченное впервые мною (на что обратил внимание Ю. В. Чайковский,
придав этому большое значение): на видовой кривой Н-распределения, до точки R непрерывной,
имеются всплески и провалы, которые обязательны; на ранговой – расстояние между
саранчёвыми видами неравномерно, а численности популяций
растут нелинейно.
Замечу, что первая в H-распределении по
параметру точка – элемент (особь) – может быть не из этого, а из другого ценоза (поэтому не следует "подгонять"
кривую). Что касается саранчёвых каст, то они,
безусловно, всегда из этого же ценоза, но обладают
свойством массово возникать. Факториал 1023! Но дальше 1024! – видов не
прибавилось, а всплеск налицо, который не надо подгонять под гиперболу. Экспериментально
обнаружена теоретически не доказанная возможность заполнения промежутков в
дискретно-непрерывной части гиперболы до точки R кастами после
этой точки: возможна плотная упаковка, что, собственно, и есть теорема. Обратим
внимание ещё на возможность свёртки в ограниченное количество шагов.
Рассматривая общность законов Ципфа и
исследуя разнообразие и соотношение "крупное–мелкое",
как правило, нечётко формулируется возможность переноса результатов из одной
области знаний в другую. Изучение технических ценозов имеет преимущество в
строгости перед биоценозами и в динамике перед математической лингвистикой
(вообще перед областью информационных и социальных исследований). Во-первых,
относительно устоявшиеся представления о системе показателей и структуре цеха,
производства, завода, отрасли; города, региона, государства. Во-вторых,
бухгалтерскую, в идеале, статистику. В-третьих, возможность отследить эволюцию
вида, опускаясь до отдельной особи. Темпы техноэволюции
и биоэволюции – не сопоставимы, но взаимное моделирование
многообещающе.
Реальное существование и эволюция ценозов
могут быть описаны системой показателей-параметров (которые не обязательно
представимы числом). Такое выделение и описание есть описание параметров точки:
ценоз становится элементом, неделимым объектом,
который рассматривают (ранжируют) по какому-либо одному параметру в ряду других
объектов этого семейства (множество параметров ведёт к выделению кластеров,
нейронным сетям, дающим возможность сравнивать объекты). Выстраивание означает,
что рассматривается некоторый новый ценоз. Однако вложение вверх, как и возможное дробление, ограничены буквально несколькими шагами (что по количеству существенно
отличается от фрактального и синергетического подходов).
Ранговое распределение по параметру даёт
возможность говорить об оптимальности, эффективности ценоза
в целом. Следующий шаг – не во вне,
а внутрь: исследование структуры для установления соотношения "крупное–мелкое"
и соотношения по разнообразию: 40–60 % видов ноевы
(это 10 % особей); 40–60 % массовы, саранчёвы (это лишь 10 % видов). Так я говорю об обязательности
исследования структуры по параметрам в ряду других ценозов и видовой структуры
единичного ценоза, не рассматривая здесь проблему его
выделения.
Возникает вопрос об оценке нормального и
негауссова процессов. Нормальное (гауссово) распределение имеет плотность
вероятности с определённым математическим ожиданием и дисперсией, которые и
есть параметры случайной величины для области значений –∞<x<+∞. Математическое ожидание в самых разных науках – это
среднее арифметическое, частота (статистическая вероятность), которая для
дискретных и непрерывных величин записывается несколько различно. В
классическом случае симметрия нормального распределения позволяет говорить о
совпадении значений математического ожидания, моды и медианы.
Предложим модель пошаговой
последовательности увеличения ценологической составляющей и введём термин К-разность
(разность между математическим ожиданием нормального распределения и
математическим ожиданием распределения "деформированного"
ценологически). Пусть произошло какое-то ценологическое воздействие такое, что одно из наблюдений "а" стало характеризоваться
не интервальным значением параметра, а иным. Если всё происходит в рамках
Гаусса, то "а"
не может переместиться дальше интервала, например, с 1 %-ной или 5 %-ной
ошибкой. Но мы говорим, что величина "а", оцениваемая ценологически, не может
уже попасть в гауссов интервал. Он "занят", и эта
"занятость" заставляет переместить "а" в
интервал, далее определённого Гауссом. Полный процесс итерации
заканчивается, когда единичное наблюдение "б" переместится на последнее ценологически
определяемое место. Перемещение фиксирует в пределе равномерное распределение с
определяемым средним.
Такое преобразование не изменило
местоположение медианы, но изменило среднее. Если считать, что существовала
норма (считающаяся оптимальной), и эта норма есть математическое ожидание µн,
совпадающее с медианой – mн,
то предполагаемый мною алгоритм меняет картину: среднее начинает смещаться.
Представляя Н-распределения и говоря о концептуальном значении термина техноценоз,
составившего основу технетики – науки о технической реальности, я не употребляю
синергетические понятия. Для ценоза (а ценоз – синергетический объект) порядок более естествен,
чем хаос; этот порядок обеспечивается информационно через физические процессы;
увеличение разнообразия увеличивает устойчивость системы; изоляция ценоза останавливает развитие; конкуренция повышает эффективность
отбора.
1. Ценологические представления,
опирающиеся на одновременность выделения элемента-особи, введения родо-видовой классификации,
формализованного описания ценозов, есть отражение третьей научной картины мира.
2. Частотными представлениями Ципфа как
моделью пользоваться не следует из-за утраты информации по длине текста и
объёму словаря.
3. Существует приоритетная естественность
видового Н-распределения перед ранговидовым, допускающим свёртку.
Аналитически характеристические показатели α
и β один из другого не выводятся.
4. Сравнение ценозов достовернее, если
использовать обобщающие показатели, идентифицирующие Н-распределение лучше, чем характеристический показатель α и первая точка.
5. Видовое Н-распределение модельно представимо пойнтер-точкой
R ,
которая ограничивает гиперболическую область, позволяет описывать структуру
ценозов значением R и числом каст К, накладывая
ограничения на объём ценоза 2R.
6. Однозначно определяет гиперболическое Н-распределение модель простых чисел,
заключающаяся в разложении на простые сомножители факториала натурального числа
такого, что количество простых чисел в факториале равно числу видов ценоза.
7. Видовое Н-распределение, выстраиваемое до точки R
, имеет всплески и провалы (зубцы),
которые не случайны, а закономерно обязательны, как и неравномерность
расстояний между саранчёвыми кастами после точки R.
Авдеев В. А., Друян В. М., Кудрин Б. И. Основы проектирования
металлургических заводов: Справ. изд.
М.: Интермет Инжиниринг, 2002. 464 с.
Арапов М. В., Ефимова Е.
Н., Шрейдер Ю. А. О смысле ранговых распределений //
НТИ. Сер. 2. № 1. 1975. С. 9–20.
Арапов М. В., Ефимова Е.
Н., Шрейдер Ю. А. Ранговые распределения в тексте и
языке// НТИ. Сер. 2. 1975. № 2. С. 3–7.
Глобалистика: Международный междисциплинарный
энциклопедический словарь / Гл. ред. И.И. Мазур, А.Н. Чумаков. М.–СПб. – Н-Й.: ИЦ "ЭЛИМА", ИД "Питер". 2006.
1160 с.
Глобалистика: Энциклопедия / Гл.
ред. И.И. Мазур, А.Н. Чумаков. Центр научных и
прикладных программ "ДИАЛОГ". М.: ОАО Издательство
"Радуга", 2003. 1328 с.
Гнеденко Б. В. Предельные
законы для сумм независимых случайных величин // Успехи мат. наук. Вып. 10. М.–Л.: ОГИЗ, 1944. С. 115–165.
Гнеденко Б. В.,
Колмогоров А. Н. Предельные распределения для сумм независимых случайных
величин. М.–Л.: Гостехтеориздат, 1949. 264 с.
Зайцев Г. З., Божков М.
И. Техноценологический взгляд на электрификацию жилья
и быта // Электрика. 2002. № 11. С. 38–41.
Капица С. П., Курдюмов С. П., Малинецкий Г. Г.
Синергетика и прогнозы будущего. М.: Эдиториан УРСС,
2001. 288 с.
Колмогоров А. Н. Основные
понятия теории вероятностей. М.–Л., 1936; М., 1974.
Кудрин Б. И. Античность.
Символизм. Технетика. М.: Электрика, 1995. 120 с.
Кудрин Б. И. Введение в
науку о технической реальности: Автореф. дис. в форме науч. доклада …докт. филос. наук по спец. 09.00.08 – Философия науки и техники. СПб.: СПб. гос. ун-т, 1996. 40 с./ В кн.: Математическое описание ценозов и закономерности техноэволюции. Вып. 1.
"Ценологические исследования". Доклады Первой
междунар. конф. (Новомосковсковск Тульск., 24–26
января
Кудрин Б. И. Введение в технетику. Томск: Изд-во ТГУ, 1991. 384 с.
Кудрин Б. И. Исследования
технических систем как сообществ изделий – техноценозов
// Системные исследования. Методологические проблемы: Ежегодник. 1980. М.: Наука,
1981. С. 236–255.
Кудрин Б. И. Классика технических ценозов. Общая и прикладная ценология. Вып. 31. "Ценологические исследования". Томск:
ТГУ, 2006. 220 с.
Кудрин Б. И.
Научно-технический прогресс и формирование техноценозов
// ЭКО: Экономика и организация промышленного производства. 1980. № 8. С.
15–29.
Кудрин Б. И. Организация,
построение и управление электрическим хозяйством промышленных предприятий на
основе теории больших систем: Дис. … докт. техн. наук по спец. 05.14.06 – Электрические системы и управление ими.
Томск: Том. политех.
ин-т, 1976. 452 с. М.: Центр системных исследований. Вып. 24. "Ценологические исследования". 2002. 368
с.
Кудрин Б. И. Отбор:
энергетический, естественный, информационный, документальный. Общность и
специфика / В кн. Электрификация металлургических
предприятий Сибири. Вып. 5. Томск: Изд-во ТГУ, 1981.
С. 111–187.
Кудрин Б. И. Применение
понятий биологии для описания и прогнозирования больших систем, формирующихся
технологически / В кн. Электрификация
металлургических предприятий Сибири. Вып. 3. Томск:
Изд-во ТГУ, 1976. С. 171–204.
Кудрин Б. И.
Распределение электрических машин по повторяемости как некоторая закономерность
/ В кн. Электрификация
металлургических предприятий Сибири. Вып. 2. Томск:
Изд-во ТГУ, 1974. С. 31–40.
Кудрин Б. И. Технетика:
новая парадигма философии техники (третья научная картина мира). Томск: Изд-во
ТГУ, 1998. 40 с.
Кудрин Б. И.
Электроснабжение промышленных предприятий: Учебник для вузов. М.: Энергоатомиздат, 1995. 416 с.
Кудрин Б. И., Розин В. М.
Разговор технария и гуманитария в поезде
"Лена–Москва" о философии техники и не только о ней. 2-е изд., испр. М.: Электрика, 2000. 32 с.
Кудрин Б. И., Розин В. М.
Разговор технария и гуманитария в поезде
"Томск–Москва" о философии технетики и не
только о ней. Томск: Изд-во Том. ун-та,
2005. 84 с.
Кудрин Б. И., Фуфаев В. В. Статистические таблицы временных рядов Н-распределе-ний
электрооборудования и электропотребления. Т. 1. Электрооборудование. Вып. 13. "Ценологические исследования". Абакан:
Центр системных исследований, 1999. 352 с.
Лагуткин О. Е. Ценологическая методология
ранговых Н-распределений // Электрика.
2001. № 8. С. 31–39.
Любищев А. А. Линии Демокрита и Платона в истории культуры / Сост., ред., предисл., заключ. ст. Б. И.
Кудрин. М.: Электрика, 1997. 408 с.
Математические методы в
социальных науках. М.: Прогресс, 1973. 351 с.
Орлов Ю. К. Динамика
ранговых распределений и проблема статистики редких событий // Электрика. 2001.
№ 8. С. 22–31.
Петров В. В. Предельные
теоремы для сумм независимых случайных величин. М.: Наука, 1987. 320 с.
Сводная библиография по
технетике. К 70-летию со дня рождения проф. Б. И. Кудрина/ Сост. В. И. Гнатюк,
В. В. Прокопчик, В. В. Фуфаев. Общ.
ред. – Г. А. Петрова. Вып.
26. "Ценологические исследования". М.: Центр системных исследований,
2004. 236 с.
Техногенная
самоорганизация и математический аппарат ценологических исследований. Труды науч. конф. по философии техники
и технетике (Москва, январь 2004 г., 17–18 октября 2005 г.). Вып. 28. "Ценологические исследования". М.: Центр
системных исследований, 2005. 516 с.
Феллер В. Введение в теорию вероятностей и
её приложения. Т. 2. М.: Мир, 1984. 738 с.
Философские основания технетики.
Фуфаев В. В. Ценологическое
определение параметров электропотребления, надёжности, монтажа и ремонта
электрооборудования предприятий региона. М.: Центр системных исследований,
2000. 320 с.
Хайтун С. Д. Наукометрия:
Состояние и перспективы. М.: Наука, 1983. 344 с.
Хайтун С. Д. Проблемы количественного
анализа науки. М.: Наука, 1989. 280 с.
Хинчин А. Я. Асимптотические законы теории вероятностей. М.: ОНТИ, 1936. 96 с.
Хинчин А. Я. Предельные законы для сумм
независимых случайных величин. М.–Л.: ОНТИ, 1938. 116 с.
Хорган Дж. Конец науки: Взгляд на
ограниченность знания на закате Века Науки. СПб.: Амфора, 2001. 479 с.
Ценологические
исследования распределений простых чисел (30-летие открытия) / Под ред. В. В. Фуфаева. М.–Абакан:
Центр системных исследований, 2004. 144 с.
Чайковский Ю. В. О
природе случайности. Вып. 18. "Ценологические
исследования". М.: Центр системных исследований – Институт истории
естествознания и техники РАН, 2001. 272 с.
Чайковский Ю. В. Элементы
эволюционной диатропики. М.:
Наука, 1990. 272 с.
Шрейдер Ю. А. Ранговые распределения как
системное свойство / В кн. Математическое описание ценозов и закономерности технетики. Философия и становление технетики.
Вып. 1. "Ценологические исследования".
Доклады Первой междунар. конф. (Новомосковсковск Тульск., 24–26 января
Электрификация металлургических
предприятий Сибири. Вып. 12. Томск: Изд-во Том. ун-та, 2005. 324 с.
Электроэффективность: ежегодный рейтинг российских
регионов по электропотреблению за 1990–1999 гг.// Электрика. 2001. № 6. С.
3–12.
Яблонский А. И.
Математические модели в исследовании науки. М.: Наука, 1986. 352 с.
Fisher R. A., Corbet
A. S., Williams C. B. The relation between the number of species and the number
of individuals in a random sample of an animal population// J. of Animal Ecology,
1943, No. 12. P. 42–58.
Global Studies Encyclopedia / Edited by I.I. Mazour,
A.N. Chumakov, W.C. Gay. TsNPP
"Dialog". Raduga Publishers, 2003. 592 p.
Hill Bruce M., Woodroofe
Michael. Stronger forms of Zipf’s law// J. of
American Statistical Association, 1975, vol. 70, No. 349. P. 212–219.
Lotka A. The frequency distribution of scientific
productivity// J. Wash. Acad. Sci., 1926, vol. 16. P.
317–323.
Lotka A. S. Elements of Physical Biology.
May R. Chaos and dynamics of
biological populations // Dynamic chaos. Proceedings of R.S.
Discussion. 1987. Ser. A. V. 413. № 1844.
Mandelbrot B. Les objects fractals: forme, hasard et
dimension.
Williams C. B. Patterns in the
balance of nature, and the related problems in quantitative ecology. L. and N.Y.: Academic Press, 1964. 324
p.
Yule J. U. A mathematical theory of
evolution, based on the conclusions of Dr. J. C. Willis, FRC// Philos. Transact. R.S. Ser. B.
Watterson J. A. Models for the
Logarithmic Species Ambudance Distributions //
Theoretical Population Biology, 1974, No. 6. P. 217–250.
Zipf J. K. Human behaviour
and the principle of least effort. –