М.Попов
ИССЛЕДОВАНИЕ СТРУКТУРЫ СИСТЕМЫ СТАНДАРТОВ
В Болгарии существует обширная научно-техническая документация, в которой значительное место занимают стандарты. Вопреки этому до сих пор отсутствует общая теория развития подобной документации, что отражается неблагоприятно на обосновании стандартизации. Одной из основных задач к теории стандартизации является анализ и установление закономерное; формирования структуры системы стандартов. В связи с этим целью нас им щей работы является анализ статичности структуры системы стандартов и формирование её математической модели.
Структура системы - это совокупность постоянных в заданный период времени отношений между элементами системы. В случае системы стандартов её структурой является принятая классификационная система и её числовые характеристики.
Б.И.Кудрин [2] установил и обосновал существование техно- и информоценозов и исследовал их основные структурные свойства. Система стандартов, и в частности болгарских государственных стандартов /БДС/, которые рассматриваются в дальнейшем, в принципе также должна являться информоценозом. Так ли это однако в действительности, может быть решено лишь после анализа её структуры.
Анализ структуры ценоза проводится на двухстепенной базе – особь и вид. В данном случае за особь принимается стандарт, имеющий определённый номер. Согласно [2,с.103] способ образования вида не влияет на закономерности, присущие структуре информоценоза. Поэтому здесь принято, что вид - это раздел системы стандартов, то есть основным признаком определения вида является буква /А,...,Я/ раздела, в который включён соответствующий стандарт. Причиной подобного выбора явилась невозможность определения для отдельных лет количества стандартов, распределённых по группам или классам системы. Таким образом анализу подвергается совокупность БДС, распределённых в 19 видов /разделов/, обозначаемых для удобства цифрами: А-01, Б-02 и т.д.
Обыкновенно система стандартов как и отдельные её разделы характеризуются количеством действующих стандартов. Эта величина однако является разностью между количеством новорегистрированных и отменённых стандартов, которые рассматриваются как первичные [3]. Поэтому в дальнейшем система стандартов рассматривается в двух основных формах: новорегистрированные /n/ и отменённые /о/ стандарты. Кроме того в каждой из этих форм учитывается количество стандартов Ysi в s-ом разделе в i-ом году, как и кумулятивное их количество Yqsi. в s-ом разделе до i-гo года.
В [2] сформулирован закон, согласно которому структура ценоза устойчива и описывается с помощью рангового и/или видового распределения. Следовательно, если например ранговое распределение системы стандартов в различные годы одинаково, то и систему стандартов возможно рассматривать как стандартоценоз.
Учитывая специфику рассматриваемого объекта, в работе имеются ввиду два вида ранговых распределений: годовое
/1/ Vsi=Ysi/Yi
и кумулятивное
/2/ Vqsi=Yqsi/Yqi
где Yi - общее количество новорегистрированных /отменённых/ стандартов в i-ом году; Yqi - кумулятивное количество новорегистрированных /отменённых/ стандартов до i-гo года.
Годовое ранговое распределение в противовес кумулятивному полностью отражает случайные колебания величин в отдельные годы, что является более неудобным при раскрытии закономерностей процесса. Следовательно, закономерности, раскрытые на базе годовых ранговых распределений, будут иметь место и для кумулятивных распределений, в то время как обратное необязательно. Именно поэтому за базовые выбраны годовые распределения.
Пример годового рангового распределения новорегистрированных стандартов за 1971 г. дан в табл.1, где в колонке 2 /n71/ указано количество стандарт, в 19-и разделах, в колонке 3 /nг71 */ - нисходящая ранжировка тех же данных, а в колонке 4 /n71*/ - годовое ранговое распределение, причём последние две цифры являются номерами соответствующих разделов. Выбор 1971 г в качестве примера объясняется средней величиной /891 шт./ новорегистрированных стандартов за один год, которая колеблется в диапазоне 200-1300 шт.
Годовое ранговое распределение Vnsi относительных частот разделов системы новорегистрированных стандартов за 1955, 1960, ..., 1985 и 1989 гг. может быть представлено в виде кривых Н-распределения (аналогично - данные для отмененных стандартов Vosi за 1960,..., 1989 гг.). Из кривых следует, что налицо практически полное совпадение ранговых распределений за отдельные годы. Этот вывод подтверждается и совпадением кумулятивных ранговых распределений новорегистрированных стандартов за тот же период. Визуальный вывод подтвержден и соответствующими статистическими показателями Среднегодовой интегральный коэффициент структурных изменений [1] для новорегистрированных стандартов при «плавающей» базе /предыдущий год/ составлял 4,25-12,5%. Исключениями являлись 1970 и 1975 г., когда тот же коэффициент достигал 31,8%, что объясняется резким изменением годового количества стандартов в указанный период. При постоянной базе /1955 г./ интегральный коэффициент структурных изменений составлял 43,4-61,0%. Относительно большая величина последнего объясняется тем, что 1955 г. относится к начальному периоду формирования структуры системы.
На основании проведённого анализа можно утверждать, что система стандартов обладает устойчивой структурой, а сама система является стандартоценозом.
При разработке математической модели стандартоценозов возможны два подхода: ранговое распределение простых чисел и эмпирическое описание наличных данных, которое в дальнейшем не используется из-за ограничения объёма доклада.
В литературе обыкновенно рассматриваются «пластичные» ценозы в которых количество видов Sпл переменно и зависит от общего количества особей Y в ценозе. Зависимость между этими параметрами, полученная в [2], для случае <1500, представляет собой
/3/ S = 0,795Y0,65
Наряду с такими ценозами существует и другой крупный класс ценозов которых количество видов остаётся постоянным, несмотря на изменение количества особей. Такие ценозы, к которым относится и стандартоценоз, в дальнейшее называются «твердыми». Они характеризуются постоянной классификационной структурой, которая не зависит от числа особей, «вкладываемых» в них.
При исследовании «пластичных» ценозов динамика исследования обеспечивается исследованием разнообразных ценозов с различным количеством особей. В случае же «твёрдых» ценозов необходимо исследовать ценозы с различным количеством особей, но с приблизительно одинаковым числом априорипринятых видов или же исследовать один ценоз, но в рамках определённого периода времени, в течение которого изменяется число особей. Именно последний подход используется в дальнейшем.
Таблица 1
Эмпиричные данные |
Модели |
||||||||||||||||
I группа |
II группа |
||||||||||||||||
|
n71 |
n7Г |
nv71* |
с19 |
cv19* |
ncg71 |
ncgv71* |
ncp71 |
ncpv71* |
ck19 |
ckv19' |
nk71 |
nkg71* |
nkgv71* |
nck71 |
nckp71* |
nckpv71 * |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10,00 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
1 |
31 |
138 |
15,4910 |
2 |
11,98 |
2 |
12,67 |
2 |
23,21 |
61 |
41,50 |
2 |
151 |
56,34 |
2 |
150 |
48,23 |
2 |
25 |
90 |
10,1004 |
3 |
11,63 |
3 |
11,71 |
3 |
19,84 |
31 |
21,09 |
3 |
48 |
17,91 |
3 |
40 |
12,86 |
3 |
66 |
70 |
7,8611 |
5 |
10,24 |
5 |
10,83 |
5 |
12,66 |
14 |
9,52 |
5 |
29 |
10,82 |
5 |
30 |
9,64 |
4 |
90 |
66 |
7,4103 |
7 |
9,2 |
13 |
10,03 |
7 |
9,30 |
10 |
6,80 |
13 |
12 |
4,48 |
7 |
18 |
5,79 |
5 |
58 |
60 |
6,7319 |
11 |
8,16 |
29 |
9,15 |
11 |
7,39 |
6 |
4,08 |
29 |
5 |
1,86 |
11 |
15 |
4,82 |
6 |
23 |
58 |
6,5105 |
13 |
7,46 |
43 |
7,95 |
13 |
5,78 |
5 |
3,40 |
43 |
4 |
1,49 |
13 |
12 |
3,86 |
7 |
46 |
56 |
6,2812 |
17 |
7,12 |
61 |
7,23 |
17 |
2,27 |
3 |
2,04 |
61 |
4 |
1,49 |
17 |
11 |
3,54 |
8 |
11 |
46 |
5,1607 |
19 |
6,42 |
79 |
6,51 |
23 |
4,32 |
3 |
2,04 |
79 |
2 |
0,75 |
23 |
6 |
1,93 |
9 |
40 |
40 |
4,4909 |
23 |
5,38 |
101 |
5,55 |
31 |
3,44 |
2 |
1,36 |
101 |
3 |
1,12 |
31 |
6 |
1,93 |
10 |
138 |
39 |
4,3813 |
29 |
5,04 |
113 |
4,52 |
41 |
3,00 |
2 |
1,36 |
113 |
1 |
0,37 |
41 |
5 |
1,61 |
11 |
70 |
32 |
3,5917 |
31 |
3,99 |
139 |
4,04 |
47 |
2,27 |
2 |
1,36 |
139 |
1 |
0,37 |
47 |
3 |
0,96 |
12 |
56 |
31 |
3,4801 |
37 |
3,3 |
163 |
3,16 |
59 |
1,68 |
1 |
0,68 |
163 |
1 |
0,37 |
67 |
2 |
0,96 |
13 |
39 |
31 |
3,4816 |
41 |
2,95 |
181 |
2,44 |
67 |
1,24 |
1 |
0,68 |
181 |
1 |
0,37 |
67 |
2 |
0,64 |
14 |
29 |
29 |
3,2514 |
43 |
2,26 |
199 |
1,72 |
79 |
0,95 |
1 |
0,68 |
199 |
1 |
0,37 |
79 |
3 |
0,96 |
15 |
19 |
27 |
3,0318 |
47 |
1,91 |
229 |
1,16 |
101 |
0,80 |
1 |
0,68 |
229 |
1 |
0,37 |
101 |
3 |
0,96 |
16 |
31 |
25 |
2,8002 |
53 |
1,22 |
251 |
0,52 |
127 |
0,51 |
1 |
0,68 |
251 |
1 |
0,37 |
127 |
1 |
0,32 |
17 |
32 |
23 |
2,5806 |
59 |
0,87 |
271 |
0,20 |
173 |
0,37 |
1 |
0,68 |
271 |
1 |
0,37 |
173 |
1 |
0,32 |
18 |
27 |
19 |
2,1315 |
61 |
0,52 |
293 |
0,12 |
239 |
0,22 |
1 |
0,68 |
293 |
1 |
0,37 |
239 |
1 |
0,32 |
19 |
60 |
11 |
1,2308 |
67 |
0,35 |
317 |
0,08 |
317 |
0,15 |
1 |
0,68 |
317 |
1 |
0,37 |
317 |
1 |
0,30 |
* - нисходящая ранжировка
Методика определения каноничного рангового распределения в «пластичных» ценозах описана в [2]. Для рассматриваемого примера /1971 г., Yi=891/ в «пластичном» ценозе должно существовать 66 видов /Sпл=66/, в то время как в стандартоценозе их только 19 /S =19/. Очевидно, что указанную методику нельзя использовать без изменения, т.к. логика последней требует наличия в ряду только 19 простых чисел, а не 66, как это было бы в «пластичном» ценозе. В тоже время следует сохранить простые числа в качестве основы канонического рангового распределения для «твёрдых» ценозов после их успешного использования для ценозов «пластичных».
Уточнение методики определения канонического рангового распределения стандартоценозов связано с анализом использования двух групп моделей, созданных на базе 19-и простых чисел: I группа распределение относительных частот простых чисел и II группа - принятое в [2] распределение относительных частот простых чисел, являющихся сомножителями в факториале определённого натурального числа. В рамках каждой из групп образуется по три модели в зависимости от способа выбора простых чисел: первые 19 /количество разделов стандартов/ простых чисел /табл.1, колонка 5, 11/ - модели 1.1 и II.1, и 19 простых чисел, оставшихся после отстранения /равномерного, неравномерного/ лишних простых чисел: при равномерном - модели 1.2 и И.2 /табл.1, колонка 7, 13/, и неравномерном - модели 1.3 и II.3 /табл.1, колонка 9, 16/.
Первым шагом для моделей II-ой группы является определение ряда простых чисел и количество последних, подлежащих отстранению. Исходя из общего количества особей /новорегистрированных, отменённых стандартов/ за соответствующий год по /3/ определялось количество видов Sпл гипотетического ценоза, которое являлось порядковым номером последнего простого числа в соответствующем ряду. Для новорегистрированных стандартов за 1971 г. Sпл=66, что отвечает 66-му простому числу - 317 /табл.1, колонки 7,9,13,16/. Для меньшего количества особей, когда Sпл <19, последнее принимается за окончательное, равное количеству членов в ряду. В случае же, когда Sпл >19, определяется разность Sпл -19, являющаяся количеством простых чисел, которые следует отстранить из апроксимирующего ряда, в данном случае - 47 чисел.
Вторым шагом для моделей Н-ой группы является равномерное или неравномерное отстранение лишних простых чисел из апроксимирующего ряда. При равномерном отстранении лишних сохраняется каждое четвёртое простое число апроксимирующего ряда «пластичного» ценоза, причем счёт начинается с самого большого простого числа /в примере с 317/. Последняя «порция» отстраняемых простых чисел может содержать от 1 до 3 шт. Так были получены два одинаковых ряда для моделей I.2 - колонка 7 /ncg71/ и II.2 - колонка 13/nk71/.
При неравномерном отстранении лишних простых чисел /модели 1.3 и II.3/ образуется максимально возможная сумма простых чисел так, что 2+3+5+..<Sпл- SТВ. Для рассматриваемого примера 2+3+5+7+11 +13=41<66-19=47. Последняя цифра /13/ в указанной сумме - это количество отстраняемых чисел в первой «порции», причём счёт начинается с предпоследнего простого числа с номером Sпл-1; вторая цифра - то же самое для второй «порции» и т.д. При необходимости после последней «порции» двух отстранённых простых чисел дальнейшее отстранение продолжается через одно число. Так были сформированы два одинаковых ряда для моделей I.3 и II.З /табл.1, колонки 9 /nср71/ и 16 /nck71//.
Логика II-ой группы моделей состоит в определении относительной частоты простых чисел, встречаемых при разложении на сомножители Nsпл\. Поэтому в этом случае вместе с отстраняемыми простыми числами необходимо отстранить и определённое количество натуральных чисел, находящихся между отстраняемыми простыми числами. Было принято, что с каждым отстраняемым простым числом отстраняются по два числа перед и после него, то есть четыре связанных с ним натуральных числа. Это количество соизмеримо со средней величиной 5,4 шт. натуральных чисел, находящихся между двумя соседними простыми числами. При этой манипуляции дополнительно не отстранялись те простые числа, которые не были отстранены первоначально. Частота появления / показатель степени/ простых чисел для модели П.З представлена в табл.1, колонке 17 /nckp71/, а ранговое распределение - в колонке 18 /nckpv71/.
Сравнение разработанных моделей с данными о новорегистрированных стандартах по разделам за 1955, 1960 и т.д. годы было проведено с помощью аппарата статистической проверки простых гипотез путём использования программной системы STATGRAPHICS. Для случая 1971 г. /табл.1/ каждая из моделей (колонки 6,8,10,12,15 и 18) сравнивались с эмпирической выборкой (колонка 4). При уровне значимости α=0,05 ни один из рассмотренных случаев не был отвергнут, то есть все модели могут использоваться.
Диаграммы рангового распределения новорегистрированных стандартов для моделей 1-ой и П-ой групп показывают, что максимальные ошибки δVsi между эмпирическими и расчётными данными относятся прежде всего к 1-му рангу и в отдельных случаях - ко 2-му, в то время как для остальных рангов разница незначительна. В табл.2 даны средняя максимальная ошибка δVsiср и диапазон δVsi максимальных ошибок для соответствующих моделей за весь исследуемый период.
Таблица 2
Модели |
||||||
Ошибки |
I.I |
I.2 |
I.3 |
II.l |
II.2 |
II.3 |
cvl9 |
ncgv |
Ncpv |
Ckv19 |
nkgv |
Nckpv |
|
δVsicp % |
-9,1 |
-7,3 |
-0,5 |
+ 18,9 |
+29,0 |
+27,2 |
δVsi % |
+3,5 -20,0 |
+4,5 -14,0 |
+10,5 -13,0 |
+30,0 +9,0 |
+48,0 +12,0 |
+41,0 + 14,0 |
Данные показывают, что модели I-ой группы, сформированные на базе распределения частот простых чисел, соответствуют реальным данным более полно, чем модели II-ой группы, сформированные на базе распределения относительных частот простых чисел как сомножителей в факториале определённого числа. Со своей стороны, в рамках I-ой группы с целью минимизации диапазона /допуска/ максимальной ошибки лучший результат - 18,5% /+4,5 ... -14%/ достигается при использовании I.2 модели (ряда простых чисел, полученных путём равномерного отстранения некоторых из чисел из исходного полного ряда простых чисел). Одновременно сравнивались максимальные ошибки между годовыми и кумулятивными ранговыми распределениями, которые соответственно составляли +11% и -12%. Максимальные ошибки, полученные при сравнении предложенных моделей с кумулятивными ранговыми распределениями, составляли от 30% до 48%. Последнее объясняется более ясным проявлением тенденций в кумулятивных ранговых распределениях, что следует и из величины диапазона дисперсий 19,469...28,845, в то время как для годовых ранговых распределений - 10,815...56,138.
Число отменённых стандартов для большинства лет составляло 20...220 шт. и лишь в 1972-1974 и 1981-1984 гг. их было 250...320шт. Поэтому, исходя из того, что только для нескольких лет 5п-5тв<7...8, то есть количество отстраняемых членов невелико, проверке подвергались только модели 1.1 и 1.2 как менее трудоёмкие. Для отменённых стандартов до 1972г. Sпл<19, и поэтому рассматривалась единственно возможная модель I.I с соответственно уменьшенным числом членов. Производит впечатление почти полное совпадение за 1960, 1965, 1970 и 1971 гг. количества видов Sпл, определённое по /3/ и действительного количества разделов /видов/ SД, в которых имеются отменённые стандарты: Sпл/ SД=6/6, 8/9, 12/12, 15/17.
Анализ правильности нулевой гипотезы показал, что при α=0,05 последняя отвергается только для 1960 г., где модель содержала лишь первые шесть простых чисел. Диапазон максимальной ошибки составлял для модели I.I за 1960... 1989 гг. 13,5%, а для I.2 за 1972... 1989 гг. - 20%. Здесь в сравнении с вышеуказанными результаты несколько хуже, причём для случаев, где это возможно, лучшей является модель I.2.
Выводы
1. Указано, что систему стандартов следует рассматривать в двух основных формах - новорегистрированных и отмененных стандартов, а каждую из них -как годовые и кумулативные.
2. Показано, что структура системы стандартов, представленная в виде годового и кумултивного рангового распределений, постоянна, что даёт основание рассматривать эту систему как стандартоценоз.
3. Разработана методика формирования канонического рангового распределения «твёрдых» ценозов и уточнена наиболее подходящая модель для стандартоценоза.
Литература
1. Гатев К. и др. Обща теория на статистиката и икономическата статистика, С: Наука и изкуство, 1989. - 566с.
2. Кудрин Б.И. Введение в технетику, Томск: Изд. Томского гос. ун-та, 1991. - 384с.
3. Попов М. Анализ на временни редове на стандарти //Сб. докл. Нац. конф. с межд. участием «Стандартизация-търговия-потребител-93» 14-15.10.1993г., с. 212-223.