Большая Советская Энциклопедия (ВЫ) - Большая Советская Энциклопедия "БСЭ" (читать книги без TXT) 📗
Лит.: Ковалевский А. Г., Основы теории выборочного метода, Саратов. 1924; Боярский А. Я., Старовский В. Н. [и др.], Теория математической статистики, М., 1930 и М., 1931; Юл Дж. Э. и Кендэл М. Дж., Теория статистики, пер. с англ., 14 изд., пересмотр, и расшир., М., 1960; Иойтс Ф., Выборочный метод в переписях и обследованиях, пер. с англ., М., 1965; Выборочное наблюдение в статистике СССР. Сб. статей под ред. А. Я. Боярского [и др.], М., 1966; Дружинин Н. К., Выборочный метод и его применение в социально-экономических исследованиях, М., 1970.
А. Г. Волков.
Выборочный метод
Вы'борочный ме'тод, статистический метод исследования общих свойств совокупности каких-либо объектов на основе изучения свойств лишь части этих объектов, взятых на выборку. Математическая теория В. м. опирается на два важных раздела математической статистики — теорию выбора из конечной совокупности и теорию выбора из бесконечной совокупности. Основное отличие В. м. для конечной и бесконечной совокупностей заключается в том, что в первом случае В. м. применяется, как правило, к объектам неслучайной, детерминированной природы (например, число дефектных изделий в данной партии готовой продукции не является случайной величиной : это число — неизвестная постоянная, которую и надлежит оценить по выборочным данным). Во втором случае В. м. обычно применяется для изучения свойств случайных объектов (например, для исследования свойств непрерывно распределённых случайных ошибок измерений, каждое из которых теоретически может быть истолковано как реализация одного из бесконечного множества возможных результатов).
Выбор из конечной совокупности и его теория являются основой статистических методов контроля качества и часто применяются в социологических исследованиях (см. Выборочное наблюдение ). Согласно теории вероятностей, выборка будет правильно отражать свойства всей совокупности, если выбор производится случайно, т. е. так, что любая из возможных выборок заданного объёма n из совокупности объёма N [число таких выборок равно N !/n !(N — n )!] имеет одинаковую вероятность быть фактически выбранной.
На практике наиболее часто используется выбор без возвращения (бесповторная выборка), когда каждый отобранный объект перед выбором следующего объекта в исследуемую совокупность не возвращается (такой выбор применяется при статистическом контроле качества). Выбор с возвращением (выборка с повторением) рассматривается обычно лишь в теоретических исследованиях (примером выбора с возвращением является регистрация числа частиц, коснувшихся в течение данного времени стенок сосуда, внутри которого совершается броуновское движение ). Если n << N, то повторный и бесповторный выборы дают практически эквивалентные результаты.
Свойства совокупности, исследуемые В. м., могут быть качественными и количественными. В первом случае задача выборочного обследования заключается в определении количества М объектов совокупности, обладающих каким-либо признаком (например, при статистическом контроле часто интересуются количеством М дефектных изделий в партии объёма N ). Оценкой для М служит отношение mN/n , где m — число объектов с данным признаком в выборке объёма n . В случае количественного признака имеют дело с определением среднего значения совокупности
Оценкой для является выборочное среднее где x1 ,..., xn — те значения из исследуемой совокупности x1 , x2 ,..., xN , которые принадлежат выборке. С математической точки зрения 1-й случай — частная разновидность 2-го, которая имеет место, когда М величин xi равны 1, а остальные (N — М ) равны 0; в этой ситуации и .В математической теории В. м. оценка средних значений занимает центральное место потому, что к ней в известной степени сводится изучение изменчивости признака внутри совокупности, так как за характеристику изменчивости обычно принимают дисперсию
представляющую собой среднее значение квадратов отклонений xi от их среднего значения
. В случае изучения качественного признака s2 = М (N — M )/N2 .О точности оценок m/n и
судят по их дисперсиям
которые в терминах дисперсии конечной совокупности s2 выражаются в виде отношений s2 /n (в случае выборок с повторением) и s2 (N — n )/n (N — 1) (в случае бесповторных выборок). Так как во многих практически интересных задачах случайные величины m/n и
при n ³ 30 приближённо подчиняются нормальному распределению , то отклонения m/n от M/N и от , превышающие по абсолютной величине 2sm/n и соответственно, могут при n ³ 30 осуществиться в среднем приблизительно в одном случае из двадцати. Более полную информацию о распределении количественного признака в данной совокупности можно получить с помощью эмпирического распределения этого признака в выборке.Выбор из бесконечной совокупности. В математической статистике результаты каких-либо однородных наблюдений (чаще всего независимых) принято называть выборкой даже в том случае, когда эти результаты не соответствуют понятию выборки с повторениями или без повторений из конечной совокупности. Например, результаты измерений углов на местности, подверженные независимым непрерывно распределённым случайным ошибкам, часто называют выборкой из бесконечной совокупности. Предполагается, что принципиально можно осуществить любое число таких наблюдений. Полученные фактически результаты считают выборкой из бесконечного множества возможных результатов, называемых генеральной совокупностью.
Понятие генеральной совокупности не является логически безупречным и необходимым. Для решения практических задач нужна не сама бесконечная генеральная совокупность, а лишь те или иные характеристики, которые ей ставятся в соответствие. Эти характеристики с точки зрения теории вероятностей являются числовыми или функциональными характеристиками некоторого распределения вероятностей, а элементы выборки —случайными величинами, подчиняющимися этому распределению. Такое истолкование позволяет распространить на выборочные оценки общую теорию статистических оценок .
По этой причине, например, в вероятностной теории обработки наблюдений понятие бесконечной генеральной совокупности заменяется понятием распределения вероятностей, содержащего неизвестные параметры. Результаты наблюдений истолковываются как экспериментально наблюдаемые значения случайных величин, подчиняющихся этому распределению, Цель обработки — вычисление по результатам наблюдений в том или ином смысле оптимальных статистических оценок для неизвестных параметров распределения.