1. Основные понятия выборочного метода и задачи математической статистики
Общие понятия о выборке. Основной задачей математической статистики, как мы видели, является разработка методов получения научно обоснованных выводов о массовых явлениях и процессах из данных наблюдений или экспериментов. Эти выводы и заключения относятся не к отдельным испытаниям, из повторения которых и складывается данное массовое явление, а представляют утверждения об общих вероятностных характеристиках данного процесса, т. е. о вероятностях, законах распределения, математических ожиданиях и т. д. Такое использование фактических данных как раз и является отличительной чертой статистического метода.
Пусть мы располагаем материалом (обычно довольно ограниченным), например, о числе дефектных изделий в изготовленной в определенных условиях продукции или о результатах испытаний материала на разрушение и т. п. Собранные нами данные могут представлять непосредственный интерес в смысле информации о качестве той или иной конкретной партии продукции. Статистические же проблемы возникают тогда, когда мы на "основе той же информации пожелаем сделать выводы относительно более широкого круга явлений. Так, например, нас может интересовать качество технологического процесса, для чего мы оцениваем вероятность получения при нем дефектного изделия, среднюю долговечность изделия, точность изделий и т. д. В этом случае мы рассматриваем собранный материал не ради него самого, а лишь как некоторую пробную группу или выборку, представляющую только один из возможных • результатов, которые мы могли бы встретить при продолжении наблюдений массового процесса в данной обстановке. Разумеется, мы должны отдавать себе отчет в том, что выводы и оценки, основанные на ограниченном материале наблюдений, отражают случайный состав нашей пробной группы и потому должны считаться приближенными оценками вероятностного характера. Теория указывает, однако, во многих случаях, как наилучшим способом использовать имеющуюся у нас информацию для получения по возможности
более точных и надежных характеристик, указывая при этом и степень надежности наших выводов, объясняющуюся ограниченностью запаса сведений. Возможность такого рода оценок и придает нашим заключениям научную ценность.
В наиболее простом виде соотношения между данными выборки и вероятностными характеристиками процесса выступают в той схеме независимых испытаний, которую мы рассмотрели в п. 2.8.3. Мы видели, как по частости признака попавших в выборку объектов мы можем, опираясь на теорему Лапласа, оценить делю признака во всей партии или, как принято говорить в теории выборочного метода, в генеральной совокупности. Полученная выборка называется репрезентативной (представительной), если она достаточно хорошо представляет пропорции генеральной совокупности.
Наконец, мы можем производить выбор из некоторой совокупности, объекты которой обладают количественным признаком, варьирующим от одного экземпляра к другому, таким, например, как размеры деталей в некоторой партии. Задачами выборки в этом случае могут являться оценка доли деталей, признак которых лежит в определенных границах, оценка среднего значения признака в партии, его дисперсии и т. д. В этих примерах выборка берется из определенной генеральной совокупности, которая каждый раз точно фиксируется и содержит конечное число объектов. Понятия вероятности, закона распределения и др. здесь играют вспомогательную роль, позволяя приближенно определять нужные нам характеристики генеральной совокупности путем специально организованного процесса случайной выборки.
В других случаях, когда мы исследуем массовое явление, в котором интересующие нас величины претерпевают случайные колебания, мы в большинстве случаев также располагаем лишь ограниченным материалом наблюдений; наши же выводы хотим отнести ко всему протеканию процесса в целом при неизменных основных условиях, а не только к той его части, которая попала в орбиту нашего наблюдения. Такая экстраполяция может быть оправдана далеко не' всегда. Мы рассмотрим здесь только те случаи, когда данные наблюдения можно уподобить рассмотренной выше случайной выборке из некоторой «генеральной» совокупности. К этим случаям, правда, нередко оказывается возможным отнести различные физические и производственные эксперименты наблюдения за ходом работы оборудования, за протеканием различных технологических процессов. Особенность последних случаев заключается в том, что здесь обычно не представляется возможным очертить объем генеральной совокупности.
Распределение выборки и выборочные характеристики. Состоятельные и несмещенные оценки. Несмещенная оценка дисперсии. Рассмотрим исследование точности станка н приспособлений, связанное с величиной отклонений размеров обрабатываемых деталей от номинала. Последовательность х1, х2 , х3, хn наблюдаемых значений мы здесь будем рассматривать как некоторую «выборку», по которой мы хотим оценивать распределение вероятностей размеров деталей в данных условиях, отвлекаясь от случайных обстоятельств, которые могли иметь место в процессе отбора пробных деталей из текущей продукции станка. Обобщая использованную ранее терминологию, мы здесь будем условно говорить .о «выборке» из «генеральной совокупности» размеров деталей.
Это будет означать, что в каждом случае отбора мы наблюдаем значение некоторой величины X, следующей определенному закону распределения. Мы предполагаем, следовательно, что основные условия, в которых протекает процесс изготовления деталей, остаются неизменными, а вероятностные законы, регулирующие поведение величины, также сохраняют силу неопределенно долго. Подобным же образом последовательность n наблюденных значений х1, х2 , х3, хn мы будем рассматривать как совокупность значений, принятых л одинаково распределенными независимыми величинами X1 X2 X3 Xn представляющими n экземпляров одной и той же случайной величины X, с которой мы встречаемся в л последовательных и независимых наблюдениях. В этом случае говорят, что наша выборка взята из «генеральной совокупности»
|