Вынесен приговор бывшим руководителям агентства

Что входит в страхование ответственности

Ипотека на строящееся жильё (новостройка) в Сбербанке: новая квартира, дом

Что делать, если не согласен с баллами ЕГЭ – правила подачи апелляции

Антитабачный закон о запрете курения в общественных местах В каких общественных местах запрещено курение

Пример должностной инструкции оператора азс

Новый взгляд на национальную военную стратегию

Начальник инвалидов Чепурной - stalinum А г чепурной

Как высчитать проценты от суммы формула 20 процентный

Госзакупки – начинаем и выигрываем Какие документы нужны для участия

Сергей доля про обработку фотографий

«мегапир», представительство ассоциации в южном федеральном и южном военном округах Ассоциацию офицеров запаса вооруженных сил мегапир

Расписание занятий – Timetable

Что такое целевой прием в вуз и как получить высшее образование бесплатно

Может ли россия признать днр и лнр Признание днр странами

Что такое статистическая модель. Для многих начинающих исследователей статистическая обработка данных это что-то вроде завершающего аккорда при написании научн

4.1.1. Статистическая модель. При статистическом (стохастическом) моделировании основными объектами моделирования являются случайные события, случайные величины и случайные функции.

При проведении экспериментов исследователь фиксирует появление или не появления интересующих событий, а также осуществляет измерения значений параметров, которые носят случайный характер и по своей сути являются значениями реализации некоторой случайной величины.

Статистическое моделирование дает возможность не проводя реальных экспериментов над исследуемым объектом (что в большинстве случаев требует больших материальных и финансовых затрат) получать соответствующую информацию о появлении или не появлении тех или иных событий происходящих в реальном объекте. о выборочных значениях случайных величин на основе имеющихся вероятностных характеристик моделируемых событий и случайных величин. Данный вид моделирования предполагает проведение предварительного сбора информации о моделируемых показателях и дальнейшей статистической обработки полученных результатов с целью получения обоснованных статистических оценок, требуемых для моделирования вероятностных характеристик.

Стохастические модели применяются в основном в двух случаях:

1) объект моделирования плохо изучен – не имеется достаточно хорошо разработанных количественных закономерностей, описывающих рассматриваемые процессы и явления, а так же нет возможности найти приемлемое аналитическое решение данной проблемы;

2) моделируемый объект изучен достаточно хорошо в детерминированном плане, но без учета случайных факторов, оказывающих влияние на изучаемые процессы и явления.

В первом случае на основе словесного описания исследуемого объекта производится выбор количественных показателей с расчетом их физической размерности состоящих из двух групп. Одна из групп рассматривается в качестве входных величин модели, а другая – выходных величин. Далее, применяя научные теоретические результаты полученные другими исследователями в данной области и возможно применяя ряд необходимых допущений, а так же возможно уже имеемые экспериментальные данные о входных и выходных величинах (например, об их законах распределения) устанавливают детерминированные или стохастические зависимости между входными выходными величинами модели. Совокупность полученных соотношений между входными и выходными величинами (обычно записываются в виде уравнений) называют статистической моделью.

В ходе реализации статистической модели на основе выбранных законов распределения случайных величин и выбранными вероятностями моделируемых событий методами математической статистики определяются выборочные до экспериментальные значения случайных величин и квазиэмпирические последовательности появления или не появления моделируемых событий. Далее, по уравнениям модели определяют соответствующие выборочные значения ее выходных величин. А многократная реализация построенной модели позволяет исследователю построить модельную выборку ее выходных величин, которая вновь подвергается статистическому анализу (корреляционному, регрессивному, дисперсионному, спектральному) с целью получения оценок характеристик выходных параметров модели или проверки выдвигаемых гипотез. На основе полученных результатов делаются заключения по объекту исследования, а также обоснования по практическому применению построенной модели.

Методы статистического моделирования широко применяются при решении задач массового обслуживания, теории оптимизации, теории управления, теоретической физике и т.д.

Теоретической основой метода статистического моделирования на компьютере являются предельные теоремы теории вероятностей.

4.1.2. Неравенство Чебышева . Для неотрицательной функции случайной величины и выполняется неравенство

.

4.1.3. Теорема Бернулли . Если проводятся независимых испытаний, в каждом из которых некоторое событие осуществляется с вероятностью , то относительная чистота появления события ( число благоприятных исходов испытания) при сходится по вероятности к , т.е. при

4.1.4. Теорема Пуассона . Если проводятся независимых испытаний и вероятность осуществления события в том испытании равна , то относительная чистота появления события ( число благоприятных исходов испытания) при сходится по вероятности к среднему из вероятностей , т.е. при

4.1.5. Теорема Чебышева . Если в независимых испытаниях наблюдаются значения случайной величины , то при среднее арифметическое значений случайной величины сходится по вероятности к ее математическому ожиданию , т.е. при

4.1.6. Обобщенная теорема Чебышева . Если независимые случайные величины с математическими ожиданиями и дисперсиями ограниченными сверху одним и тем же числом, то при среднее арифметическое значений случайной величины сходится по вероятности к среднему арифметическому их математических ожиданий

4.1.7. Теорема Маркова .. Теорема Чебышева будет справедлива и для зависимых случайных величин , если

4.1.8. Центральная предельная теорема . Если независимые одинаково распределенные случайные величины с математическое ожидание и дисперсию , то при закон распределения суммы неограниченно приближается к нормальному закону распределения

где функция Лапласа

4.1.9. Теорема Лапласа . Если в каждом из независимых испытаний событие появляется с вероятностью , то

Статистическое наблюдение.

Сущность статистического наблюдения.

Начальным этапом всякого статистического исследования служит планомерный, научно организованный сбор данных о явлениях и процессах общественной жизни, называемый статистическим наблюдением. Значение этого этапа исследования определяется тем, что использование лишь вполне объективной и достаточно полной, полученной в результате статистического наблюдения, на последующих этапах в состоянии обеспечить научно обоснованные выводы о характере и закономерностях развития изучаемого объекта. Статистическое наблюдение осуществляется путем оценки и регистрации признаков единиц изучаемой совокупности в соответствующих учетных документах. Полученные таким образом данные представляют собой факты, так или иначе характеризующие явления общественной жизни. Использование аргументации, основанной на фактах, не противоречит применению теоретического анализа, поскольку всякая теория в конечном счете основывается на фактическом материале. Доказательная способность фактов еще больше возрастает в результате статистической обработки, обеспечивающей их систематизацию, представление в сжатом виде. Статистическое наблюдение следует отличать от других форм наблюдений, осуществляемых в повседневной жизни, основанных на чувственном восприятии. Статистическим можно назвать лишь такое наблюдение, которое обеспечивает регистрацию устанавливаемых фактов в учетных документах для последующего их обобщения. Конкретными примерами статистического наблюдения служит систематическое собирание сведений, например на машиностроительных предприятиях о количестве произведенных машин и узлов, издержках производства, прибыли и т. д. Статистическое наблюдение должно удовлетворять довольно жестким требованиям: 1. Наблюдаемые явления должны иметь определенное народнохозяйственное значение, научную либо практическую ценность, выражать определенные социально-экономические типы явлений. 2. Статистическое наблюдение должно обеспечить сбор массовых данных, в которых отражается вся совокупность фактов, относящихся к рассматриваемому вопросу, поскольку общественные явления находятся в постоянном изменении, развитии, имеют различные качественные состояния.

Неполные данные, недостаточно разносторонне характеризующие процесс, приводят к тому, что из их анализа делаются ошибочные выводы. 3. Многообразие причин и факторов, определяющих развитие социальных и экономических явлений, предопределяет ориентацию статистического наблюдения наряду со сбором данных, непосредственно характеризующих изучаемый объект, на учет фактов и событий, под влиянием которых осуществляется изменение его состояний. 4. Для обеспечения достоверности статистических данных на стадии статистического наблюдения необходима тщательная проверка качества собираемых фактов. Строгая достоверность его данных- одна их важнейших характеристик статистического наблюдения. Дефекты статистической информации, выражающиеся в ее недостоверности, не могут быть устранены в процессе дальнейшей обработки, поэтому их появление затрудняет принятие научно обоснованных решений и сбалансированность экономики. 5. Статистическое наблюдение должно проводиться на научной основе по заранее разработанным системе, плану и правилам (программе), обеспечивающим строго научное решение всех программно-методологических и организационных вопросов.

Программно-методологическое обеспечение статистического наблюдения.

Подготовка к статистическому наблюдению, обеспечивающая успех дела, предполагает необходимость своевременного решения ряда методологических вопросов, связанных с определением задач, цели, объекта, единицы наблюдения, разработкой программы и инструментария, определением способа сбора статистических данных. Задачи статистического наблюдения непосредственно вытекают из задач статистического исследования и состоят, в частности, в получении массовых данных непосредственно о состоянии изучаемого объекта, в учете состояния явлений, оказывающих влияние на объект, изучении данных о процессе развития явлений. Цели наблюдения определяются, прежде всего, нуждами информационного обеспечения для экономического и социального развития общества. Поставленные перед государственной статистикой цели уточняются и конкретизируются ее руководящими органами, в результате чего определяются направления и масштаб работы. В зависимости от цели решается вопрос об объекте статистического наблюдения, т.е. что именно следует наблюдать. Под объектом понимается совокупность вещественных предметов, предприятий, трудовых коллективов, лиц и т.д., посредством которых осуществляются явления и процессы, подлежащие статистическому исследованию. Объектами наблюдения в зависимости от целей могут выступать, в частности, массы единиц производственного оборудования, продукции, товарно материальных ценностей, населенных пунктов, районов, предприятий, организаций и учреждений различных отраслей народного хозяйства, население и отдельные его категории и т.д. Установление объекта статистического наблюдения связано с определением его границ на основе соответствующего критерия, выраженного некоторым характерным ограничительным признаком, называемым цензом. Выбор ценза оказывает существенное влияние на формирование однородных совокупностей, обеспечивает невозможность смешения различных объектов либо недоучета некоторой части объекта. Сущность объекта статистического наблюдения уясняется полнее при рассмотрении единиц, из которых он состоит: Единицами наблюдения служат первичные элементы объекта статистического наблюдения, являющиеся носителями регистрируемых признаков.

От единицы наблюдения следует отличать отчетную единицу. Отчетной единицей служит такая единица статистического наблюдения, от которой в установленном порядке получают информацию, подлежащую регистрации. В ряде случаев оба понятия совпадают, но нередко они имеют и вполне самостоятельное значение. Учесть все множество признаков, характеризующих объект наблюдения, оказывается невозможным и нецелесообразным, поэтому при разработке плана статистического наблюдения следует тщательно и квалифицированно решать вопрос о составе признаков, подлежащих регистрации в соответствии с поставленной целью. Перечень признаков, формулируемых в виде вопросов, обращаемых к единицам совокупности, на которые должно дать ответ статистическое исследование, представляет собой программу статистического наблюдения.

Чтобы получить исчерпывающую характеристику изучаемого явления, в составе программы должен быть учтен весь круг его существенных признаков. Однако проблематичность практического осуществления этого принципа обусловливает необходимость включения в программу лишь наиболее существенных признаков, выражающих социально-экономические типы явления, его важнейшие черты, свойства и взаимосвязи. Объем программы регламентируется величиной ресурсов, имеющихся в распоряжении статистических органов, сроками получения результатов, требованиями к степени детализации разработок и т.д. Содержание программы определяется характером и свойствами изучаемого объекта, целями и задачами исследования. К числу общих требований к составлению программы относится недопустимость включения в ее состав вопросов, на которые затруднительно получить точные, вполне достоверные ответы, дающие объективную картину той или иной ситуации. При рассмотрении некоторых наиболее важных признаков в состав программы принято включать контрольные вопросы, служащие для согласованности получаемых сведений. Чтобы усилить взаимопроверку вопросов и аналитичность программы наблюдения, взаимосвязанные вопросы располагаются в определенной последовательности, иногда в блоках взаимосвязанных признаков.

Вопросы программы статистического наблюдения должны быть сформулированы четко, ясно, лаконично, не допуская возможности различных их истолкований. В программе нередко приводится перечень возможных вариантов ответов, посредством которых уточняется смысловое содержание вопросов. Методологическое обеспечение статистического наблюдения предполагает, что одновременно с программой наблюдения составляется и программа ее разработки. Задачи исследования формулируются в перечне обобщающих статистических показателей. Эти показатели должны быть получены в результате обработки собранного материала, признаков, с которыми корреспондируется каждый показатель, и макетов статистических таблиц, где представлены результаты обработки первичной информации. Программа разработки, выявляя недостающую информацию, позволяет уточнить программу статистического наблюдения. Проведение статистического наблюдения предполагает необходимость подготовки соответствующего инструментария: формуляров и инструкции по их заполнению. Статистический формуляр - это первичный документ, в котором фиксируются ответы на вопросы программы по каждой из единиц совокупности. Формуляр, таким образом, - это носитель первичной информации. Для всех формуляров характерны некоторые обязательные элементы: содержательная часть, включающая перечень вопросов программы, свободная графа либо несколько граф для записи ответов и шифров (кодов) ответов, титульная и адресная печати. Статистические формуляры в целях обеспечения единства трактовки их содержательной части обычно сопровождаются инструкцией, т.е. письменными указаниями и разъяснениями к заполнению бланков статистического наблюдения. Инструкция разъясняет цель статистического наблюдения, характеризует его объект и единицу, время и продолжительность наблюдения, порядок оформления документации, сроки представления результатов. Однако главное назначение инструкции состоит в разъяснении содержания вопросов программы, как следует давать на них ответы и заполнять формуляр.

Виды и способы статистического наблюдения.

Успех дела сбора качественных и полных исходных данных с учетом требования экономного расходования материальных, трудовых и финансовых ресурсов во многом определяется решением вопроса о выборе вида, способа и организационной формы статистического наблюдения.

Виды статистического наблюдения.

Необходимость выбора того или иного варианта сбора статистических данных, в наибольшей мере соответствующего условиям решаемой задачи, определяется наличием нескольких видов наблюдения, различающихся прежде всего по признаку характера учета фактов во времени. Систематическое наблюдение, осуществляемое непрерывно и обязательно по мере возникновения признаков явления, называется текущим. Текущее наблюдение проводится на основе первичных документов, содержащих информацию, необходимую для достаточно полной характеристики изучаемого явления. Статистическое наблюдение, проводимое через некоторые равные промежутки времени, называется периодическим. Примером может служить перепись населения. Наблюдение, проводимое время от времени, без соблюдения строгой периодичности либо в разовом порядке, называется единовременным. Виды статистического наблюдения дифференцируются с учетом различия информации по признаку полноты охвата совокупности. В связи с этим различают сплошное и не сплошное наблюдения. Сплошным называют наблюдение, учитывающее все без исключения единицы изучаемой совокупности. Не сплошное наблюдение заведомо ориентируется на учет некоторой, как правило, достаточно массовой части единиц наблюдения, позволяющей тем не менее получить устойчивые обобщающие характеристики все статистической совокупности. В статистической практике применяются различные виды не сплошного наблюдения: выборочное, способ основного массива, анкетное и монографическое. Качество не сплошного наблюдения уступает результатам сплошного, однако в ряде случаев статистическое наблюдение вообще оказывается возможным только как не сплошное. Для получения представительной характеристики всей статистической совокупности по некоторой части ее единиц применяют выборочное наблюдение, основанное на научных принципах формирования выборочной совокупности. Случайный характер отбора единиц совокупности гарантирует беспристрастность результатов выборки, предупреждает их тенденциозность. По способу основного массива производится отбор наиболее крупных, наиболее существенных единиц совокупности, преобладающих в общей их массе по изучаемому признаку. Специфическим видом статистического наблюдения служит монографическое описание, представляющее собой детальное обследование отдельного, но весьма типичного объекта, обусловливающего интерес и с точки зрения изучения всей совокупности.

Способы статистического наблюдения.

Дифференциация разновидностей статистического наблюдения возможна также в зависимости от источников и способов получения первичной информации. В связи с этим различают непосредственное наблюдение, опрос и документальное наблюдение. Непосредственным называют наблюдение, осуществляемое путем подсчета, измерения значений признаков, снятия показаний приборов специальными лицами, осуществляющими наблюдениями, иначе говоря- регистраторами. Достаточно часто ввиду невозможности применения иных способов статистическое наблюдение осуществляется путем опроса по некоторому перечню вопросов. Ответы фиксируются в специальном формуляре. В зависимости от способов получения ответов различают экспедиционный и корреспондентский способы, а также способ саморегистрации. Экспедиционный способ опроса осуществляется в устной форме специальным лицом (счетчиком, экспедитором), заполняющим одновременно формуляр или бланк обследования.

Корреспондентский способ опроса организуется путем рассылки статистическими органами бланков обследования некоторому соответствующим образом подготовленному кругу лиц, называемых корреспондентами. Последние обязаны согласно договоренности заполнить бланк и вернуть его в статистическую организацию. Проверка правильности заполнения формуляров имеет место при опросе способом саморегистрации. Опросные листы заполняют, как и при корреспондентском способе, сами опрашиваемые, но их раздачу и сбор, а также инструктаж и контроль правильности заполнения осуществляют счетчики.

Основные организационные формы статистического наблюдения.

Все разнообразие видов и способов наблюдения осуществляется на практике посредством двух основных организационных форм: отчетности и специально организованного наблюдения. Статистическая отчетность - основная форма статистического наблюдения в социальном обществе, охватывающая все предприятия, организации и учреждения производственной и непроизводственной сфер. Отчетность- это систематическое представление в установленные сроки учетно-статистической документации в виде отчетов, всесторонне характеризующих итоги работы предприятий и учреждений в течение отчетных периодов. Отчетность непосредственно связана с первичными и бухгалтерскими учетными документами, базируется на них и представляет собой их систематизацию, т.е. результат обработки и обобщения. Отчетность осуществляется по строго установленной форме, утверждаемой Госкомстатом России. Перечень всех форм с указанием их реквизитов (принадлежностей) называется табелем отчетности. Каждая из форм отчетности должна содержать следующие сведения: наименование; номер и дату утверждения; наименование предприятия, его адрес и подчиненность; адреса, в которые представляется отчетность; периодичность, дату представления, способ передачи; содержательную часть в виде таблицы; должностной состав лиц, ответственных за разработку и достоверность отчетных данных, т.е. обязанных подписать отчет. Многообразие условий производственного процесса в различных отраслях материального производства, специфичность воспроизводственного процесса в локальных условиях, учет значимости тех или иных показателей обусловливают различие видов отчетности. Различают, прежде всего, типовую и специализированную отчетность. Типовая отчетность имеет одинаковую форму и содержание для всех предприятий либо учреждений отрасли народного хозяйства. Специализированная отчетность выражает специфические для отдельных предприятий отрасли моменты. По принципу периодичности отчетность подразделяется на годовую и текущую: квартальную, месячную, двухнедельную, недельную. В зависимости от способа передачи информации различают почтовую и телеграфную отчетность. Статистические переписи служат второй по значению организационной формой статистического наблюдения. Перепись представляет собой специально организованное статистическое наблюдение, направленное на учет численности и состава определенных объектов (явлений), а также установление качественных характеристик их совокупностей на некоторый момент времени. Переписи представляют статистическую информацию, не предусмотренную отчетностью, а в ряде случаев существенно уточняют данные текущего учета.

Для обеспечения высокого качества результатов статистических переписей осуществляется комплекс подготовительных работ. Содержание организационных мероприятий по подготовке переписей, осуществляемых согласно требованиям и правилам статистической науки, излагается в специально разрабатываемом документе, называемом организационном планом статистического наблюдения. В организационном плане должны найти решение вопросы о субъекте (исполнителе) статистического наблюдения, о месте, времени, сроках и порядке проведения, об организации переписных участков, о подборе и подготовке счетных работников, обеспечении их необходимой учетной документацией, о проведении ряда других подготовительных работ и т.д. Субъектом наблюдения выступает организация (учреждение) либо его подразделение, ответственное за наблюдение, организующее его проведение, а также непосредственно выполняющие функции по сбору и обработке статистических данных. Вопрос о месте наблюдения (месте регистрации фактов) возникает преимущественно при проведении статистико-социологических исследований и решается в зависимости от цели исследования.

Время наблюдения представляет собой период времени, в течение которого должна быть начата и завершена работа по регистрации и проверке полученных данных. Время наблюдения выбирается на основе критерия минимальной пространственной мобильности изучаемого объекта. От времени наблюдения следует отличать критический момент, к которому приурочены собранные данные.

Понятие статистического наблюдения - довольно интересная тема для рассмотрения. Статистические наблюдения используются практически везде, где только можно обусловить их применение. Вместе с тем, несмотря на обширную область применения, статистические наблюдения являются довольно-таки сложным предметом и ошибки нередки. Однако в целом статистические наблюдения как предмет для рассмотрения представляют собой большой интерес.

Допущения, воплощенные в статистическом моделировании, описывают набор вероятностных распределений, некоторые из которых, как предполагается, адекватно приближают распределение. Из определения отбирается конкретный набор данных. Распределения вероятностей, присущие статистическому моделированию, - это то, что отличает статистические модели от других, не статистических, математических моделей.

Связь с математикой

Этот научный метод коренится, прежде всего, в математике. Статистическое моделирование систем обычно задается математическими уравнениями, которые связывают одну или несколько случайных величин и, возможно, других неслучайных переменных. Таким образом, статистическая модель является «формальным представлением теории» (Герман Адер, цитируя Кеннета Боллена).

Все статистические проверки гипотез и все статистические оценки получены из статистических моделей. В более общем смысле, статистические модели являются частью основы статистического вывода.

Методы статистического моделирования

Неформально статистическая модель может рассматриваться как статистическое допущение (или набор статистических допущений) с определенным свойством: это допущение позволяет нам вычислять вероятность любого события. В качестве примера рассмотрим пару обычных шестигранных кубиков. Мы будем изучать два различных статистических предположения о кости.

Первое статистическое предположение составляет статистическую модель, потому что только с одним допущением мы можем вычислить вероятность любого события. Альтернативное статистическое допущение не составляет статистической модели, потому что только с одним допущением мы не можем рассчитать вероятность каждого события.

В приведенном выше примере с первым допущением вычислить вероятность события легко. Однако в некоторых других примерах расчет может быть сложным или даже непрактичным (например, это может потребовать миллионов лет вычислений). Для предположения, составляющего статистическую модель, такая трудность является приемлемой: выполнение вычисления не должно быть практически осуществимым, просто теоретически возможным.

Примеры моделей

Предположим, что у нас есть популяция школьников с равномерно распределенными по возрасту детьми. Рост ребенка будет стохастически связан с возрастом: например, когда мы знаем, что ребенку 7 лет, это влияет на вероятность того, что ребенок будет ростом 5 футов (примерно 152 см). Мы могли бы формализовать эту взаимосвязь в модели линейной регрессии, например: рост = b0 + b1agei + εi, где b0 - пересечение, b1 - параметр, на который умножается возраст при получении прогноза роста, εi - термин ошибки. Это подразумевает, что рост предсказывается возрастом с некоторой ошибкой.

Допустимая модель должна соответствовать всем точкам данных. Таким образом, прямая линия (heighti = b0 + b1agei) не может быть уравнением для модели данных - если только она точно не соответствует всем точкам данных, то есть все точки данных идеально лежат на линии. Член ошибки εi должен быть включен в уравнение, чтобы модель соответствовала всем точкам данных.

Чтобы сделать статистический вывод, нам сначала необходимо принять некоторые вероятностные распределения для εi. Например, мы можем предположить, что распределения εi являются Гауссовскими, с нулевым средним параметром. В этом случае модель будет иметь 3 параметра: b0, b1 и дисперсию распределения Гаусса.

Общее описание

Это особый класс математической модели. Что отличает статистическую модель от других математических моделей, так это то, что она недетерминирована. С ее помощью осуществляется моделирование статистических данных. Таким образом, в статистической модели, определенной с помощью математических уравнений, некоторые переменные не имеют конкретных значений, а вместо этого имеют распределения вероятностей; то есть некоторые переменные являются стохастическими. В приведенном выше примере ε является стохастической переменной; без этой переменной модель была бы детерминированной.

Статистические модели часто используются в статистическом анализе и моделировании, даже если моделируемый физический процесс является детерминированным. Например, подбрасывание монет в принципе является детерминированным процессом; все же это обычно моделируется как стохастический (через процесс Бернулли).

Параметрические модели

Являются наиболее часто используемыми статистическими моделями. Что касается полупараметрических и непараметрических моделей, сэр Дэвид Кокс сказал: «Как правило, они включают меньше предположений о структуре и форме распределения, но обычно содержат сильные предположения о независимости». Как и все прочие упомянутые модели, также часто используются в статистическом методе математического моделирования.

Многоуровневые модели

Многоуровневые модели (так же известные, как иерархические линейные модели, модели с вложенными данными, смешанные модели, случайные коэффициенты, модели со случайными эффектами, модели со случайными параметрами или модели с разделением на участки) являются статистическими моделями параметров, которые варьируются на более чем одном уровне. Примером может служить модель успеваемости учащихся, которая содержит показатели для отдельных учащихся, а также показатели для классных комнат, в которые сгруппированы студенты. Эти модели можно рассматривать как обобщения линейных моделей (в частности, линейной регрессии), хотя они также могут распространяться на нелинейные модели. Эти модели стали намного популярнее после того, как стали доступны достаточные вычислительные мощности и программное обеспечение.

Многоуровневые модели особенно подходят для исследовательских проектов, где данные для участников организованы на более чем одном уровне (то есть, вложенные данные). Единицами анализа обычно являются отдельные лица (на более низком уровне), которые вложены в контекстные / совокупные единицы (на более высоком уровне). В то время как самый низкий уровень данных в многоуровневых моделях, как правило, индивидуальный, повторные измерения отдельных лиц также могут быть рассмотрены. Таким образом, многоуровневые модели предоставляют альтернативный тип анализа для одномерного или многомерного анализа повторных измерений. Индивидуальные различия в кривых роста могут быть рассмотрены. Кроме того, многоуровневые модели могут использоваться в качестве альтернативы ANCOVA, где баллы по зависимой переменной корректируются для ковариат (например, индивидуальных различий) перед тестированием различий в лечении. Многоуровневые модели способны анализировать эти эксперименты без предположения об однородности наклонов регрессии, что требуется ANCOVA.

Многоуровневые модели можно использовать для данных со многими уровнями, хотя двухуровневые модели являются наиболее распространенными, и остальная часть этой статьи посвящена только этим. Зависимая переменная должна быть исследована на самом низком уровне анализа.

Выбор модели

Выбор модели - это задача выбора из набора моделей-кандидатов с учетом данных, осуществляемая в рамках статистического моделирования. В простейших случаях рассматривается уже существующий набор данных. Тем не менее задача может также включать планирование экспериментов таким образом, чтобы собранные данные хорошо подходили для задачи выбора модели. Учитывая модели-кандидаты с аналогичной предсказательной или объяснительной силой, простейшая модель, скорее всего, будет лучшим выбором (бритва Оккама).

Представители компании Konishi & Kitagawa заявляют: «Большинство проблем статистического вывода можно считать проблемами, связанными со статистическим моделированием». Аналогичным образом, Кокс сказал: «Как осуществляется перевод предметной проблемы в статистическую модель, часто является наиболее важной частью анализа».

Выбор модели может также относиться к проблеме выбора нескольких репрезентативных моделей из большого набора вычислительных моделей для целей принятия решений или оптимизации в условиях неопределенности.

Графические модели

Графическая модель, или вероятностная графическая модель, (PGM) или структурированная вероятностная модель, - это вероятностная модель, для которой график выражает структуру условной зависимости между случайными величинами. Они обычно используются в теории вероятностей, статистике (особенно в байесовской статистике), и в машинном обучении.

Эконометрические модели

Эконометрические модели - это статистические модели, используемые в эконометрике. Эконометрическая модель определяет статистические отношения, которые, как полагают, существуют между различными экономическими величинами, относящимися к конкретному экономическому явлению. Эконометрическая модель может быть получена из детерминированной экономической модели, учитывающей неопределенность, или из экономической модели, которая сама является стохастической. Тем не менее также можно использовать эконометрические модели, которые не привязаны к какой-либо конкретной экономической теории.

Статистическое моделирование

численный метод решения математических задач, при котором искомые величины представляют вероятностными характеристиками какого-либо случайного явления, это явление моделируется, после чего нужные характеристики приближённо определяют путём статистической обработки «наблюдений» модели. Например, требуется рассчитать потоки тепла в нагреваемой тонкой металлической пластине, на краях которой поддерживается нулевая температура. Распределение тепла описывается тем же уравнением, что и расплывание пятна краски в слое жидкости (см. Теплопроводность , Диффузия). Поэтому моделируют плоское Броуновское движение частиц «краски» по пластине, следя за их положениями в моменты k τ, k = 0, 1, 2,... Приближённо принимают, что за малый интервал τ частица перемещается на шаг h равновероятно во всех направлениях. Каждый раз направление выбирается случайным образом, независимо от всего предыдущего. Соотношение между τ и h определяется коэффициентом теплопроводности. Движение начинается в источнике тепла и кончается при первом достижении края (наблюдается налипание «краски» на край). Поток Q (C) тепла через участок С границы измеряется количеством налипшей краски. При общем количестве N частиц согласно Больших чисел закон у такая оценка даёт случайную относительную ошибку порядка h из-за дискретности выбранной модели).

Искомую величину представляют математическим ожиданием (См. Математическое ожидание) числовой функции f от случайного исхода ω явления: , т. е. интегралом по вероятностной мере Р (см. Мера множества). На оценку , где ω 1 ,..., ω N -смоделированные исходы, можно смотреть как на квадратурную формулу для указанного интеграла со случайными узлами ω k и случайной погрешностью R N обычно принимают , считая большую погрешность пренебрежимо маловероятной; Дисперсия Df может быть оценена в ходе наблюдений (см. Ошибок теория).

В разобранном выше примере f (ω)= 1, когда траектория кончается на С; иначе f (ω) = 0. Дисперсия

Проведение каждого «эксперимента» распадается на две части: «розыгрыш» случайного исхода ω и последующее вычисление функции f (ω). Когда пространство всех исходов и вероятностная мера Р слишком сложны, розыгрыш проводится последовательно в несколько этапов (см. пример). Случайный выбор на каждом этапе проводится с помощью случайных чисел, например генерируемых каким-либо физическим датчиком; употребительна также их арифметическая имитация - псевдослучайные числа (см. Случайные и псевдослучайные числа). Аналогичные процедуры случайного выбора используются в математической статистике и теории игр.

С. м. широко применяется для решения на ЭВМ интегральных уравнений, например при исследовании больших систем (См. Большая система). Они удобны своей универсальностью, как правило, не требуют большого объёма памяти. Недостаток - большие случайные погрешности, слишком медленно убывающие при увеличении числа экспериментов. Поэтому разработаны приёмы преобразования моделей, позволяющие понижать разброс наблюдаемых величин и объём модельного эксперимента.

Лит.: Метод статистических испытаний (Метод Монте-Карло), М., 1962; Ермаков С. М., Метод Монте-Карло и смежные вопросы, М., 1971.

Н. Н. Ченцов.


Большая советская энциклопедия. - М.: Советская энциклопедия . 1969-1978 .

Смотреть что такое "Статистическое моделирование" в других словарях:

    Статистическое и эконометрическое моделирование исследование объектов познания на их статистических моделях; построение и изучение моделей реально существующих предметов, процессов или явлений (например: экономических процессов в… … Википедия

    Статистическое моделирование - способ исследования процессов поведения вероятностных систем в условиях, когда неизвестны внутренние взаимодействия в этих системах. Он заключается в машинной имитации изучаемого процесса, который как бы копируется на… … Экономико-математический словарь

    Метод прикладной и вычислительной математики, состоящий в реализации на ЭВМ специально разрабатываемых стохастич. моделей изучаемых явлений или объектов. Расширение области применения С. м. связано с быстрым развитием техники и особенно… … Математическая энциклопедия

    Моделирование ситуаций с использованием статистических закономерностей, присущих рассматриваемому явлению. Словарь бизнес терминов. Академик.ру. 2001 … Словарь бизнес-терминов

    Моделирование исследование объектов познания на их моделях; построение и изучение моделей реально существующих объектов, процессов или явлений с целью получения объяснений этих явлений, а также для предсказания явлений, интересующих… … Википедия

    МОДЕЛИРОВАНИЕ ИМИТАЦИОННОЕ в социологии - вид моделирования математического, состоящий в воспроизведении на ЭВМ социального процесса либо функционирования социальной системы. Почти всегда предполагает воспроизведение случайных факторов, влияющих на изучаемое явление, и, как следствие,… … Социология: Энциклопедия

    МОДЕЛИРОВАНИЕ, СТАТИСТИЧЕСКОЕ - разработка разнообразных моделей, которые отображают статистические закономерности описываемого объекта, явления. Общей специфической чертой этих моделей является учет случайных возмущений или отклонений. Объектами С.м. являются различные… … Большой экономический словарь

    МОДЕЛИРОВАНИЕ СТАТИСТИЧЕСКОЕ - представление или описание некоторого феномена или системы взаимосвязей между явлениями посредством набора переменных (показателей, признаков) и статистических взаимосвязей между ними. Цель М.С. (как и любого другого моделирования) представить… … Социология: Энциклопедия

    Для улучшения этой статьи желательно?: Исправить статью согласно стилистическим правилам Википедии. Имитационное моделирование (ситуационное … Википедия

    ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ - (...от франц. modele образец) метод исследования каких либо явлений и процессов методом статистических испытаний (метод Монте Карло) с помощью ЭВМ. Метод основан на розыгрыше (имитации) воздействия случайных факторов на изучаемое явление или… … Энциклопедический словарь по психологии и педагогике

Книги

  • Статистическое моделирование. Методы Монте-Карло. Учебное пособие для бакалавриата и магистратуры , Михайлов Г.А.. Учебное пособие посвящено особенностям моделирования случайных величин, процессов и полей. Особое внимание уделяется численному интегрированию, в частности методу Монте-Карло. Дается решение…

Наиболее широкое распространение при построении прогнозов развития в практике коммерческой деятельности получили экономико-статистические модели , которые описывают зависимость исследуемого экономического показателя от одного или нескольких факторов, оказывающих на него существенное влияние.

Закономерности в экономике могут выражаться в виде математических моделей связей и зависимостей экономичес­ких показателей. Такие зависимости и модели получают только путем обработки реальных статистических данных с учетом внутренних механизмов связи и случайных факто­ров. Наличие и качество информационного обеспечения, ре­альные возможности сбора и обработки первичной информа­ции во многом определяют как сферу практического приме­нения статистического моделирования в экономике, так и выбор различных видов прикладных моделей.

Строить экономико-статистические модели и оценивать их параметры, проверять гипотезы о свойствах экономичес­ких показателей и формах их связей помогает математичес­кая статистика - теория обработки и анализа данных. Ее применение в экономике служит основой для экономическо­го анализа и прогнозирования, что в конечном счете создает возможности для принятия обоснованных экономических решений.

Экономические данные обычно делят на два вида: перекрестные данные и временные ряды. Особенности их формирования впоследствии определяют выбор тех или иных методов обработки и анализа данных, построения моделей, отражающих связи и зависимости по­казателей.

Перекрестные данные - это данные по какому-либо эко­номическому показателю, полученные для разных однотип­ных объектов (фирм, регионов, отдельных видов товаров и др.). При этом либо все данные относятся к одному и тому же моменту времени, либо их временная принадлежность несу­щественна. Такие данные особенно ценны при изучении кон­курентных преимуществ экономического объекта, сравни­тельной оценке его эффективности с целью определения ре­ального положения на рынке, а также для выявления об­щей, характерной для всей совокупности отобранных объек­тов, зависимости какого-либо экономического показателя от действия заданных факторов в конкретный момент времени. Примером перекрестных данных может быть набор сведений (объем реализации, количество работников, уровень доходов и т.д.) о разных торговых предприятиях в один и тот же мо­мент времени.

Временные ряды - это данные, характеризующие один и тот же объект, но в различные моменты времени, т.е. в ка­честве признака упорядочения данных в таких рядах берет­ся время. Примером временных рядов могут быть ежеквар­тальные данные об объеме товарооборота, средней заработ­ной плате, данные об инфляции, уровне доходов, затрат за последние несколько лет. Временной ряд, состоящий из n -уровней у 1 , y 2 , …, y n может быть записан в компактной форме: y t , t = 1, 2, ..., n , где t - порядковый номер наблюде­ния.


Основными требованиями, предъявляемыми к исходным данным, являются требования сопоставимости, достаточной представительности для выяв­ления закономерности, однородности и устойчивости. Невы­полнение одного из этих требований делает бессмысленным применение математического аппарата.

Сопоставимость данных достигается в результате одина­кового подхода к наблюдениям на разных этапах формирова­ния ряда динамики. Данные каждого ряда должны выра­жаться в одних и тех же единицах, иметь одинаковый шаг наблюдений, рассчитываться для одного и того же интервала времени, по одной и той же методике, охватывать одни и те же элементы, принадлежащие одной территории, относя­щейся к неизменной совокупности.

Представительность данных характеризуется их полно­той. Достаточное число наблюдений определяется в зависи­мости от цели проводимого исследования. Если целью явля­ется описательный статистический анализ, то в качестве изучаемого интервала времени можно выбрать любой, по своему усмотрению. Если же цель исследования - построе­ние модели динамики, то число уровней исходного динами­ческого ряда должно не меньше, чем в 3 раза превышать пе­риод упреждения прогноза и быть не менее 7. В случае ис­пользования квартальных или помесячных данных для ис­следования сезонности и прогнозирования сезонных процес­сов исходный временной ряд должен содержать квартальные либо помесячные данные не менее, чем за 4 года, даже если требуется прогноз на 1-2 квартала (месяца).

Однородность данных предполагает отсутствие нетипич­ных, аномальных наблюдений, а также изломов сложив­шихся тенденций. Аномальность приводит к смещению оце­нок и, следовательно, к искажению результатов анализа. Изломы тенденций свидетельствуют об измене­нии закономерностей протекания процесса.

Устойчивость данных отражает преобладание законо­мерности над случайностью в изменении уровней ряда. Свойство устойчивости легче всего проследить графически. На графиках устойчивых временных рядов даже визуально прослеживается закономерность, а на графиках неустойчи­вых рядов изменения последовательных уровней представ­ляются хаотичными, и поэтому поиск закономерностей в формировании значений уровней таких рядов лишен смысла.

2 Основные инструменты анализа экономических данных

MS Excel предлагает широкий диапазон средств для изу­чения экономической информации. Множество встроенных статистических функций (СРЗНАЧ, МЕДИАНА, МОДА и др.) используют для проведения несложного анализа дан­ных. Если возможностей встроенных функций недостаточ­но, то обращаются к пакету анализа, который содержит большой набор соответствующих инструментов и значитель­но расширяет аналитические возможности Excel. Его можно использовать для ранжирования данных, извлечения слу­чайных или периодических выборок из набора данных, про­ведения корреляционного анализа, получения основных ста­тистических характеристик для выборки и т.п.

В частности, пакет анализа MS Excel позволяет произвести Описательную статистику , содержащую информацию о центральной тенденции и из­менчивости входных данных.

Инструмент Описательная статистика , имеющийся в па­кете «Анализ данных» MS Excel, предназначен для оценки выборки экономических данных, когда есть необхо­димость проследить характер распределения и оценить меру разброса фактических величин вокруг среднего значения. Описательная статистика предлагает таблицу основных ста­тистических характеристик для одного или нескольких мно­жеств входных значений. Выходной диапазон этого инстру­мента содержит следующие статистические характеристики для каждой переменной из входного диапазона: среднее, стандартная ошибка, медиана, мода, стандартное отклоне­ние, дисперсия, коэффициент эксцесса, коэффициент асим­метрии, размах (интервал), максимальное значение, мини­мальное значение, сумма, число значений, k -e наибольшее и наименьшее значения (для любого заданного значения k ) и уровень значимости (надежности) для среднего.

Среднее значение (у ср ) является основной характеристи­кой центра распределения. Для него характерно то, что все отклонения от него (положительные и отрицательные) в сум­ме равняются нулю. Excel вычисляет среднее значение по средней арифметической, суммируя ряд данных с последую­щим делением результата на количество значений ряда.

Стандартная ошибка оценивает меру ошибки рассчитан­ного на основе сформированной выборки среднего значения и снижается при увеличении массива отобранных данных.

Стандартное отклонение и дисперсия выборки являют­ся статистическими характеристиками изменчивости (раз­броса) множества измерений. Стандартное отклонение - это квадратный корень из дисперсии. Как правило, приблизи­тельно 68 % значений случайной величины, имеющей нор­мальное распределение, находятся в пределах одного стан­дартного отклонения от среднего и около 95 % - в пределах двух. Большое стандартное отклонение указывает на то, что значения сильно разбросаны относительно среднего, а ма­лое - на то, что значения сосредоточены около среднего.

Размах (интервал) есть разность между максимальным и минимальным значениями ряда данных, т.е. длина интерва­ла, которому принадлежат все данные выборки. Чем больше эта длина, тем более рассеяна кривая распределения, тем больше колеблемость изучаемого признака.

Минимум характеризует наименьшее значение во вход­ном диапазоне данных.

Максимум отражает наибольшее значение во входном диапазоне данных.

Мода (Мо ) определяет значение, которое чаще других встречается в массиве данных.

Медиана (Me ) - это значение, разделяющее заданное множество данных (выборку) на две равные части, т.е. поло­вина чисел оказывается больше и половина - меньше меди­аны. Если количество данных четное, то значение медианы равно среднему из двух чисел, находящихся в середине мно­жества.

Соотношение среднего значения, моды и медианы указы­вает на характер распределения изучаемого признака в сово­купности, позволяет оценить его асимметрию. В симметрич­ных распределениях все три характеристики совпадают. Чем больше расхождение между модой и средним значени­ем, тем более асимметричен ряд.

Оценку отклонения фактического распределения каждо­го набора входных данных (выборки) от нормального распре­деления проводят также с помощью коэффициентов асим­метрии и эксцесса . Для нормального распределения асим­метрия и эксцесс равны нулю. При отклонении от нормаль­ного распределения асимметрия положительна, если «длин­ная» и более пологая часть кривой распределения располо­жена справа от точки на оси абсцисс, соответствующей моде. Для правосторонней асимметрии характерно неравенство Mo. Если «длинная» и более пологая часть кривой расположена слева от моды, то асимметрия отрицательна. Для левосторонней асимметрии показатели центра имеют со­отношение Mo>Me>у ср . Принято считать, что асимметрия выше 0,5 (независимо от знака) считается значительной; если она меньше 0,25 - незначительной. Эксцесс характеризу­ет «крутизну» подъема кривой распределения по сравнению с нормальной кривой: если эксцесс положителен, то кривая имеет более высокую и острую вершину; в случае отрица­тельного эксцесса сравниваемая кривая имеет более низкую и пологую вершину. Наличие значительного отрицательного эксцесса может указывать на качественную неоднородность исследуемой совокупности.

Увеличение количества наблюдений и соответственно размера совокупности данных значительно повышает прак­тическую ценность проводимого на основе Описательной статистики исследования. Поэтому широкое применение этот инструмент анализа находит при проведении экономи­ческих исследований территориального и отраслевого мас­штаба, когда требуются расчет и оценка статистических ха­рактеристик множества различных экономических показа­телей на основе больших массивов данных по каждому их них.

3 Применение корреляционного анализа для решения экономических задач

Любая экономическая политика заключается в регулиро­вании определенных экономических параметров и поэтому должна основываться на знании того, как эти параметры влияют на другие составляющие экономической среды.

Связь одного из показателей с другими описывается с по­мощью функций одной у = f(x) или нескольких у = f(x 1 , х 2 , …, х n) переменных.

На исследуемый показатель, кроме явно учитываемых объясняющих признаков, влияет еще множество других факторов, существующих в действи­тельности, но не учитываемых явно в модели. Большинство этих факторов - случайные, незначимые или не поддающи­еся количественному выражению, но они приводят к вариации реальных данных, их несовпадению с величинами, рас­считанными по формуле связи переменной с объясняющими признаками. Это обусловливает стохастическую природу как экономических показателей, так и взаимосвязей между ними. Стохастические взаимосвязи экономических перемен­ных можно описать с помощью так называемых корреляци­онных характеристик.

Корреляционный анализ – это раздел математической статистики, посвященный изучению взаимосвязей между случайными величинами. Аппарат корреляционного анализа объединяет специальные статистические методы и, соот­ветственно, показатели, значения которых определенным образом (и с определенной вероятностью) свидетельствуют о присутствии или отсутствии связи между перемен­ными.

Основной целью корреляционного анализа является уста­новление характера влияния факторной переменной на ис­следуемый показатель и определение тесноты их связи с тем, чтобы с достаточной степенью надежности строить модель развития исследуемого показателя.

Учитывая то обстоятель­ство, что на любой результирующий экономический показа­тель оказывает воздействие множество факторов, важно гра­мотно и обоснованно подойти к выбору наиболее значимых из них. От правильности сделанного выбора во многом будет зависеть и достоверность полученных на основе построенной модели прогнозов.

Предварительный отбор факторов для корреляционного анализа производится логически на основе содержательных экономических оценок. При этом все факторы, воздействую­щие на исследуемый показатель, подразделяются на два ви­да - формализуемые и неформализуемые. Формализуемые факторы допускают аналитический расчет с использовани­ем экономико-математических методов по определенным ал­горитмам с применением вычислительной техники или без нее. Именно такие факторы могут быть отобраны для корре­ляционного анализа. Неформализуемые факторы не подда­ются количественному измерению и поэтому включить их в экономико-математическую модель не представляется воз­можным. К ним относятся политические, моральные, эти­ческие факторы, социально-психологические мотивы, при­вычки, традиции, опыт и др.

Поскольку корреляционная связь с достаточной вырази­тельностью и полнотой проявляется только в массе наблюде­ний, объем выборки данных должен быть достаточно боль­шим. В условиях нестабильности экономики построение длинных динамических рядов на основе годовых данных представляется нецелесообразным вследствие несопостави­мости условий функционирования экономического объекта (в том числе и торгового предприятия). Поэтому число наб­людений можно увеличить за счет данных о динамике иссле­дуемых показателей по кварталам и месяцам.

С технической точки зрения проведение корреляционно­го анализа сводится к расчету коэффициентов парной корре­ляции, значения которых помогут судить о характере и тес­ноте связи между исследуемым показателем и каждой отоб­ранной факторной переменной.

Коэффициент парной корреляции используется в качес­тве меры, характеризующей степень линейной связи двух переменных. Значение коэффициента корреляции лежит в интервале от -1 (в случае строгой линейной отрицательной связи) до +1 (в случае строгой линейной положительной связи). Соответ­ственно, положительное значение коэффициента корреля­ции свидетельствует о прямой связи между исследуемым и факторным показателем, а отрицательное - об обратной. Чем ближе значение коэффициента корреляции к 1, тем тес­нее связь. Качественно оценить тесноту связи позволяет спе­циальная шкала значений коэффициентов корреляции, раз­работанная профессором Колумбийского университета США Чеддоком (таблица 3.1).

Таблица 3.1 - Оценка тесноты связи двух переменных на основе коэффициента корреляции

Вам также будет интересно:

Какая сумма считается взяткой?
Взяточничество – социальное явление, которое известно обществу еще с древних времен....
Порядок, условия и сроки выдачи банковских гарантий Что влияет на стоимость банковской гарантии
Выдана на несколько лет. Получение банковской гарантии связано с участием организации в...
Какие бывают тендеры: как не запутаться новичку
Город Москва - субъект Российской Федерации, входящий в состав Центрального Федерального...
Реестры банковских гарантий Еис банковская гарантия
Банковская гарантия - это кредитный продукт, который весьма востребован участниками...
Осетины - боллоев таймураз
В массовом сознании сегодня все прочней укрепляется понятие об «экономическом феномене...