Преобразования случайных величин

По каждой случайной величине Х определяют еще три величины – центрированную Y , нормированную V и приведенную U . Центрированная случайная величина Y – это разность между данной случайной величиной Х и ее математическим ожиданием М(Х), т.е. Y = Х – М(Х). Математическое ожидание центрированной случайной величины Y равно 0, а дисперсия – дисперсии данной случайной величины: М(Y ) = 0, D (Y ) = D (X ). Функция распределения F Y (x ) центрированной случайной величины Y связана с функцией распределения F (x ) исходной случайной величины X соотношением:

F Y (x ) = F (x + M (X )).

Для плотностей этих случайных величин справедливо равенство

f Y (x ) = f (x + M (X )).

Нормированная случайная величина V – это отношение данной случайной величины Х к ее среднему квадратическому отклонению , т.е. . Математическое ожидание и дисперсия нормированной случайной величины V выражаются через характеристики Х так:

,

где v – коэффициент вариации исходной случайной величины Х . Для функции распределения F V (x ) и плотности f V (x ) нормированной случайной величины V имеем:

где F (x ) – функция распределения исходной случайной величины Х , а f (x ) – ее плотность вероятности.

Приведенная случайная величина U – это центрированная и нормированная случайная величина:

.

Для приведенной случайной величины

Нормированные, центрированные и приведенные случайные величины постоянно используются как в теоретических исследованиях, так и в алгоритмах, программных продуктах, нормативно-технической и инструктивно-методической документации. В частности, потому, что равенства позволяют упростить обоснования методов, формулировки теорем и расчетные формулы.

Используются преобразования случайных величин и более общего плана. Так, если Y = aX + b , где a и b – некоторые числа, то

Пример 7. Если то Y – приведенная случайная величина, и формулы (8) переходят в формулы (7).

С каждой случайной величиной Х можно связать множество случайных величин Y , заданных формулой Y = aX + b при различных a > 0 и b . Это множество называют масштабно-сдвиговым семейством , порожденным случайной величиной Х . Функции распределения F Y (x ) составляют масштабно сдвиговое семейство распределений, порожденное функцией распределения F (x ). Вместо Y = aX + b часто используют запись

Число с называют параметром сдвига, а число d - параметром масштаба. Формула (9) показывает, что Х – результат измерения некоторой величины – переходит в У – результат измерения той же величины, если начало измерения перенести в точку с , а затем использовать новую единицу измерения, в d раз большую старой.

Для масштабно-сдвигового семейства (9) распределение Х называют стандартным. В вероятностно-статистических методах принятия решений и других прикладных исследованиях используют стандартное нормальное распределение, стандартное распределение Вейбулла-Гнеденко, стандартное гамма-распределение и др. (см. ниже).

Применяют и другие преобразования случайных величин. Например, для положительной случайной величины Х рассматривают Y = lg X , где lg X – десятичный логарифм числа Х . Цепочка равенств

F Y (x) = P(lg X < x) = P(X < 10 x) = F(10 x)

связывает функции распределения Х и Y .

Центрированной случайной величиной, соответствующей СВ X называется разность между случайной величиной X и ее математическим ожиданием

Случайная величина называется нормированной , если ее дисперсия рана 1. Центрированная и нормированная случайная величина называетсястандартной .

Стандартная случайная величина Z , соответствующая случайной величинеX находится по формуле:

(1.24)

1.2.5. Другие числовые характеристики

Мода дискретной СВ X определяется как такое возможное значениеx m , для которого

Модой непрерывной СВ X называется действительное число M 0 (X ), определяемое как точка максимума плотности распределения вероятностей f (x ).

Таким образом, мода СВ X есть ее наиболее вероятное значение, если такое значение единственно. Мода может не существовать, иметь единственное значение (унимодальное распределение) или иметь несколько значений (мультимодальное распределение).

Медианой непрерывной СВ X называется действительное числоM D (X ), удовлетворяющее условию

Так как данное уравнение может иметь множество корней, то медиана определяется, вообще говоря, неоднозначно.

Начальным моментом m -го порядка СВ X (если он существует) называется действительное число m , определяемое по формуле

(1.27)

Центральным моментом m-го порядка СВ X (если он существует) называется число m , определяемое по формуле

(1.28)

Математическое ожидание СВ X есть ее первый начальный момент, а дисперсия – второй центральный.

Среди моментов высших порядков особое значение имеют центральные моменты 3-го и 4-го порядков.

Коэффициентом асимметрии ("скошенности") А(X ) называется величина

Коэффициентом эксцесса ("островершинности") E(X ) СВ X называется величина

1.3. Некоторые законы распределения дискретных случайных величин

1.3.1. Геометрическое распределение

Дискретная СВ X имеет геометрическое распределение, если ее возможным значениям 0, 1, 2, …,m , … соответствуют вероятности, вычисляемые по формуле

где 0 < p < 1,q = 1 –p .

На практике геометрическое распределение встречается, когда производится ряд независимых попыток достигнуть какого-то результата А и вероятность появления событияА в каждой попыткеP (A ) =P . СВX – число бесполезных попыток (до первого опыта, в котором появится событиеА ), имеет геометрическое распределение с рядом распределения:

x i

p i

q 2 p

q m p

и числовыми характеристиками:

(1.30)

1.3.2. Гипергеометрическое распределение

Дискретная СВ X с возможными значениями 0, 1, …,m , …,M имеет гипергеометрическое распределение с параметрамиN ,M ,n , если

(1.31)

где M N ,m n ,n N ,m ,n ,N ,M – натуральные числа.

Гипергеометрическое распределение возникает в случаях, подобных следующему: имеется N объектов, из которыхM обладают определенным признаком. Из имеющихсяN объектов наудачу выбираютсяn объектов.

СВ X число объектов с указанным признаком среди выбираемых, распределена по гипергеометрическому закону.

Гипергеометрическое распределение используется, в частности, при решении задач, связанных с контролем качества продукции.

Математическое ожидание случайной величины, имеющей гипергеометрическое распределение, равно:

(1.32)

Разность между случайной величиной и ее математическим ожиданием называется отклонением или центрированной случайной величиной :

Ряд распределения центрированной случайной величины имеет вид:

X М(Х)

х 1 М(Х)

х 2 М(Х)

х n М(Х)

р 1

p 2

р n

Свойства центрированной случайной величины:

1. Математическое ожидание отклонения равно 0:

2. Дисперсия отклонения случайной величины Х от ее математического ожидания равна дисперсии самой случайной величины Х:

Другими словами, дисперсия случайной величины и дисперсия ее отклонения равны между собой.

4.2. Если отклонение Х М(Х) разделить на среднее квадратическое отклонение (Х) , то получим безразмерную центрированную случайную величину, которая называется стандартной (нормированной) случайной величиной :

Свойства стандартной случайной величины:

    Математическое ожидание стандартной случайной величины равно нулю: M (Z ) =0.

    Дисперсия стандартной случайной величины равна 1: D (Z ) =1.

    ЗАДАЧИ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ

    В лотерее на 100 билетов разыгрываются две вещи, стоимости которых 210 и 60 у.е. Составьте закон распределения суммы выигрыша для лица, имеющего: а) 1 билет, б) 2 билета. Найдите числовые характеристики.

    Два стрелка стреляют по мишени один раз. Случайная величина Х – число очков, выбиваемых при одном выстреле первым стрелком, – имеет закон распределения:

Z – суммы очков, выбиваемых обоими стрелками. Определить числовые характеристики.

    Два стрелка стреляют по своей мишени, делая независимо друг от друга по одному выстрелу. Вероятность попадания в мишень для первого стрелка равна 0,7, для второго – 0,8. Случайная величина Х 1 – число попаданий первого стрелка, Х 2  число попаданий второго стрелка. Найти закон распределения: а) общего числа попаданий; б) случайной величины Z =3Х 1  2Х 2 . Определить числовые характеристики общего числа попаданий. Проверить выполнение свойств математического ожидания и дисперсии: M (3 X 2 Y )=3 M (X ) 2 M (Y ), D (3 X 2 Y )=9 D (X )+4 D (Y ).

    Случайная величина Х – выручка фирмы – имеет закон распределения:

Найти закон распределения для случайной величины Z – прибыли фирмы. Определить ее числовые характеристики.

    Случайные величины Х и У независимы и имеют один и тот же закон распределения:

Значение

Одинаковые ли законы распределения имеют случайные величины 2 Х и Х + У ?

    Доказать, что математическое ожидание стандартной случайной величины равно нулю, а дисперсия равна 1.

имеет дисперсию равную 1 и математическое ожидание равное 0.

Нормированная случайная величина V – это отношение данной случайной величины X к ее среднему квадратичному отклонению σ

Среднее квадратичное отклонение – это квадратный корень из дисперсии

Математическое ожидание и дисперсия нормированной случайной величины V выражаются через характеристики X так:

MV= M(X)σ=1v, DV= 1,

где v – коэффициент вариации исходной случайной величины X.

Для функции распределения F V (x) и плотности распределения f V (x) имеем:

F V (x) = F(σx), f V (x) = σf(σx),

где F(x) – функция распределения исходной случайной величины Х , а f(x) – ее плотность вероятности.

Коэффициент корреляции.

Коэффициент корреляции – это показатель характера взаимного стохастического влияния изменения двух случайных величин. Коэффициент корреляции может принимать значения от -1 до +1. Если значение по модулю находится ближе к 1, то это означает наличие сильной связи, а если ближе к 0 –связь отсутствует или является существенно нелинейной. При коэффициенте корреляции равном по модулю единице говорят о функциональной связи (а именно линейной зависимости), то есть изменения двух величин можно описать линейной функцией.

Процесс называется стохастическим , если он описывается случайными переменными, значение которых меняется во времени.

Коэффициент корреляции Пирсона.

Для метрических величин применяется коэффициент корреляции Пирсона, точная формула которого была выведена Френсисом Гамильтоном. Пусть X и Y – две случайные величины, определенные на одном вероятностном пространстве. Тогда их коэффициент корреляции задается формулой:

Неравенства Чебышева.

Неравенство Маркова.

Неравенство Маркова в теории вероятностей даёт оценку вероятности, что случайная величина превзойдёт по модулю фиксированную положительную константу, в терминах её математического ожидания. Получаемая оценка обычно достаточно груба. Однако, она позволяет получить определённое представление о распределении, когда последнее не известно явным образом.

Пусть случайная величина определена на вероятностном пространстве , и её математическое ожидание конечно. Тогда

,

где a > 0.

Неравенство Чебышёва - Бьенеме.

Если E < ∞ (E – математическое ожидание), то для любого , справедливо

Закон больших чисел.

Закон больших чисел утверждает, что эмпирическое среднее (среднее арифметическое) достаточно большой конечной выборки из фиксированного распределения близко к теоретическому среднему (математическому ожиданию) этого распределения. В зависимости от вида сходимости различают слабый закон больших чисел, когда имеет место сходимость по вероятности, и усиленный закон больших чисел, когда имеет место сходимость почти всюду.



Всегда найдётся такое количество испытаний, при котором с любой заданной наперёд вероятностью частота появления некоторого события будет сколь угодно мало отличаться от его вероятности. Общий смысл закона больших чисел - совместное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая.

Слабый закон больших чисел.

Тогда Sn P M(X).

Усиленный закон больших чисел.

Тогда Sn→M(X) почти наверное.

Кроме характеристик положения – средних, типичных значений случайной величины, - употребляется еще ряд характеристик, каждая из которых описывает то или иное свойство распределения. В качестве таких характеристик чаще всего применяются так называемые моменты.

Понятие момента широко применяется в механике для описания распределения масс (статические моменты, моменты инерции и т.д.). Совершенно теми же приемами пользуются в теории вероятностей для описания основных свойств распределения случайной величины. Чаще всего применяются на практике моменты двух видов: начальные и центральные.

Начальным моментом s-го порядка прерывной случайной величины называется сумма вида:

. (5.7.1)

Очевидно, это определение совпадает с определением начального момента порядка s в механике, если на оси абсцисс в точках сосредоточены массы .

Для непрерывной случайной величины Х начальным моментом s-го порядка называется интеграл

. (5.7.2)

Нетрудно убедиться, что введенная в предыдущем n° основная характеристика положения – математическое ожидание – представляет собой не что иное, как первый начальный момент случайной величины .

Пользуясь знаком математического ожидания, можно объединить две формулы (5.7.1) и (5.7.2) в одну. Действительно, формулы (5.7.1) и (5.7.2) по структуре полностью аналогичны формулам (5.6.1) и (5.6.2), с той разницей, что в них вместо и стоят, соответственно, и . Поэтому можно написать общее определение начального момента -го порядка, справедливое как для прерывных, так и для непрерывных величин:

, (5.7.3)

т.е. начальным моментом -го порядка случайной величины называется математическое ожидание -й степени этой случайной величины.

Перед тем, как дать определение центрального момента, введем новое понятие «центрированной случайной величины».

Пусть имеется случайная величина с математическим ожиданием . Центрированной случайной величиной, соответствующей величине , называется отклонение случайной величины от её математического ожидания:

Условимся в дальнейшем везде обозначать центрированную случайную величину, соответствующую данной случайной величине, той же буквой со значком наверху.

Нетрудно убедиться, что математическое ожидание центрированной случайной величины равно нулю. Действительно, для прерывной величины

аналогично и для непрерывной величины.

Центрирование случайной величины, очевидно, равносильно переносу начала координат в среднюю, «центральную» точку, абсцисса которой равна математическому ожиданию.

Моменты центрированной случайной величины носят название центральных моментов. Они аналогичны моментам относительно центра тяжести в механике.

Таким образом, центральным моментом порядка s случайной величины называется математическое ожидание -й степени соответствующей центрированной случайной величины:

, (5.7.6)

а для непрерывной – интегралом

. (5.7.8)

В дальнейшем в тех случаях, когда не возникает сомнений, к какой случайной величине относится данный момент, мы будем для краткости вместо и писать просто и .

Очевидно, для любой случайной величины центральный момент первого порядка равен нулю:

, (5.7.9)

так как математическое ожидание центрированной случайной величины всегда равно нулю.

Выведем соотношения, связывающие центральные и начальные моменты различных порядков. Вывод мы проведем только для прерывных величин; легко убедится, что точно те же соотношения справедливы и для непрерывных величин, если заменить конечные суммы интегралами, а вероятности – элементами вероятности.

Рассмотрим второй центральный момент:

Аналогично для третьего центрального момента получим:

Выражения для и т.д. могут быть получены аналогичным путем.

Таким образом, для центральных моментов любой случайной величины справедливы формулы:

(5.7.10)

Вообще говоря, моменты могут рассматриваться не только относительно начала координат (начальные моменты) или математического ожидания (центральные моменты), но и относительно произвольной точки :

. (5.7.11)

Однако центральные моменты имеют перед всеми другими преимущество: первый центральный момент, как мы видели, всегда равен нулю, а следующий за ним, второй центральный момент при этой системе отсчета имеет минимальное значение. Докажем это. Для прерывной случайной величины при формула (5.7.11) имеет вид:

. (5.7.12)

Преобразуем это выражение:

Очевидно, эта величина достигает своего минимума, когда , т.е. когда момент берется относительно точки .

Из всех моментов в качестве характеристик случайной величины чаще всего применяются первый начальный момент (математическое ожидание) и второй центральный момент .

Второй центральный момент называется дисперсией случайной величины. Ввиду крайней важности этой характеристики среди других моментов введем для нее специальное обозначение :

Согласно определению центрального момента

, (5.7.13)

т.е. дисперсией случайной величины Х называется математическое ожидание квадрата соответствующей центрированной величины.

Заменяя в выражении (5.7.13) величину её выражением, имеем также:

. (5.7.14)

Для непосредственного вычисления дисперсии служат формулы:

, (5.7.15)

(5.7.16)

Соответственно для прерывных и непрерывных величин.

Дисперсия случайной величины есть характеристика рассеивания, разбросанности значений случайной величины около её математического ожидания. Само слово «дисперсия» означает «рассеивание».

Если обратиться к механической интерпретации распределения, то дисперсия представляет собой не что иное, как момент инерции заданного распределения масс относительно центра тяжести (математического ожидания).

Дисперсия случайной величины имеет размерность квадрата случайной величины; для наглядной характеристики рассеивания удобнее пользоваться величиной, размерность которой совпадает с размерностью случайной величины. Для этого из дисперсии извлекают квадратный корень. Полученная величина называется средним квадратическим отклонением (иначе – «стандартом») случайной величины . Среднее квадратическое отклонение будем обозначать :

, (5.7.17)

Для упрощения записей мы часто будем пользоваться сокращенными обозначениями среднего квадратического отклонения и дисперсии: и . В случае, когда не возникает сомнения, к какой случайной величине относятся эти характеристики, мы будем иногда опускать значок х у и и писать просто и . Слова «среднее квадратическое отклонение» иногда будем сокращенно заменять буквами с.к.о.

На практике часто применяется формула, выражающая дисперсию случайной величины через её второй начальный момент (вторая из формул (5.7.10)). В новых обозначениях она будет иметь вид:

Математическое ожидание и дисперсия (или среднее квардратическое отклонение ) – наиболее часто применяемые характеристики случайной величины. Они характеризуют наиболее важные черты распределения: его положение и степень разбросанности. Для более подробного описания распределения применяются моменты высших порядков.

Третий центральный момент служит для характеристики асимметрии (или «скошенности») распределения. Если распределение симметрично относительно математического ожидания (или, в механической интерпретации, масса распределена симметрично относительно центра тяжести), то все моменты нечетного порядка (если они существуют) равны нулю. Действительно, в сумме

при симметричном относительно законе распределения и нечетном каждому положительному слагаемому соответствует равное ему по абсолютной величине отрицательное слагаемое, так что вся сумма равна нулю. То же, очевидно, справедливо и для интеграла

,

который равен нулю, как интеграл в симметричных пределах от нечетной функции.

Естественно поэтому в качестве характеристики асимметрии распределения выбрать какой-либо из нечетных моментов. Простейший из них есть третий центральный момент. Он имеет размерность куба случайной величины: чтобы получить безразмерную характеристику, третий момент делят на куб среднего квадратического отклонения. Полученная величина носит название «коэффициент асимметрии» или просто «асимметрии»; мы обозначим её :

На рис. 5.7.1 показано два асимметричных распределения; одно из них (кривая I) имеет положительную асимметрию (); другое (кривая II) – отрицательную ().

Четвертый центральный момент служит для характеристики так называемой «крутости», т.е. островершинности или плосковершинности распределения. Эти свойства распределения описываются с помощью так называемого эксцесса. Эксцессом случайной величины называется величина

Число 3 вычитается из отношения потому, что для весьма важного и широко распространенного в природе нормального закона распределения (с которым мы подробно познакомимся в дальнейшем) . Таки образом, для нормального распределения эксцесс равен нулю; кривые, более островершинные по сравнении с нормальной, обладают положительным эксцессом; кривые более плосковершинные – отрицательным эксцессом.

На рис. 5.7.2 представлены: нормальное распределение (кривая I), распределение с положительным эксцессом (кривая II) и распределение с отрицательным эксцессом (кривая III).

Кроме рассмотренных выше начальных и центральных моментов, на практике иногда применяются так называемые абсолютные моменты (начальные и центральные), определяемые формулами

Очевидно, абсолютные моменты четных порядков совпадают с обычными моментами.

Из абсолютных моментов наиболее часто применяется первый абсолютный центральный момент

, (5.7.21)

называемый средним арифметическим отклонением. Наряду с дисперсией и средним квадратическим отклонением среднее арифметическое отклонение иногда применяется как характеристика рассеивания.

Математическое ожидание, мода, медиана, начальные и центральные моменты и, в частности, дисперсия, среднее квадратическое отклонение, асимметрия и эксцесс представляют собой наиболее употребительные числовые характеристики случайных величин. Во многих задачах практики полная характеристика случайной величины – закон распределения – или не нужна, или не может быть получена. В этих случаях ограничиваются приблизительным описанием случайной величины с помощь. Числовых характеристик, каждая из которых выражает какое-либо характерное свойство распределения.

Очень часто числовыми характеристиками пользуются для приближенной замены одного распределения другим, причем обычно стремятся произвести эту замену так, чтобы сохранились неизменными несколько важнейших моментов.

Пример 1. Производится один опыт, в результате которого может появиться или не появиться событие , вероятность которого равна . Рассматривается случайная величина – число появлений события (характеристическая случайная величина события ). Определить её характеристики: математическое ожидание, дисперсию, среднее квадратическое отклонение.

Решение. Ряд распределения величины имеет вид:

где - вероятность непоявления события .

По формуле (5.6.1) находим математическое ожидание величины :

Дисперсию величины определяем по формуле (5.7.15):

(Предлагаем читателю получить тот же результат, выразив дисперсию через второй начальный момент).

Пример 2. Производится три независимых выстрела по мишени; вероятность попадания при каждом выстреле равна 0,4. случайная величина – число попаданий. Определить характеристики величины – математическое ожидание, дисперсию, с.к.о., асимметрию.

Решение. Ряд распределения величины имеет вид:

Вычисляем числовые характеристики величины :

Заметим, что те же характеристики могли бы быть вычислены значительно проще с помощью теорем о числовых характеристиках функций (см. главу 10).