Estimates, IQR, MAD, SD, D, BB, ATR, Range, Giga
https://giga.chat/link/gcsQWGHAdu
Сенситивные оценки:
Сенситивные оценки чувствительны к экстремальным значениям и выбросам в данных.
Примером такой оценки является среднее арифметическое:
Среднее арифметическое изменяется при изменении любого элемента выборки,
особенно если появляются крайние значения (выбросы).
Это делает его удобным для однородных данных, но уязвимым к внешним воздействиям.
Резистивные оценки:
Резистивные оценки устойчивы к экстремальным значениям и аномалиям.
Ярким представителем является медианное значение:
Медианное значение нечувствительно к выбросам,
так как оно располагается посередине упорядоченного ряда данных.
Это делает медианы полезными в задачах с сильными выбросами или ассиметричностью данных.
Отличия:
- Среднее арифметическое: Чувствительно к выбросам,
- может давать некорректные оценки при наличии экстремальных значений.
- Медиана: Устойчива к выбросам, сохраняет стабильность при сильных изменениях данных.
Применение:
- Среднее арифметическое: Рекомендуется для нормально распределённых данных или однородных выборок.
- Медиана: Подходит для данных с выбросами, асимметрии или неравномерности.
Таким образом,
выбор между сенситивными и резистивными оценками зависит от характера данных и поставленных задач.
1. Дисперсия ():
Дисперсия — это мера рассеяния данных вокруг среднего значения.
Она показывает, насколько данные варьируют относительно центра распределения.
Формула для дисперсии:
Где:
- — индивидуальное значение.
- — среднее значение.
- — количество элементов.
2. Среднеквадратичное отклонение (СКО, Standard Deviation, SD):
СКО — это квадратный корень из дисперсии.
Оно представляет меру разброса данных в удобных единицах измерения (таких же, как и исходные данные).
Формула для СКО:
Тип оценок:
Оба показателя (дисперсия и СКО) являются сенситивными оценками,
так как они чувствительны к выбросам и сильным изменениям в данных.
Например, появление экстремальных значений резко увеличит дисперсию и СКО.
Применение:
- Дисперсия: Используется для анализа вариабельности данных, часто применяется в статистическом анализе и математике.
- СКО: Популярный показатель в повседневной жизни и науке, так как он отображает размах данных в удобной форме.
Таким образом,
оба показателя (дисперсия и СКО) играют важную роль в понимании поведения случайных
величин и принадлежности к классу сенситивных оценок.
---
1. Bollinger Bands (Полосы Боллинджера):
Полосы Боллинджера строятся на основе средней линии (чаще всего SMA — Simple Moving Average)
и двух линий, расположенных на расстоянии k стандартных отклонений (СКО) от неё.
Формула верхней полосы:
Где:
- — средняя линия.
- — стандартное отклонение (СКО).
- — множитель (обычно 2).
Поскольку полосы Боллинджера основаны на стандартном отклонении,
они являются сенситивной оценкой, чувствительной к выбросам и экстремальным значениям.
2. Average True Range (ATR):
Average True Range измеряет истинный диапазон изменения цены за определенный период.
Формула ATR:
Или:
Где:
- — максимальная цена периода.
- — минимальная цена периода.
- — абсолютная разница между ценами.
Поскольку ATR использует абсолютные разницы,
он менее чувствителен к выбросам и крупным скачкам цен, что делает его резистивной оценкой.
Третья оценка:
Ты упомянул третью оценку, основанную на линейных разницах и абсолютных величинах.
Вероятно, ты говоришь о Mean Absolute Deviation (MAD) — среднее абсолютное отклонение.
MAD вычисляется так:
Где:
- — абсолютная разница между элементами и средним значением.
MAD также является резистивной оценкой, так как он устойчив к выбросам и колебаниям данных.
Вывод:
- Bollinger Bands (BB) — сенситивная оценка, основанная на СКО.
- ATR и MAD — резистивные оценки, устойчивые к выбросам и большим колебаниям.
Таким образом, оба индикатора технического анализа занимают разное место в классификации оценок,
что позволяет использовать их совместно для более комплексного анализа рынка.
-----
1. Interquartile Range (IQR):
IQR — это разность между третьим квартилем (Q3) и первым квартилем (Q1):
IQR устойчив к выбросам и хорошо отражает центральный разброс данных.
2. Range (Размах):
Простейшая оценка размаха — это разница между максимальным и минимальным значениями:
Однако она очень чувствительна к выбросам.
3. Winsorized Variance:
Это модификация обычной дисперсии,
где верхние и нижние проценты данных замещаются граничными значениями.
Winsorized variance менее подвержена воздействию выбросов.
4. Trimmed Mean (Обрезанная средняя):
Это аналогичная модификация среднего значения,
где самые высокие и низкие значения отбрасываются, а оставшаяся часть усредняется.
Trimmed mean также устойчива к выбросам.
5. Median Absolute Deviation (MAD):
Мы уже говорили о нём раньше, но MAD стоит повторить,
так как он является чрезвычайно устойчивой мерой разброса:
6. Robust Scaler:
Некоторые трансформации данных, такие как RobustScaler,
нормализуют данные, используя квантили (например, 25-й и 75-й процентили),
что делает их устойчивыми к выбросам.
Заключение:
Каждая из этих оценок обладает своими особенностями и
применяется в зависимости от характера данных и поставленной задачи.
Для анализа данных с выбросами рекомендуется использовать устойчивые меры
(IQR, MAD, Winsorized Variance),
тогда как обычные показатели (дисперсия, СКО) эффективны для чистых и однородных данных.
----
IQR — это расстояние между первым (нижним) квартилем (Q1) и третьим (верхним) квартилем (Q3). Математически:
Преимущества IQR:
- Устойчивость к выбросам: IQR нечувствителен к экстремальным значениям,
- так как игнорирует минимальные и максимальные значения.
- Удобство визуализации: IQR часто используется в boxplots (ящиках с усами),
- что позволяет визуально оценить распределение данных.
- Широкое применение: IQR активно используется в статистике, экономике,
- биологии и других науках для анализа разброса данных.
Недостатки IQR:
- Игнорирование краев: IQR не учитывает крайние значения,
- что может скрыть важную информацию.
- Некоторое упрощение: Иногда узкая полоса IQR может вводить в заблуждение,
- если основное распределение данных имеет сложный вид.
Таким образом, IQR является прекрасным дополнением к арсеналу оценок разброса данных,
особенно когда необходимо устойчивое и надежное средство анализа.
Комментариев нет:
Отправить комментарий