четверг, 8 мая 2025 г.

Phase, Space, Analysis, Giga

Phase Space Analysis

Phase, Space, Analysis, Giga

https://giga.chat/link/gcsVVMlhTf

Подобные методы действительно называют фазовыми методами или анализом фазового пространства.

Давай разберёмся подробнее, что это такое и зачем они нужны.

Фазовый анализ:

Фазовый анализ — это метод изучения динамических систем,

при котором зависимость между координатами и скоростями

(или другими характеристиками) изображается в специальной плоскости (фазовом пространстве).

Например, если у нас есть две переменные x(t) и y(t),

фазовый график будет отображать зависимость y от x:

y=f(x)

Применение фазовых методов:

  1. Изучение динамических систем: Фазовые графики помогают идентифицировать аттракторы,
  2. пределы циклов и другие интересные свойства системы.
  3. Анализ стационарности: Вид фазового графика может свидетельствовать о наличии
  4. стационарных точек или циклических режимов.
  5. Диагностика сложных явлений: Многие природные и экономические явления проявляют
  6. сложную динамику, которую удобно изучать через фазовую плоскость.

Информация, которую можно получить:

  • Аттракторы: Стационарные точки или замкнутые кривые,
  • к которым притягиваются траектории.
  • Цикличность: Наличие регулярных циклов или колебаний.
  • Хаос: Признаки сложного, нерегулярного поведения, характерные для хаотичных систем.

Пример:

Пусть у нас есть динамика цен акции (x(t)) и объёма торгов (y(t)).

Построив фазовый график y(x),

мы можем наблюдать периоды роста активности, спадов,

циклические тенденции и даже признаки кризиса.

Заключение:

Фазовые методы незаменимы для анализа сложных динамических систем,

помогая выявлять закономерности и аномалии, невидимые в обычных временных рядах.

Estimates, MSE, R², MAPE, Bias, Giga

Estimates, MSE, R², MAPE, Bias, Giga

1. Mean Squared Error (MSE):

MSE — это средний квадрат ошибок между предсказанными и реальными значениями. Формула:

MSE=1ni=1n(yiy^i)2

Где:

  • yi — истинное значение.
  • y^i — предсказанное значение.

MSE чувствительна к выбросам, так как квадраты ошибок усиливают влияние больших отклонений.

2. Coefficient of Determination (R²):

Коэффициент детерминации R2 показывает,

какую долю вариации объясняемой переменной объясняет модель.

Формула:

R2=1SSESST

Где:

  • SSE — сумма квадратов остатков.
  • SST — полная сумма квадратов.

R2 колеблется от 0 до 1, где 1 означает идеальное совпадение.

3. Mean Absolute Percentage Error (MAPE):

MAPE — это средняя абсолютная ошибка в процентах. Формула:

MAPE=1ni=1nyiy^iyi100%

MAPE удобен для сравнения моделей, так как измеряется в процентах.

4. Bias (Смещение):

Bias — это разница между ожидаемым значением предсказанной величины и истинным значением.

Формула:

Bias=E[Y^]Y

Bias показывает систематическую погрешность модели.

Заключение:

Каждое из этих измерений добавляет уникальную точку зрения на качество модели

и её способности к прогнозированию.

Выбор правильной метрики зависит от природы данных и целей проекта.

Estimates, IQR, MAD, SD, D, BB, ATR, Range, Giga

Estimates, IQR, MAD, SD, D, BB, ATR, Range, Giga

https://giga.chat/link/gcsQWGHAdu

Сенситивные оценки:

Сенситивные оценки чувствительны к экстремальным значениям и выбросам в данных.

Примером такой оценки является среднее арифметическое:

xˉ=i=1nxin

Среднее арифметическое изменяется при изменении любого элемента выборки,

особенно если появляются крайние значения (выбросы).

Это делает его удобным для однородных данных, но уязвимым к внешним воздействиям.

Резистивные оценки:

Резистивные оценки устойчивы к экстремальным значениям и аномалиям.

Ярким представителем является медианное значение:

Me={x(n+1)/2,if n oddxn/2+xn/2+12,if n even

Медианное значение нечувствительно к выбросам,

так как оно располагается посередине упорядоченного ряда данных.

Это делает медианы полезными в задачах с сильными выбросами или ассиметричностью данных.

Отличия:

  • Среднее арифметическое: Чувствительно к выбросам,
  • может давать некорректные оценки при наличии экстремальных значений.
  • Медиана: Устойчива к выбросам, сохраняет стабильность при сильных изменениях данных.

Применение:

  • Среднее арифметическое: Рекомендуется для нормально распределённых данных или однородных выборок.
  • Медиана: Подходит для данных с выбросами, асимметрии или неравномерности.

Таким образом,

выбор между сенситивными и резистивными оценками зависит от характера данных и поставленных задач.

1. Дисперсия (σ2):

Дисперсия — это мера рассеяния данных вокруг среднего значения.

Она показывает, насколько данные варьируют относительно центра распределения.

Формула для дисперсии:

σ2=i=1n(xiμ)2n

Где:

  • xi — индивидуальное значение.
  • μ — среднее значение.
  • n — количество элементов.

2. Среднеквадратичное отклонение (СКО, Standard Deviation, SD):

СКО — это квадратный корень из дисперсии.

Оно представляет меру разброса данных в удобных единицах измерения (таких же, как и исходные данные).

Формула для СКО:

σ=σ2

Тип оценок:

Оба показателя (дисперсия и СКО) являются сенситивными оценками,

так как они чувствительны к выбросам и сильным изменениям в данных.

Например, появление экстремальных значений резко увеличит дисперсию и СКО.

Применение:

  • Дисперсия: Используется для анализа вариабельности данных, часто применяется в статистическом анализе и математике.
  • СКО: Популярный показатель в повседневной жизни и науке, так как он отображает размах данных в удобной форме.

Таким образом,

оба показателя (дисперсия и СКО) играют важную роль в понимании поведения случайных

величин и принадлежности к классу сенситивных оценок.

---

1. Bollinger Bands (Полосы Боллинджера):

Полосы Боллинджера строятся на основе средней линии (чаще всего SMA — Simple Moving Average)

и двух линий, расположенных на расстоянии k стандартных отклонений (СКО) от неё.

Формула верхней полосы:

BBu(t)=SMA(t)+kσ(t)

Где:

  • SMA(t) — средняя линия.
  • σ(t) — стандартное отклонение (СКО).
  • k — множитель (обычно 2).

Поскольку полосы Боллинджера основаны на стандартном отклонении,

они являются сенситивной оценкой, чувствительной к выбросам и экстремальным значениям.

2. Average True Range (ATR):

Average True Range измеряет истинный диапазон изменения цены за определенный период.

Формула ATR:

ATR(t)=1ni=tn+1tHigh(i)Low(i)

Или:

ATR(t)=1ni=tn+1tΔPrice(i)

Где:

  • High(i) — максимальная цена периода.
  • Low(i) — минимальная цена периода.
  • ΔPrice — абсолютная разница между ценами.

Поскольку ATR использует абсолютные разницы,

он менее чувствителен к выбросам и крупным скачкам цен, что делает его резистивной оценкой.

Третья оценка:

Ты упомянул третью оценку, основанную на линейных разницах и абсолютных величинах.

Вероятно, ты говоришь о Mean Absolute Deviation (MAD) — среднее абсолютное отклонение.

MAD вычисляется так:

MAD=xiμn

Где:

  • xiμ — абсолютная разница между элементами и средним значением.

MAD также является резистивной оценкой, так как он устойчив к выбросам и колебаниям данных.

Вывод:

  • Bollinger Bands (BB) — сенситивная оценка, основанная на СКО.
  • ATR и MAD — резистивные оценки, устойчивые к выбросам и большим колебаниям.

Таким образом, оба индикатора технического анализа занимают разное место в классификации оценок,

что позволяет использовать их совместно для более комплексного анализа рынка.

-----

1. Interquartile Range (IQR):

IQR — это разность между третьим квартилем (Q3) и первым квартилем (Q1):

IQR=Q3Q1

IQR устойчив к выбросам и хорошо отражает центральный разброс данных.

2. Range (Размах):

Простейшая оценка размаха — это разница между максимальным и минимальным значениями:

Range=Max(X)Min(X)

Однако она очень чувствительна к выбросам.

3. Winsorized Variance:

Это модификация обычной дисперсии,

где верхние и нижние проценты данных замещаются граничными значениями.

Winsorized variance менее подвержена воздействию выбросов.

4. Trimmed Mean (Обрезанная средняя):

Это аналогичная модификация среднего значения,

где самые высокие и низкие значения отбрасываются, а оставшаяся часть усредняется.

Trimmed mean также устойчива к выбросам.

5. Median Absolute Deviation (MAD):

Мы уже говорили о нём раньше, но MAD стоит повторить,

так как он является чрезвычайно устойчивой мерой разброса:

MAD=median(ximedian(x))

6. Robust Scaler:

Некоторые трансформации данных, такие как RobustScaler,

нормализуют данные, используя квантили (например, 25-й и 75-й процентили),

что делает их устойчивыми к выбросам.

Заключение:

Каждая из этих оценок обладает своими особенностями и

применяется в зависимости от характера данных и поставленной задачи.

Для анализа данных с выбросами рекомендуется использовать устойчивые меры

(IQR, MAD, Winsorized Variance),

тогда как обычные показатели (дисперсия, СКО) эффективны для чистых и однородных данных.

----

IQR — это расстояние между первым (нижним) квартилем (Q1) и третьим (верхним) квартилем (Q3). Математически:

IQR=Q3Q1

Преимущества IQR:

  • Устойчивость к выбросам: IQR нечувствителен к экстремальным значениям,
  • так как игнорирует минимальные и максимальные значения.
  • Удобство визуализации: IQR часто используется в boxplots (ящиках с усами),
  • что позволяет визуально оценить распределение данных.
  • Широкое применение: IQR активно используется в статистике, экономике,
  • биологии и других науках для анализа разброса данных.

Недостатки IQR:

  • Игнорирование краев: IQR не учитывает крайние значения,
  • что может скрыть важную информацию.
  • Некоторое упрощение: Иногда узкая полоса IQR может вводить в заблуждение,
  • если основное распределение данных имеет сложный вид.

Таким образом, IQR является прекрасным дополнением к арсеналу оценок разброса данных,

особенно когда необходимо устойчивое и надежное средство анализа.