понедельник, 10 ноября 2025 г.
понедельник, 13 октября 2025 г.
вторник, 30 сентября 2025 г.
четверг, 25 сентября 2025 г.
среда, 4 июня 2025 г.
четверг, 29 мая 2025 г.
четверг, 8 мая 2025 г.
Phase, Space, Analysis, Giga
Phase Space Analysis
Phase, Space, Analysis, Giga
https://giga.chat/link/gcsVVMlhTf
Подобные методы действительно называют фазовыми методами или анализом фазового пространства.
Давай разберёмся подробнее, что это такое и зачем они нужны.
Фазовый анализ:
Фазовый анализ — это метод изучения динамических систем,
при котором зависимость между координатами и скоростями
(или другими характеристиками) изображается в специальной плоскости (фазовом пространстве).
Например, если у нас есть две переменные x(t) и y(t),
фазовый график будет отображать зависимость y от x:
y=f(x)Применение фазовых методов:
- Изучение динамических систем: Фазовые графики помогают идентифицировать аттракторы,
- пределы циклов и другие интересные свойства системы.
- Анализ стационарности: Вид фазового графика может свидетельствовать о наличии
- стационарных точек или циклических режимов.
- Диагностика сложных явлений: Многие природные и экономические явления проявляют
- сложную динамику, которую удобно изучать через фазовую плоскость.
Информация, которую можно получить:
- Аттракторы: Стационарные точки или замкнутые кривые,
- к которым притягиваются траектории.
- Цикличность: Наличие регулярных циклов или колебаний.
- Хаос: Признаки сложного, нерегулярного поведения, характерные для хаотичных систем.
Пример:
Пусть у нас есть динамика цен акции (x(t)) и объёма торгов (y(t)).
Построив фазовый график y(x),
мы можем наблюдать периоды роста активности, спадов,
циклические тенденции и даже признаки кризиса.
Заключение:
Фазовые методы незаменимы для анализа сложных динамических систем,
помогая выявлять закономерности и аномалии, невидимые в обычных временных рядах.
Estimates, MSE, R², MAPE, Bias, Giga
Estimates, MSE, R², MAPE, Bias, Giga
1. Mean Squared Error (MSE):
MSE — это средний квадрат ошибок между предсказанными и реальными значениями. Формула:
MSE=n1i=1∑n(yi−y^i)2Где:
- yi — истинное значение.
- y^i — предсказанное значение.
MSE чувствительна к выбросам, так как квадраты ошибок усиливают влияние больших отклонений.
2. Coefficient of Determination (R²):
Коэффициент детерминации R2 показывает,
какую долю вариации объясняемой переменной объясняет модель.
Формула:
Где:
- SSE — сумма квадратов остатков.
- SST — полная сумма квадратов.
R2 колеблется от 0 до 1, где 1 означает идеальное совпадение.
3. Mean Absolute Percentage Error (MAPE):
MAPE — это средняя абсолютная ошибка в процентах. Формула:
yiyi−y^i⋅100%MAPE удобен для сравнения моделей, так как измеряется в процентах.
4. Bias (Смещение):
Bias — это разница между ожидаемым значением предсказанной величины и истинным значением.
Формула:
Bias=E[Y^]−YBias показывает систематическую погрешность модели.
Заключение:
Каждое из этих измерений добавляет уникальную точку зрения на качество модели
и её способности к прогнозированию.
Выбор правильной метрики зависит от природы данных и целей проекта.
Estimates, IQR, MAD, SD, D, BB, ATR, Range, Giga
Estimates, IQR, MAD, SD, D, BB, ATR, Range, Giga
https://giga.chat/link/gcsQWGHAdu
Сенситивные оценки:
Сенситивные оценки чувствительны к экстремальным значениям и выбросам в данных.
Примером такой оценки является среднее арифметическое:
xˉ=n∑i=1nxiСреднее арифметическое изменяется при изменении любого элемента выборки,
особенно если появляются крайние значения (выбросы).
Это делает его удобным для однородных данных, но уязвимым к внешним воздействиям.
Резистивные оценки:
Резистивные оценки устойчивы к экстремальным значениям и аномалиям.
Ярким представителем является медианное значение:
Me={x(n+1)/2,2xn/2+xn/2+1,if n oddif n evenМедианное значение нечувствительно к выбросам,
так как оно располагается посередине упорядоченного ряда данных.
Это делает медианы полезными в задачах с сильными выбросами или ассиметричностью данных.
Отличия:
- Среднее арифметическое: Чувствительно к выбросам,
- может давать некорректные оценки при наличии экстремальных значений.
- Медиана: Устойчива к выбросам, сохраняет стабильность при сильных изменениях данных.
Применение:
- Среднее арифметическое: Рекомендуется для нормально распределённых данных или однородных выборок.
- Медиана: Подходит для данных с выбросами, асимметрии или неравномерности.
Таким образом,
выбор между сенситивными и резистивными оценками зависит от характера данных и поставленных задач.
1. Дисперсия (σ2):
Дисперсия — это мера рассеяния данных вокруг среднего значения.
Она показывает, насколько данные варьируют относительно центра распределения.
Формула для дисперсии:
σ2=n∑i=1n(xi−μ)2Где:
- xi — индивидуальное значение.
- μ — среднее значение.
- n — количество элементов.
2. Среднеквадратичное отклонение (СКО, Standard Deviation, SD):
СКО — это квадратный корень из дисперсии.
Оно представляет меру разброса данных в удобных единицах измерения (таких же, как и исходные данные).
Формула для СКО:
Тип оценок:
Оба показателя (дисперсия и СКО) являются сенситивными оценками,
так как они чувствительны к выбросам и сильным изменениям в данных.
Например, появление экстремальных значений резко увеличит дисперсию и СКО.
Применение:
- Дисперсия: Используется для анализа вариабельности данных, часто применяется в статистическом анализе и математике.
- СКО: Популярный показатель в повседневной жизни и науке, так как он отображает размах данных в удобной форме.
Таким образом,
оба показателя (дисперсия и СКО) играют важную роль в понимании поведения случайных
величин и принадлежности к классу сенситивных оценок.
---
1. Bollinger Bands (Полосы Боллинджера):
Полосы Боллинджера строятся на основе средней линии (чаще всего SMA — Simple Moving Average)
и двух линий, расположенных на расстоянии k стандартных отклонений (СКО) от неё.
Формула верхней полосы:
BBu(t)=SMA(t)+kσ(t)Где:
- SMA(t) — средняя линия.
- σ(t) — стандартное отклонение (СКО).
- k — множитель (обычно 2).
Поскольку полосы Боллинджера основаны на стандартном отклонении,
они являются сенситивной оценкой, чувствительной к выбросам и экстремальным значениям.
2. Average True Range (ATR):
Average True Range измеряет истинный диапазон изменения цены за определенный период.
Формула ATR:
Или:
Где:
- High(i) — максимальная цена периода.
- Low(i) — минимальная цена периода.
- ∣ΔPrice∣ — абсолютная разница между ценами.
Поскольку ATR использует абсолютные разницы,
он менее чувствителен к выбросам и крупным скачкам цен, что делает его резистивной оценкой.
Третья оценка:
Ты упомянул третью оценку, основанную на линейных разницах и абсолютных величинах.
Вероятно, ты говоришь о Mean Absolute Deviation (MAD) — среднее абсолютное отклонение.
MAD вычисляется так:
Где:
- ∣xi−μ∣ — абсолютная разница между элементами и средним значением.
MAD также является резистивной оценкой, так как он устойчив к выбросам и колебаниям данных.
Вывод:
- Bollinger Bands (BB) — сенситивная оценка, основанная на СКО.
- ATR и MAD — резистивные оценки, устойчивые к выбросам и большим колебаниям.
Таким образом, оба индикатора технического анализа занимают разное место в классификации оценок,
что позволяет использовать их совместно для более комплексного анализа рынка.
-----
1. Interquartile Range (IQR):
IQR — это разность между третьим квартилем (Q3) и первым квартилем (Q1):
IQR=Q3−Q1IQR устойчив к выбросам и хорошо отражает центральный разброс данных.
2. Range (Размах):
Простейшая оценка размаха — это разница между максимальным и минимальным значениями:
Range=Max(X)−Min(X)Однако она очень чувствительна к выбросам.
3. Winsorized Variance:
Это модификация обычной дисперсии,
где верхние и нижние проценты данных замещаются граничными значениями.
Winsorized variance менее подвержена воздействию выбросов.
4. Trimmed Mean (Обрезанная средняя):
Это аналогичная модификация среднего значения,
где самые высокие и низкие значения отбрасываются, а оставшаяся часть усредняется.
Trimmed mean также устойчива к выбросам.
5. Median Absolute Deviation (MAD):
Мы уже говорили о нём раньше, но MAD стоит повторить,
так как он является чрезвычайно устойчивой мерой разброса:
MAD=median(∣xi−median(x)∣)6. Robust Scaler:
Некоторые трансформации данных, такие как RobustScaler,
нормализуют данные, используя квантили (например, 25-й и 75-й процентили),
что делает их устойчивыми к выбросам.
Заключение:
Каждая из этих оценок обладает своими особенностями и
применяется в зависимости от характера данных и поставленной задачи.
Для анализа данных с выбросами рекомендуется использовать устойчивые меры
(IQR, MAD, Winsorized Variance),
тогда как обычные показатели (дисперсия, СКО) эффективны для чистых и однородных данных.
----
IQR — это расстояние между первым (нижним) квартилем (Q1) и третьим (верхним) квартилем (Q3). Математически:
IQR=Q3−Q1Преимущества IQR:
- Устойчивость к выбросам: IQR нечувствителен к экстремальным значениям,
- так как игнорирует минимальные и максимальные значения.
- Удобство визуализации: IQR часто используется в boxplots (ящиках с усами),
- что позволяет визуально оценить распределение данных.
- Широкое применение: IQR активно используется в статистике, экономике,
- биологии и других науках для анализа разброса данных.
Недостатки IQR:
- Игнорирование краев: IQR не учитывает крайние значения,
- что может скрыть важную информацию.
- Некоторое упрощение: Иногда узкая полоса IQR может вводить в заблуждение,
- если основное распределение данных имеет сложный вид.
Таким образом, IQR является прекрасным дополнением к арсеналу оценок разброса данных,
особенно когда необходимо устойчивое и надежное средство анализа.