На сайте Q-trader ожидается серия статей о статистике и тервере в трейдинге. Вводная
статья, на мой взгляд, обязательна к прочтению тем, кто хочет как-то разобраться в этом вопросе.
Внесу свои пять копеек.
Когда я прочитал книгу Булашова "Статистика для трейдера" - честно, сразу не определил, с какого бока можно прикрутить эти знания к реальной торговле.
Для себя вывел несколько направлений куда собственно двигаться.
Это:
1) Изучение сделок
2) Моделирование сделок
3) Моделирование систем ММ
4) Определение весов стратегий
Все наверное слышали цитату - торгуйте систему с положительным матожиданием! А что такое положительное матожидание никто не говорит. Средняя сделка чтоли?
Ответ нашел у Булашева.
Исходные данные:
Выборка сделок {1,...N}
Шаг 1. Группируем выборку сделок по возрастанию.
Шаг 2. Вычисляем потенциальные центры распределения:
а) медиана
б) центр сгиба
в) среднеарифметическое
г) среднеарифметическое по 50% интерквантильному промежутку
д) центр размаха
Из этих центров выбираем самый "центральный" и берем его за основу.
То есть, по сути, у нас есть рассеянная выборка значений вокруг какого-то выбранного значения центра распределения.
Шаг 3. Чистим выборку.
В выборке могуть присутствовать статистичесике артефакты, то есть значения, которые находятся оооочень далеко от центра распределения. Их и нужно убрать, чтобы получить такую выборку, которая бы характеризовала закон рассеивания (распределения) наших результатов вокруг выбранного центра распределения.
Для этого вводится коэффициент цензурирования:
G=1.55+0.8*lg(N/10)*Sqrt(Curtosis-1)
С помощью которого определяются границы "чистки" выборки.
Шаг 4. Получаем новую выборку внутри цензурированных границ {1,...M}
Шаг 5. Строим гистограмму распределения по полученной выборке.
Шаг 6. Строим график плотности вероятности функции распределения
Шаг 7. Строим график интегральной функции распределения
Шаг 8. Считаем матожидание как сумму произведений плотности распределения на середин интервалов.
Получаем значение, к которому стремится случайная величина (результат сделки) при существующем законе распределения. Грубо говоря, при сохранении существующего положения вещей (актуальность системы, фаз рынка, проскальзывания и т.д.) получим именно такой средний результат сделки.
Выводы:
1. Посчитали матожидание
2. Получили интегральный закон распределения (который можем впоследствии использовать для моделирования сделок)
Вопросы: А что собственно распределять?
1. Результат сделки в рублях
2. Результат сделки в пунктах
3. Результат сделки в %
4. Нормированный результат сделки t=(X-СРЗНАЧ)/ДИСП
5.
Логдоходность.
Честно говоря, еще не до конца определился. На всякий случай распределяю % и пункты. В дальнейшем разберусь с этим. Если подскажите как корректнее - буду рад.