Tuesday, 31 October 2017

Forex Data Mining


Introducción a la minería de datos FX Permite hacer una introducción rápida y sencilla a uno de los campos más interesantes de hoy: Data Mining. Hay una amplia gama de aplicaciones de minería de datos. Debemos integrar la minería de datos en nuestro comercio de divisas. FX, FOREX o Foreign Exchange FX es el mercado más grande en términos de volumen negociado diariamente. Tiene tres niveles principales de participantes: los muchachos grandes, el nivel intermedio y los comerciantes simples como tú y yo. Tiene un carácter especulativo, lo que significa que la mayor parte del tiempo no intercambiamos bienes. Cuidamos solamente para la diferencia y deseamos comprar bajo y vender alto o vender alto y comprar bajo. Por operaciones cortas o largas podemos ganar pips. Dependiendo de su volumen de negociación, el valor de la pip puede variar de un centavo a 10 y más. Esta es la principal manera de ganar dinero en el mercado de FX (junto con Carry Trade, Brokering, Arbitrage y más). Tenga en cuenta que el mercado de FX es enorme, pero es adecuado para todos los niveles de jugadores. Piense en el mercado FX como un supermercado infinito con un número infinito de productos y clientes, pero también tiene un número infinito de cajeros. Lo que significa que hay una cantidad igual de oportunidades para todos. Minería de Datos y Aprendizaje de Máquina La minería de datos es un sub campo maduro de Ciencias de la Computación. Se trata de una gran cantidad de datos y extracción no trivial de conocimientos utilizables a partir de cantidades masivas de datos. Su hecho por el procesamiento inteligente de datos utilizando algoritmos de aprendizaje automático. La minería de datos no es sólo CRUD (crear, leer, actualizar y eliminar). Tenemos varios métodos de Data Mining. Por lo tanto los métodos y algunas aplicaciones. Clasificación: clasificar el correo electrónico como spam, clasificar una transacción como fraude. Asociación - YouTube nos sugiere nuevos videos basados ​​en nuestra historia. Amazon nos sugiere más artículos durante la comprobación. Clustering - análisis de datos no estructurados como noticias y opiniones económicas para encontrar grupos comunes. Minería de Procesos: examine los registros de los operadores de llamadas para encontrar operaciones ineficientes. Text Mining - noticias de minería o análisis técnico para el reconocimiento de patrones. Algorithmic Trading es una ejecución automatizada de un algoritmo de negociación. En nuestro caso, el algoritmo de negociación proviene de la minería. El comercio automatizado es hecho por algún rey del lenguaje de programación. Velocidad y robustez son puntos clave aquí: comerciante humano no puede vencer al programa de computadora con respecto a esos atributos. Podría ser HFT (High Frequency Trading) y de bajo nivel de programación (como C) o de comercio a largo plazo y de alto nivel de programación (como Java). Mezclar el comercio algorítmico con la minería de datos Mezclar la minería de datos en el comercio algorítmico es importante. Lo más importante son los datos. Un principio simple indica que si sus datos no son lo suficientemente buenos, sus modelos no serán lo suficientemente buenos (GIGO). Se trata de crear un modelo, implementarlo y probarlo (como siempre). Actualmente este flujo es mayormente manual. Software de minería de datos Hay muchas opciones de software de código abierto en el campo de la minería de datos. WEKA es un marco de Data Mining originado en la Universidad de Waikato, Hamilton, Nueva Zelanda. WEKA está escrito en Java y tiene una gran API. También tiene implementaciones para la mayoría de los conocidos algoritmos de aprendizaje de máquina. La mezcla de buenas herramientas es vital. Hay demasiados modelos comerciales posibles. Tirar una moneda es un sistema de comercio estúpido, pero es un sistema de comercio. Necesitamos Data Mining para encontrar el oro. Las buenas herramientas son fáciles de conseguir así que buena suerte con la explotación minera. Si está buscando más información sobre el comercio de FX científico su próximo paso es explorar las herramientas de minería de datos y datos históricos. Visita algonell para más detalles. Puedes encontrarnos en twitter. Facebook. Google. LinkedIn y WordPress. Minería de datos una estrategia de divisas Forex Debido a las características únicas de los pares de divisas diferentes, muchas estrategias cuantitativas de Forex están diseñados con un par de divisas específicas en mente. Si bien esto puede producir muchas estrategias comerciales rentables, también hay ventajas en el desarrollo de estrategias que se pueden negociar a través de múltiples pares de divisas. Esto introduce un elemento de diversificación que puede proporcionar un nivel adicional de protección a la baja. Daniel Fernández recientemente publicó un sistema que diseñó para operar en cada uno de los cuatro mayores de Forex. Su objetivo era encontrar un sistema que hubiera producido un historial de 20 años de comercio rentable en EUR / USD, GBP / USD, USD / JPY y USD / CHF. Daniel utiliza un enfoque de minería de datos para desarrollar una estrategia para el comercio de los cuatro mayores de Forex. Para construir su sistema, Daniel utilizó su software de minería de datos para definir las señales de entrada y salida que habrían producido una estrategia comercial rentable en cada uno de los cuatro pares de divisas en los últimos 20 años. Lo que viene con una combinación de tres reglas basadas en precios que forman la base de su estrategia de Forex Majors. Daniel8217s Forex Majors estrategia Daniel8217s Forex Majors estrategia es muy simple en que siempre tiene una posición, ya sea largo o corto, en cada uno de los cuatro pares de divisas que se negocia. Basa todas sus operaciones en gráficos diarios. La estrategia se prolonga cuando se cumplen las tres condiciones siguientes: La estrategia se queda corta cuando se cumplen las tres condiciones siguientes: Como se puede ver, la estrategia es básicamente una tendencia optimizada siguiendo la estrategia. Esto tiene sentido, porque Daniel afirma al principio de su artículo que la tendencia a largo plazo después de las estrategias son generalmente las mejores estrategias para el comercio de múltiples mercados. Una regla adicional que utiliza la estrategia de Daniel8217s es una parada-pérdida basada en ATR. El stop-loss fijo se fija en 180 del ATR de 20 días. Si se activa la parada-pérdida, la estrategia permanece fuera del mercado hasta que se genera una señal en la dirección opuesta. La prueba indica que volver a entrar en una señal en la misma dirección afectó negativamente el rendimiento. Backtesting Performance Los resultados de backtesting que Daniel incluyó en su post muestran que la estrategia fue bastante rentable. Produjo un índice de ganancia de 45, un factor de ganancia de 1,38, y una recompensa a la razón de riesgo de 1,68. La mayor preocupación de Daniel8217s sobre la estrategia era que el período máximo de retiro representaba un tiempo muy largo. De acuerdo con los números de Daniel8217s, el rendimiento medio anual fue de 9,67. Esto consistió en 16 años rentables, 4 años perdidos, y un año que básicamente se rompió incluso. El mejor año fue un retorno de 37.76, y el peor año fue una pérdida de 20.2. Daniel observa que este sistema no representaría una buena estrategia autónoma debido a sus retornos relativos a las tiradas máximas. Sin embargo, sugiere que podría ser una pieza interesante de una estrategia más grande, multi-sistema. CommentsBacktesting Data Mining Backtesting Minería de datos En este artículo, eche un vistazo a dos prácticas relacionadas que son ampliamente utilizados por los comerciantes llamado Backtesting y Data Mining. Estas son técnicas que son poderosas y valiosas si las usamos correctamente, sin embargo los comerciantes a menudo mal uso de ellos. Por lo tanto, también explorar dos peligros comunes de estas técnicas, conocido como el problema de la hipótesis múltiple y overfitting y cómo superar estos escollos. Backtesting es sólo el proceso de usar datos históricos para probar el desempeño de alguna estrategia comercial. Backtesting generalmente comienza con una estrategia que nos gustaría probar, por ejemplo la compra de GBP / USD cuando cruza por encima de la media móvil de 20 días y la venta cuando se cruza por debajo de ese promedio. Ahora podríamos probar esa estrategia observando lo que el mercado hace en el futuro, pero eso llevaría mucho tiempo. Es por eso que utilizamos datos históricos que ya están disponibles. Pero espera, espera te oigo decir. No podrías engañar o al menos ser tendenciosa porque ya sabes lo que pasó en el pasado Thats definitivamente una preocupación, por lo que un backtest válido será uno en el que no estamos familiarizados con los datos históricos. Podemos lograr esto eligiendo períodos de tiempo aleatorios o eligiendo muchos períodos de tiempo diferentes en los cuales llevar a cabo la prueba. Ahora puedo escuchar a otro grupo de ustedes diciendo: "Pero todos los datos históricos que están sentados allí esperando ser analizados son tentadores, ¿no?" Tal vez hay secretos profundos en esos datos esperando a que los geeks nos descubran. ¿Sería tan malo para nosotros examinar primero esos datos históricos, analizarlos y ver si podemos encontrar patrones escondidos dentro de él? Este argumento también es válido, pero nos conduce a un área llena de peligro. El mundo de Data Mining Minería de Datos implica la búsqueda a través de datos con el fin de localizar patrones y encontrar posibles correlaciones entre las variables. En el ejemplo anterior, que involucraba la estrategia de media móvil de 20 días, nos topamos con ese indicador en particular, pero supongamos que no teníamos ni idea de qué tipo de estrategia queríamos probar. Podríamos buscar a través de nuestros datos históricos en GBP / USD para ver cómo el precio se comportó después de que cruzó muchos diferentes promedios móviles. Podríamos comprobar los movimientos de precios frente a muchos otros tipos de indicadores y ver cuáles corresponden a grandes movimientos de precios. El tema de la minería de datos puede ser controvertido porque como he discutido anteriormente parece un poco como engañar o mirando hacia el futuro en los datos. ¿Es la minería de datos una técnica científica válida? Por un lado, el método científico dice que se supone que hacer una hipótesis primero y luego probarlo contra nuestros datos, pero por otro lado parece apropiado hacer una exploración de los datos en primer lugar con el fin de Sugerir una hipótesis. Así que lo que es correcto Podemos mirar los pasos en el Método Científico para una pista a la fuente de la confusión. El proceso en general se parece a esto: Observación (datos) Experimento de predicción de hipótesis (datos) Observe que podemos tratar datos durante las etapas de observación y experimentación. Así que ambas opiniones son correctas. Debemos usar datos para crear una hipótesis razonable, pero también probamos esa hipótesis usando datos. El truco es simplemente asegurarnos de que los dos conjuntos de datos no son los mismos. Nunca debemos probar nuestra hipótesis usando el mismo conjunto de datos que usamos para sugerir nuestra hipótesis. En otras palabras, si utiliza la minería de datos con el fin de llegar a ideas de estrategia, asegúrese de utilizar un conjunto diferente de datos para volver a probar esas ideas. Ahora bien, volvamos nuestra atención a las dificultades principales de utilizar la minería de datos y backtesting incorrectamente. El problema general se conoce como sobre-optimización y prefiero romper ese problema en dos tipos distintos. Éstos son el problema de la hipótesis múltiple y el overfitting. En cierto sentido, son modos opuestos de cometer el mismo error. El problema de la hipótesis múltiple consiste en elegir muchas hipótesis sencillas, mientras que la superposición implica la creación de una hipótesis muy compleja. El Problema de la Hipótesis Múltiple Para ver cómo surge este problema, volvamos a nuestro ejemplo en el que evaluamos de nuevo la estrategia del promedio móvil de 20 días. Vamos a suponer que backtest la estrategia contra diez años de datos históricos del mercado y lo y behold adivinar qué Los resultados no son muy alentadores. Sin embargo, siendo ásperos y los comerciantes de la caída como somos, decidimos no dar para arriba tan fácilmente. ¿Qué pasa con un promedio móvil de diez días Que podría funcionar un poco mejor, así que deja backtest que Ejecutar otro backtest y nos encontramos con que los resultados aún no son estelares, pero theyre un poco mejor que los resultados de 20 días. Decidimos explorar un poco y ejecutar pruebas similares con promedios móviles de 5 días y 30 días. Finalmente se nos ocurre que en realidad podríamos probar cada media móvil hasta cierto punto y ver cómo funcionan. Así que probar el 2-día, 3-día, 4-día, y así sucesivamente, todo el camino hasta el promedio móvil de 50 días. Ahora, sin duda algunos de estos promedios se comportan mal y otros se comportan bastante bien, pero habrá que ser uno de ellos que es el mejor absoluto. Por ejemplo, podemos encontrar que el promedio móvil de 32 días resultó ser el mejor intérprete durante este período de diez años en particular. ¿Significa esto que hay algo especial en el promedio de 32 días y que debemos estar seguros de que funcionará bien en el futuro? Desafortunadamente, muchos comerciantes asumen que esto es así, y simplemente detienen su análisis en este punto, pensando que Han descubierto algo profundo. Han caído en la trampa del Problema de Hipótesis Múltiple. El problema es que no hay nada inusual o significativo en el hecho de que un promedio resultó ser el mejor. Después de todo, hemos probado casi cincuenta de ellos en contra de los mismos datos, por lo que esperamos encontrar algunos buenos artistas, sólo por casualidad. No significa theres nada especial sobre la media móvil particular que ganó en este caso. El problema surge porque probamos múltiples hipótesis hasta que encontramos una que funcionó, en lugar de elegir una sola hipótesis y probarla. Heres una buena analogía clásica. Podríamos llegar a una sola hipótesis, como Scott es grande en voltear las cabezas de una moneda. A partir de eso, podríamos crear una predicción que dice: Si la hipótesis es verdadera, Scott será capaz de mover 10 cabezas seguidas. Entonces podemos realizar un experimento simple para probar esa hipótesis. Si puedo voltear 10 cabezas en una fila que realmente no prueba la hipótesis. Sin embargo, si no puedo lograr esta hazaña, definitivamente refuta la hipótesis. Al hacer experimentos repetidos que no logran refutar la hipótesis, entonces nuestra confianza en su verdad crece. Esa es la manera correcta de hacerlo. Sin embargo, ¿qué pasaría si hubiéramos llegado a 1.000 hipótesis en lugar de sólo la de que yo fuera una buena moneda flipper Podríamos hacer la misma hipótesis acerca de 1.000 personas diferentes. Yo, Ed, Cindy, Bill, Sam, etc. Ok, ahora vamos a probar nuestras múltiples hipótesis. Pedimos a las 1000 personas que tiren una moneda. Probablemente habrá cerca de 500 que voltean las cabezas. Todos los demás pueden irse a casa. Ahora les pedimos a las 500 personas que vuelvan a tirarse, y esta vez alrededor de 250 darán la vuelta. En la tercera vuelta alrededor de 125 cabezas de la cara de la gente, en el cuarto alrededor de 63 personas se van, y en la quinta vuelta hay alrededor de 32. Estas 32 personas son todo el arent bastante asombroso Theyve todos volteados cinco cabezas en una fila Si volteamos cinco Más veces y eliminar la mitad de la gente cada vez en promedio, vamos a terminar con 16, luego 8, luego 4, luego 2 y finalmente una persona a la izquierda que ha volteado diez cabezas en una fila. Su proyecto de ley Bill es una aleta fantabulous de monedas O es él Bueno, realmente no lo sé, y thats el punto. Bill puede haber ganado nuestro concurso por pura casualidad, o bien puede ser el mejor flipper de cabezas de este lado de la galaxia de Andrómeda. Por la misma razón, no sabemos si el promedio móvil de 32 días de nuestro ejemplo anterior acaba de funcionar bien en nuestra prueba por pura casualidad, o si realmente hay algo especial en ella. Pero todo lo que hemos hecho hasta ahora es encontrar una hipótesis, a saber, que la estrategia de media móvil de 32 días es rentable (o que Bill es una gran moneda flipper). Todavía no hemos probado esa hipótesis. Así que ahora que entendemos que realmente no hemos descubierto nada significativo sobre el promedio móvil de 32 días o acerca de la capacidad de Facturas para voltear monedas, la pregunta natural es qué debemos hacer a continuación. Como mencioné anteriormente, muchos comerciantes nunca se dan cuenta de que hay Es un paso siguiente requerido en absoluto. Bueno, en el caso de Bill probablemente preguntarás, Aha, pero puede voltear diez cabezas seguidas de nuevo. En el caso del promedio móvil de 32 días, quiero probarlo de nuevo, pero ciertamente no en contra de la misma muestra de datos que Solíamos elegir esa hipótesis. Elegiríamos otro período de diez años y veríamos si la estrategia funcionaba igual de bien. Podríamos continuar haciendo este experimento tantas veces como quisieramos hasta que se agotara el suministro de nuevos períodos de diez años. Nos referimos a esto como fuera de las pruebas de la muestra, y es la manera de evitar esta trampa. Hay varios métodos de tales pruebas, uno de los cuales es la validación cruzada, pero no vamos a entrar en ese detalle mucho aquí. Overfitting es realmente una especie de inversión del problema anterior. En el ejemplo de la hipótesis múltiple anterior, examinamos muchas hipótesis simples y escogimos la que mejor se desempeñó en el pasado. En overfitting primero miramos el pasado y luego construimos una sola hipótesis compleja que encaja bien con lo sucedido. Por ejemplo, si miro la tasa de USD / JPY en los últimos 10 días, podría ver que el cierre diario hizo esto: arriba, arriba, abajo, arriba, arriba, arriba, abajo, abajo, abajo, arriba. Lo tengo Ver el patrón Sí, tampoco lo hago en realidad. Pero si quisiera usar estos datos para sugerir una hipótesis, podría plantearme. Mi asombrosa hipótesis: si el precio de cierre sube dos veces seguidas y luego baja por un día, o si baja durante tres días consecutivos, debemos comprar, pero si el precio de cierre sube tres días consecutivos, debemos vender , Pero si sube tres días en una fila y luego abajo tres días en una fila debemos comprar. Huh Suena como una hipótesis whacky derecho Pero si hubiéramos utilizado esta estrategia en los últimos 10 días, habríamos estado en lo cierto en cada uno de los intercambios que hicimos El overfitter utiliza backtesting y minería de datos de manera diferente que los fabricantes de hipótesis múltiples hacer. El overfitter no viene con 400 estrategias diferentes para backtest. De ninguna manera El overfitter utiliza herramientas de minería de datos para calcular una sola estrategia, no importa cuán compleja, que habría tenido el mejor rendimiento durante el período de backtesting. ¿Funcionará en el futuro? No es probable, pero siempre podríamos seguir modificando el modelo y probando la estrategia en diferentes muestras (de prueba de muestra de nuevo) para ver si nuestro rendimiento mejora. Cuando dejamos de obtener mejoras en el rendimiento y lo único que está aumentando es la complejidad de nuestro modelo, entonces sabemos que hemos cruzado la línea en overfitting. Así que, en resumen, hemos visto que la minería de datos es una forma de utilizar nuestros datos históricos de precios para sugerir una estrategia de negociación viable, pero que tenemos que ser conscientes de los escollos del problema de hipotesis múltiple y overfitting. La manera de asegurarnos de que no caemos presa de estos errores es volver a probar nuestra estrategia usando un conjunto de datos diferente al que usamos durante nuestra exploración de minería de datos. Nos referimos comúnmente a esto como fuera de las pruebas de la muestra. Un problema con la minería de datos es que los comerciantes tienden a utilizar diferentes tipos de filtros para buscar un patrón. El problema con esto es que cualquier señal se compone de las diferentes señales sinusoidales, por lo que cuando se aplican diferentes filtros a una señal vamos a terminar con un patrón. Muchos estudios se ha hecho sobre el patrón de precios, en su mayoría se basan en la minería de datos, la pregunta será la suposición de que el futuro refleja el pasado, la respuesta es tal vez. Tenemos una oportunidad de 50/50. El porcentaje puede aumentarse estudiando este patrón en diferentes datos. Si incluso queremos aumentar este porcentaje necesitamos saber cuál es la causa de este patrón, al conocer la causa de este patrón tendríamos una ventaja en el comercio. Por ejemplo voy a hacer esta suposición, vamos a decir que el primer viernes de cada mes debido a los lotes de noticias de los comerciantes tienden a salir de sus operaciones en la mañana antes de la noticia y volver a entrar después de las noticias, por lo que hay un patrón de venta y Comprando en cierto momento. Podríamos utilizar esta información para nuestro beneficio mediante la aplicación de algún tipo de un comercio de cobertura, así que entramos con tanto comprar y vender antes de las noticias. Entonces después de las noticias que sólo se venden para que quieren comprar y didn8217t desea mantener una posición durante las noticias y dejamos que la compra hasta el precio vuelve, esto podría aplicarse a la tasa de interés de la sierra, u otra configuración 8230 bla bla. Esto es sólo una teoría. Lo estoy usando para decir que el miedo y la codicia tienen un tiempo en el mercado. Así que lo que crea los patrones de precios son el miedo y la codicia, ahora si aislar el patrón y conocer la causa detrás de este patrón, como en el ejemplo anterior miedo de las noticias o la liquidación de la cuenta al final del mes. ese tipo de cosas. Entonces podríamos en teoría predecir el futuro de los dos primeros puestos se copian de este sitio todos los artículos de Scott Percival vale la pena leer Excelente Thread MiniMe Únete a nosotros descargar MetaTrader 5 Copyright 2000-2016, MQL5 Ltd.

No comments:

Post a Comment