استراتيجيات استخراج البيانات التجارية
استراتيجيات استخراج البيانات التجارية.
كيف يمكن للمستثمرين الأفراد استخدام استخراج البيانات لزيادة أرباحهم. والهدف من هذه الدراسة هو دراسة العلاقة بين استراتيجيات القيادة الذاتية من خلال قواعد الجمعيات. تصور. تحسين. علوم البيانات والتحسين.
تحويل البيانات: الاستراتيجيات الثقافية في داتامينينغ نمدس 551 (كرن 6886) جورج ليغرادي. لدينا قاعدة بيانات تفاعلية على الانترنت يوفر نظرة شاملة ومفصلة لأنشطة صناعة التعدين العالمية في حزمة كاملة واحدة. استعراض عام لآخر استراتيجيات التعلم الآلي في التعدين البيانات. نظام التعدين علاقة العملاء لاستراتيجيات صياغة فعالة. الصناعات لصياغة استراتيجية فعالة التسويق. أنا إعداد البيانات عامل منجم في أوراكل 11gR2 و سكليديفيلوبر، لدراسة نماذج التنبؤ (سيتم استخدام لعبة وروميليونس).
تسكس غولد-ديريفد من بيانات السوق :. وليس المقصود لأغراض تجارية أو. البيانات التعدين والتطبيقات - تطوير واستخدام النماذج التنبؤية والتحليلات لاستخراج المعنى من البيانات الكبيرة.
سوق الوساطة المالية.
تداول متوسط الحركة المتحرك على زوج العملات أود / أوسد.
. التجار الذين يستخدمون تجارنا الخوارزمية الذين يستخدمون عقود الفوركس الآجلة.
الوراثي الارتباط مثال الرسوم الكاريكاتورية.
تقنيات تحليل البيانات لتقييم استراتيجيات التداول استيعاب البيانات وتطبيقها استخراج البيانات.
وقد اكتسب تحليل الشبكة الاجتماعية اهتماما كبيرا في السنوات الأخيرة، ويرجع ذلك إلى حد كبير إلى نجاح الشبكات الاجتماعية على الانترنت ومواقع تقاسم وسائل الإعلام، و. بيغ تحليلات البيانات هو عملية فحص مجموعات البيانات الكبيرة التي تحتوي على مجموعة متنوعة من أنواع البيانات - البيانات الكبيرة-- للكشف عن أنماط خفية، الارتباطات غير معروفة. البيانات المطلوبة ل. وبيع قواعد التداول على أساس أخبار البيانات. وتحدث عن كيفية بيانات المعنويات يمكن أن تؤثر على استراتيجيات التداول اليومية و. والبحوث في تويتر وينفذ تحليل النص والشبكة لتعدين المشاعر.
ومن العملية الحسابية لاكتشاف أنماط في مجموعات البيانات الكبيرة التي تنطوي على أساليب في. تم بناء ميكروستراتيغي لتمكين المنظمات من نشر بسرعة تطبيقات تحليلية وأمنية متطورة على نطاق واسع.
ساعات الشجر.
من أدوات دعم القرار البسيطة للمستثمر التقديري إلى التداول الآلي بالكامل.
استخراج البيانات، والتحليل الإحصائي، والحوسبة في الذاكرة، والتداول السريع، تكرارية، وتيرة عالية والتحليلات المستمرة تساعد أخذ الأرباح. التعدين البيانات هي مجموعة فعالة من أدوات التحليل والتقنيات المستخدمة في عملية دعم القرار. نحن نقترح التعلم المزدوج المصنف إطار لتحديد الأسهم المرشحة من النتائج السابقة من استراتيجيات التداول مناقضة الأصلية. استخراج البيانات in. Forex التداول جافا أبي الآجلة كتاب رالي مراجعة المادة الوافد الجديد. على الانترنت المزادات الأسعار التنبؤ استراتيجيات العطاءات استخراج البيانات.
على سبيل المثال، سجلات مبيعات لعلامة تجارية معينة من مضرب التنس. وسأستمر في مراقبة صندوق المتاجرة هذا لأنه من المحتمل أن تكون هناك استراتيجية مخاطر معقولة في الأسبوع المقبل أو نحو ذلك. تحجيم حتى حجم قسط. تكاليف التداول قد تأكل أي تفوق المرتبطة بها. واستراتيجيات التقلب المنخفضة.
استخراج البيانات استراتيجية التخصصات الفوركس.
بسبب الخصائص الفريدة لأزواج العملات المختلفة، تم تصميم العديد من استراتيجيات الفوركس الكمي مع زوج عملة محدد في الاعتبار. في حين أن هذا يمكن أن تنتج العديد من استراتيجيات التداول مربحة، وهناك أيضا مزايا لتطوير الاستراتيجيات التي يمكن تداولها عبر أزواج العملات متعددة. وهذا يقدم عنصرا من عناصر التنويع يمكن أن يوفر مستوى إضافيا من الحماية السلبية.
نشر دانيال فرنانديز مؤخرا نظاما صممه للتداول في كل من شركات الفوركس الأربعة الرئيسية. كان هدفه هو إيجاد نظام من شأنه أن يحقق سجلا حافلا من 20 عاما من التداول المربح على زوج اليورو / الدولار الأمريكي، غبب / أوسد، أوسد / جبي، و أوسد / تشف.
يستخدم دانيال نهج استخراج البيانات لوضع استراتيجية لتداول التخصصات الأربعة فوركس.
ومن أجل بناء نظامه، استخدم دانيال برنامجه الخاص باستخراج البيانات لتحديد إشارات الدخول والخروج التي كان من شأنها أن تنتج استراتيجية تداول مربحة على كل من أزواج العملات الأربع على مدى السنوات العشرين الماضية. ما يأتي به هو مزيج من ثلاث قواعد على أساس الأسعار التي تشكل الأساس لاستراتيجية تخصصه الفوركس.
دانيال & # 8217؛ s فوركس ماجورس ستراتيغي.
دانيال & # 8217؛ s استراتيجية الفوركس الرئيسية هي بسيطة جدا في أنه دائما لديه موقف، إما طويلة أو قصيرة، في كل من أزواج العملات الأربعة التي يتداولها. انها قواعد جميع الصفقات على الرسوم البيانية اليومية.
وتستغرق الاستراتيجية وقتا طويلا عند استيفاء الشروط الثلاثة التالية:
وتختصر الاستراتيجية عندما تستوفى الشروط الثلاثة التالية:
كما ترون، فإن الاستراتيجية هي في الأساس الاتجاه الأمثل استراتيجية التالية. هذا منطقي، لأن دانيال يقول في بداية مقاله أن الاتجاه على المدى الطويل بعد الاستراتيجيات هي عموما أفضل الاستراتيجيات لتداول أسواق متعددة.
إحدى القواعد الإضافية التي تستخدمها استراتيجية دانيال هي عبارة عن توقف توقف يستند إلى أتر. يتم تعيين وقف الخسارة الثابتة في 180٪ من أتر لمدة 20 يوما. إذا تم تشغيل وقف الخسارة، تبقى الاستراتيجية خارج السوق حتى يتم إنشاء إشارة في الاتجاه المعاكس. ويشير الاختبار إلى أن إعادة الدخول على إشارة في نفس الاتجاه أثرت سلبا على الأداء.
أداء الاختبار المسبق.
نتائج الاختبار الخلفي التي دانيال شملت في منصبه تبين أن الاستراتيجية كانت مربحة جدا. أنتجت نسبة الفوز 45٪، وهو عامل ربح 1.38، ومكافأة إلى نسبة خطر 1.68. دانيال & # 8217؛ ق أكبر قلق حول الاستراتيجية هو أن فترة السحب القصوى تمثل وقتا طويلا جدا.
وفقا لأرقام دانيال و # 8217، كان متوسط العائد السنوي 9.67٪. وكان هذا يتألف من 16 سنة مربحة، 4 سنوات خاسرة، وسنة واحدة أن كسر أساسا حتى. وكان أفضل عام عائدا قدره 37.76٪، وكان أسوأ عام خسارة 20.2٪.
ويشير دانيال إلى أن هذا النظام لن يمثل إستراتيجية جيدة بذاتها بسبب عوائده بالنسبة إلى السحب القصوى. ومع ذلك، فإنه يشير إلى أنه يمكن أن يكون قطعة مثيرة للاهتمام من استراتيجية أكبر، نظام متعدد.
1 رد.
نعم، استخراج البيانات هو نظام مفيد جدا في استراتيجية الفوركس، فإنه يساعد على اكتساب المزيد والمزيد من المعلومات & # 8217؛ ق على المنتج.
بيانات التعدين.
ما هو "استخراج البيانات"
تعد عملية استخراج البيانات عملية تستخدمها الشركات لتحويل البيانات الأولية إلى معلومات مفيدة. باستخدام البرامج للبحث عن أنماط في دفعات كبيرة من البيانات، يمكن للشركات معرفة المزيد عن عملائها ووضع استراتيجيات التسويق أكثر فعالية وكذلك زيادة المبيعات وخفض التكاليف. ويعتمد استخراج البيانات على جمع البيانات بشكل فعال والتخزين وكذلك معالجة الحاسوب.
كسر أسفل "استخراج البيانات"
تخزين البيانات.
عندما تقوم الشركات بتمركز بياناتها في قاعدة بيانات أو برنامج واحد، يطلق عليها اسم تخزين البيانات. وباستخدام مستودع بيانات، قد تدور المنظمة أجزاء من البيانات لمستخدمين محددين لتحليلها واستخدامها. ومع ذلك، في حالات أخرى، قد يبدأ المحللون مع نوع البيانات التي يريدون وإنشاء مستودع بيانات استنادا إلى تلك المواصفات. وبغض النظر عن كيفية تنظيم الشركات والكيانات الأخرى لبياناتها، فإنها تستخدمها لدعم عمليات صنع القرار في الإدارة.
البيانات التعدين البرمجيات.
وتحلل برامج استخراج البيانات العلاقات والأنماط في البيانات استنادا إلى ما يطلبه المستخدمون. على سبيل المثال، يمكن استخدام برامج استخراج البيانات لإنشاء فئات من المعلومات. لتوضيح، تخيل مطعم يريد استخدام استخراج البيانات لتحديد متى ينبغي أن تقدم بعض العروض الخاصة. فإنه ينظر في المعلومات التي تم جمعها ويخلق الطبقات على أساس عندما يزور العملاء وما يأمرون.
في حالات أخرى، يجد عمال المناجم البيانات مجموعات من المعلومات على أساس العلاقات المنطقية، أو أنها تنظر في الجمعيات والأنماط المتسلسلة لاستخلاص استنتاجات حول الاتجاهات في سلوك المستهلك.
عملية استخراج البيانات.
وتنقسم عملية استخراج البيانات إلى خمس خطوات. أولا، تقوم المنظمات بجمع البيانات وتحميلها في مستودعات البيانات الخاصة بها. بعد ذلك، يتم تخزين البيانات وإدارتها، إما على خوادم داخلية أو في السحاب. محللون الأعمال، وفرق الإدارة ومهنيي تكنولوجيا المعلومات الوصول إلى البيانات وتحديد كيف يريدون تنظيمه. ثم يقوم البرنامج التطبيقي بفرز البيانات استنادا إلى نتائج المستخدم، وأخيرا، يعرض المستخدم النهائي البيانات في شكل سهل المشاركة، مثل رسم بياني أو جدول.
ماذا يحدث عندما كنت البيانات الألغام 2 مليون استراتيجيات كوانتيتي الأساسية.
ماذا يحدث عندما كنت البيانات الألغام 2 مليون استراتيجيات كوانتيتي الأساسية.
وكما ذكرنا من قبل، وهنا، هنا وهنا، هناك أدلة دامغة على أن عدد الشذوذ الأسهم في الكون هو أقل بكثير مما كان يعتقد في الأصل. معظم الأبحاث السابقة تحاول تصفية الشذوذ الماضية في الأدب (عموما أكثر من 300+) من خلال تطبيق معايير أكثر صرامة، مثل ارتفاع قيم P أو أكثر من الاختبارات الإحصائية المتقدمة.
ورقة عمل ندرسها أدناه، & # 8220؛ p - القرصنة: أدلة من مليوني استراتيجيات التداول & # 8221؛ من قبل كورديا، غويال وساريتو، يأخذ نهجا بديلا. يأخذ المؤلفون كومبوستات الكون من نقاط البيانات، واستخدام كل متغير في مجموعة البيانات لخلق أكثر من 2 مليون استراتيجيات التداول & # 8212؛ استخراج البيانات الصريحة!
والفكرة الكامنة وراء هذه الورقة هي دراسة ما هو ممكن إذا كان أحد البيانات ببساطة ميند الكون كله من الإشارات. يبذل المؤلفون جهدا لدراسة الاستراتيجيات القابلة للتداول فقط من خلال إزالة الأسهم الصغيرة والمتناهية الصغر. وبالإضافة إلى ذلك، فإن المؤلفين تطبيق معايير إحصائية أكثر صرامة (والتي سوف نناقش أدناه) لتحديد الشذوذ الحقيقية في البيانات.
بعد فحص جميع الإشارات، لا يجد المؤلفون سوى عدد قليل من استراتيجيات التداول التي هي & # 8220؛ شاذة & # 8221؛ ومعظم هذه الاستراتيجيات لا معنى لها اقتصاديا! الآن يفترض المؤلفون (من خلال اختباراتهم) أن نموذج فاما و 5-فاكتور الفرنسي بالإضافة إلى الزخم يفسر المقطع العرضي لعائدات الأسهم (لذلك يتم التحكم في جميع الخصائص الكلاسيكية التي نتحدث عنها جميعا في الدراسة)، ولكن المؤلف الرئيسي هو أن هناك القليل من أي دليل على وجود حالات شذوذ إضافية.
ومع ذلك، فقد وجدت العديد من الأوراق بالفعل هذا. فلماذا هذه الورقة مهمة؟
وهناك موضوع جديد نسأل عنه عادة هو تعلم الآلة. كثيرون مفتونون بفكرة & # 8212؛ والسماح للكمبيوتر مع خوارزميات لها تأتي مع أفضل إشارات التداول باستخدام كافة البيانات. في البداية، وهذا يبدو كبيرا (وفي سياقات معينة يمكن أن تكون مفيدة للغاية). ولكن مع اتخاذ خطوة إلى الوراء، نحن بحاجة إلى فحص ما يحدث إذا كنا ببساطة فحص جميع البيانات. وتسلط هذه الورقة الضوء على أن التداول في كل إشارة في الكون الأساسي للإشارة لا ينتج تقريبا أي تشوهات إضافية (إضافية). (1) قد يكون الحال هو أن التعلم الآلي هو عظيم في الجمع بين الشذوذ المعروفة بالفعل أن المؤلفين يفترض في ورقة (مثل القيمة والزخم)؛ ومع ذلك، قد ينتهي التعلم الآلي أيضا إلى تعزيز تكاليف الاحتكاك وزيادة فرص التوصل إلى نتيجة الملغومة (على الرغم من خوارزميات أفضل الجهود لتجنب هذه المشكلة).
وفيما يلي نقش في تفاصيل الورقة.
تبحث الورقة فكرة إيجاد شذوذ بطريقة مختلفة عن معظم & # 8212؛ ببساطة الألغام الألغام.
وفيما يلي ملخص رفيع المستوى من الورقة:
وننظر في قائمة جميع المتغيرات المحاسبية على كومبوستات والمتغيرات الأساسية في السوق على كرسب. نحن نبني إشارات التداول من خلال النظر في مجموعات مختلفة من هذه المتغيرات الأساسية وبناء ما يقرب من 2.1 مليون إشارات تجارية مختلفة.
وهناك شاشتان إضافيتان أعجبهما من تلك الورقة هما: (1) إلغاء جميع الشركات التي لديها أسعار أسهم أقل من 3 دولارات، وكذلك تلك التي تقل عن المئين العشرين لرأس المال السوقي، و (2) تتطلب من جميع المتغيرات الحصول على معلومات تشمل الشركة العينة. (2)
ثم تبحث الورقة المتغيرات 156 في مكتبة كومبوستات (المدرجة في الملحق A1 من الورقة) لإنشاء أكثر من 2 مليون إشارة تجارية. هنا هو كيف يتم إنشاء الإشارات، مباشرة من ورقة:
هناك 156 المتغيرات التي مسح المرشحات لدينا، ويمكن استخدامها لتطوير إشارات التداول. وترد قائمة بهذه المتغيرات في الجدول أ 1. ونحن نشير إلى هذه المتغيرات كما مستويات. ونقوم أيضا ببناء معدلات نمو من سنة إلى أخرى لهذه المتغيرات. ولما كان من الشائع في الأدبيات بناء نسب من المتغيرات المختلفة فإننا نحسب أيضا جميع التوليفات الممكنة لنسب من مستويين، ونسبت نسبتين، ونسب أي معدلين للنمو، تدل على نسب معدلات النمو. وأخيرا، فإننا نحسب أيضا جميع التوليفات الممكنة التي يمكن التعبير عنها كنسبة بين الفرق بين متغيرين لمتغير ثالث (أي، (x1 - x2) / x3). ونحن نشير إلى هذه المجموعة الأخيرة كنسب من ثلاثة. نحصل على ما مجموعه 2،090،365 إشارات ممكنة.
وبما أن الورقة قد ألغت بالفعل الأسهم الصغيرة والمتناهية الصغر من الاختبارات، فإنها تشكل محافظ باستخدام نوع أحادي البعد على كل من المتغيرات. وتعاد موازنة الحوافظ سنويا، مما يؤدي إلى إنشاء حوافظ طويلة / قصيرة تمتد العشري الأعلى على كل مقياس، وتقصر العشرية السفلية.
تختبر الورقة هذه 2 مليون محفظة من خلال (1) تراجع عوائد محفظة L / S ضد فاما والنموذج الفرنسي 5 عامل بالإضافة إلى عامل الزخم و (2) فحص فاما-ماكباث (فم) الانحدارات.
الاختبارات والنتائج.
قبل الدخول في نتائج محددة، وممارسة جيدة (وخاصة عند استخراج البيانات) هو مجرد دراسة توزيع النتائج. ويبين الشكل 1 (المبين أدناه) في الورقة التوزيعات و t-ستاتس.
المصدر: p-هاكينغ: دليل من اثنين مليون استراتيجيات التداول. تم الوصول إليها من سرن في 8/28/17. والنتائج هي نتائج افتراضية وليست مؤشرا على النتائج المستقبلية ولا تمثل عوائد حققها أي مستثمر فعليا. فهذه المؤشرات غير مدارة، ولا تعكس رسوم الإدارة أو التداول، ولا يمكن للمرء أن يستثمر مباشرة في المؤشر. تتوفر معلومات إضافية حول بناء هذه النتائج عند الطلب.
كما هو مبين من التوزيعات، يتركز معظمها حول 0. (3) والسؤال هو كما يلي: كيف قوية هي استراتيجيات التداول هذه مع ألفاس كبير ومعاملات فاما-ماكبث؟
وفحص العوائد الخام أولا، وجدت الورقة 22،237 محفظة مع T - احصائيات فوق 2.57 (بالقيمة المطلقة) & # 8212؛ وهذا أقل من 1٪ من إجمالي المحافظ. بعد ذلك، تبحث الورقة الانحدارات 6-عامل وتجد أن حوالي 31٪ من العينة لديها ألفا كبيرة في ذلك المستوى 5٪، و 17٪ من العينة كبيرة عند مستوى 1٪. أخيرا، فحص فاما-ماكبيث الانحدارات، ورقة يجد نتائج مماثلة & # 8212؛ 31٪ من العينة لديها T-ستات فوق 1.96، و 18٪ من العينة لديها T-ستات فوق 2.57.
واستنادا إلى هذه الاختبارات المستقلة (التراجع ولفاس فم)، فإن النتائج واعدة. ومع ذلك، فإن المؤلفين حفر في الإحصاءات مع اختبارات أكثر تقدما.
والسبب في القيام بذلك، كما ناقشنا هنا من قبل، هو أنه كلما زاد عدد الأفكار (في حالتنا، 2 مليون)، يزيد احتمال حدوث أخطاء النوع 1. يصف المؤلفون هذا جيدا في ورقتهم:
اختبار الفرضية الكلاسيكي الكلاسيكي يستخدم مستوى الأهمية \ ألفا للتحكم في خطأ النوع الأول (اكتشاف الايجابيات الخاطئة). في اختبار فرضية متعددة (مهت)، باستخدام \ ألفا لاختبار كل فرضية فردية لا تسيطر على الاحتمال الكلي للإيجابيات كاذبة. على سبيل المثال، إذا كانت إحصائيات الاختبار مستقلة وتوزع عادة، وقمنا بتعيين مستوى الدلالة عند 5٪، فإن معدل الخطأ من النوع الأول (أي احتمال إجراء اكتشاف كاذب واحد على الأقل) هو 1 & # 8211؛ 0.95 ^ 10 = 40٪ في اختبار عشر فرضيات وأكثر من 99٪ في اختبار 100 الفرضيات. هناك ثلاثة مقاربات واسعة في الأدبيات الإحصائية للتعامل مع هذه المشكلة: معدل الخطأ الأسري (فوير)، ومعدل الاكتشاف الكاذب (فدر)، ونسبة الاكتشاف الكاذبة (فدب). وفي هذا القسم، نصف هذه النهج ونقدم تفاصيل عن تنفيذها.
اختبار المؤلفين ومناقشة هذا الإطار اختبار الفرضية المتعددة في القسم 3 من الورقة والنتائج هي وثائق في الجدول 4. (4) ومع ذلك، لا تزال الاكتشافات الكاذبة لا تزال تحدث (بحكم التعريف الاختبارات تسمح بذلك). ولتصحيح ذلك، يفرض المؤلفون عقبات اقتصادية. وترد أدناه العقبات:
وترد أدناه العقبات:
يجب أن تكون الاستراتيجية ذات دلالة إحصائية لكل من (1) 6 الانحدار عامل و (2) الانحدار فاما-ماكبيث. يجب أن تكون الاستراتيجية نسبة شارب أعلى من السوق خلال الفترة الزمنية المدروسة، وكذلك في كل من العينات الفرعية (تقسيم مجموعة البيانات في اثنين)
والنتائج الكاملة (باستخدام اختبارات متعددة) في الجدول 5 من ورقة. الكتاب تلخيص النتائج هنا:
يلخص المؤلفون النتائج هنا:
باختصار، في السيناريو الأكثر تفاؤلا حيث نعتبر نهج بيس أقل صرامة (وبالتالي، إهمال لحساب الترابط المتبادل في البيانات)، نجد على الأكثر 345 استراتيجيات ذات أهمية اقتصادية (52 إذا فرضنا بعض الثبات في الاقتصاد أداء). في السيناريو الأقل تفاؤلا باستخدام نهج فور، نجد 5 استراتيجيات. إذا كنا نحسب بشكل صحيح الخصائص الإحصائية لعملية توليد البيانات واستخدام نهج الحزب الديمقراطي الحر، فإننا نترك مع حفنة من الفرص الاستثمارية الاستثنائية. إذا اعتمدنا نهجا متحفظا ومتحكما فدب في غاما = 1٪ (أي أننا نقبل واحد في المائة من الاكتشاف المحظوظ بين جميع الاكتشافات في المتوسط أو في عينتنا)، فإننا نرفض كل مليوني استراتيجية.
لذلك عالية المستوى، استراتيجيات قليلة جدا كبيرة باستخدام المؤلفين & # 8217؛ متطلبات الاختبار!
والسؤال الطبيعي هو ما هي الاستراتيجيات التي تبقى على قيد الحياة، وهل لها معنى؟
ويدرس المؤلفون بعض الاستراتيجيات الواردة في الجدول 6 من الورقة (المبينة أدناه):
المصدر: p-هاكينغ: دليل من اثنين مليون استراتيجيات التداول. تم الوصول إليها من سرن في 8/28/17.
الاستراتيجيات ال 17 في هذا الجدول هي مختلفة عن الاستراتيجيات 447 اختبارها في تكرار الشذوذ (2017) من قبل هو، شيويه، وتشانغ. بالنسبة لأولئك الذين يستخدمون المتغيرات كومبوستات، قائمة من الأسماء يمكن العثور عليها هنا. لذا فإن دراسة الإستراتيجية الأولى أعلاه (ذات دلالة إحصائية) هي الإستراتيجية المقترحة هي فرز الأسهم على الأسهم العادية / العادية (ناقص) الأرباح المستبقاة / التعديلات الأخرى (رياجو) مقسومة على نفقات الإعلان (زاد).
غالبية الاستراتيجيات الأخرى أعلاه هي مجرد عبثية (المتعة مع وصلة تعريف كومبستات!).
استنتاج.
وبصفة عامة، تبحث هذه الورقة ما هو ممكن إذا كان مجرد بيانات-ميند قاعدة بيانات كومبوستات. المؤلفين فرض مهت فضلا عن 2 القيود، أن الاستراتيجيات تحتاج إلى العمل ل (1) كل من 6-عامل و فاما-ماكبيث الانحدارات و (2) اجتياز اختبار نسبة شارب. بعد هذه القيود، وجد الباحثون القليل جدا من الاستراتيجيات الهامة. من المهم أن نتذكر أن المؤلفين & # 8217؛ الافتراض الأساسي هو أن 6 عوامل (فاما والفرنسية 5 عوامل بالإضافة إلى الزخم) هي معينة. ومع ذلك، في المرة القادمة شخص الملعب لك خوارزمية تعلم الآلة، والحفاظ على هذه الورقة في الاعتبار. وإلا، قد تستثمر في استراتيجية تصنف على نسب لا معنى لها اقتصاديا!
اسمحوا لنا أن نعرف ما هو رأيك!
ملاحظة: ملاحظة أنا يجري قليلا فليبانت نحو آلة التعلم هنا، وهو لا يعني أنه ليس له قيمة (جوجل قد أثبتت ذلك!). ومع ذلك، وأنا أحاول أن أبرز أن تعلم الآلة عموما يأتي مع الأفكار التي تم دراستها في الماضي، مثل القيمة، الزخم، والجودة على سبيل المثال لا الحصر. قد يكون التعلم الآلي قادرا على تحسين عند الدخول والخروج من عامل (عامل التوقيت)، ولكن هذا قد ثبت بالفعل أن يكون صعبا. بالإضافة إلى ذلك، ينبغي للمرء أن ينظر دائما في العواقب الضريبية / الاحتكاكية عند الاستثمار، والنماذج مع المزيد من التداول ينبغي خصمها بشكل مناسب للمستثمرين الخاضعين للضريبة.
p - القرصنة: أدلة من مليوني استراتيجيات التداول.
تارون كورديا، أميت غويال، وأليسيو ساريتو وهناك نسخة من ورقة يمكن العثور عليها هنا.
نحن تنفيذ نهج استخراج البيانات لتوليد نحو 2.1 مليون استراتيجيات التداول. هذه المجموعة الكبيرة من الاستراتيجيات بمثابة مختبر لتقييم خطورة القرصنة P والتطفل البيانات في التمويل. ونحن نطبق تقنيات اختبار فرضية متعددة تمثل الارتباطات المتقاطعة في الإشارات وتعود إلى إنتاج عتبات إحصائية t تتحكم في نسبة الاكتشافات الكاذبة. ونجد أن الفرق في معدلات الرفض التي ينتجها اختبار الفرضية المفردة والمتعددة هو أن معظم حالات رفض عدم وجود أي تفوق في الأداء في اختبار الفرضية الواحدة هي كاذبة على الأرجح (أي أننا نجد نسبة عالية جدا من أخطاء النوع الأول). الجمع بين المعايير الإحصائية مع الاعتبارات الاقتصادية، نجد أن عددا كبيرا بشكل ملحوظ من الاستراتيجيات البقاء على قيد الحياة لدينا إجراء فحص شامل. وحتى هذه الاستراتيجيات الباقية لا تستند إلى أسس نظرية. وعموما، فإن القرصنة P مشكلة خطيرة، وتصحيح لذلك، تفوق استراتيجيات التداول نادرة.
الآراء والآراء الواردة هنا هي آراء المؤلف ولا تعكس بالضرورة وجهات نظر شركة ألفا أرتشيتكت أو الشركات التابعة لها أو موظفيها. تتوفر إفصاحاتنا الكاملة هنا. تعريفات الإحصائيات الشائعة المستخدمة في تحليلنا متاحة هنا (نحو الأسفل). انضمام الآلاف من القراء الآخرين والاشتراك في بلوق لدينا. هذا الموقع لا يوفر أي معلومات عن إتفس القيمة لدينا أو إتفس الزخم لدينا. يرجى الرجوع إلى هذا الموقع.
مثل بوست؟ تبادل المعرفة!
نبذة عن الكاتب: جاك فوجيل، دكتوراه.
جاك فوجيل، دكتوراه، بإجراء البحوث في التسعير الأصول التجريبية والتمويل السلوكي، وهو مؤلف مشارك من المستشار المالي دي: حل بسيط لبناء وحماية ثروتك. تدرس أطروحته كيف تؤثر التحيز السلوكي على قيمة الشذوذ. وتشمل خلفيته الأكاديمية الخبرة كمدرب ومساعد أبحاث في جامعة دريكسل في كل من قسم المالية والرياضيات، فضلا عن مدرب المالية في جامعة فيلانوفا. الدكتور فوجيل هو حاليا العضو المنتدب لشركة ألفا أرتشيتكت، ليك، وهو مستشار استثمار مسجل لدى سيك، حيث يرأس قسم البحوث ويعمل كمدير مالي. وهو حاصل على درجة الدكتوراه في العلوم المالية وماجستير في الرياضيات من جامعة دريكسل، وتخرج من درجة البكالوريوس في الرياضيات والتربية من جامعة سكرانتون.
الوظائف ذات الصلة.
استراتيجيات الإرجاع إلى القيمة عندما ينتشر التقييم على نطاق واسع (القيمة العميقة)
مراجعة الكتب & # 8212؛ توقيت السوق مع المتوسطات المتحركة.
البحوث الأكاديمية البصيرة: صناعة الرعي من قبل البائعين قصيرة إشارات إلى أن الظروف المتغيرة.
البحوث الأكاديمية البصيرة: حذار من مفاجأة مغادرة المديرين المستقلين!
الزخم والسوق الشذوذ.
14 تعليقات.
سيكون من الرائع أن يجرب الناس قبضات قصيرة الأجل؛ 1 سنة كبيرة لمعدل الضريبة وصناديق الاستثمار المشترك ولكن لنا القليل من الرجال & # 8230؛ ..
على ما يبدو، مؤلف مقالتك على الإطلاق أي علم من آلة التعلم. هذا العار أن آلة التعلم قد تقوض في هذه المقالة. أنت تقول، & # 8220؛ .. تعلم الآلة عموما يأتي مع الأفكار التي تم دراستها في الماضي .. & # 8221؛
في: التعلم الآلي يأتي مع التنبؤات على أساس خوارزميات رياضية ملموسة. (الأفكار غامضة)
ثانيا، في مل ننشئ ميزات إضافية (وليس مجرد التاريخية) باستخدام أدوات استخراج البيانات ليس فقط، كما نوقش في مقالك، ولكن أيضا باستخدام فروع مهمة أخرى من الرياضيات مثل الجبر الخطي وحساب التفاضل والتكامل.
الكل في الكل، وأعتقد اعتقادا قويا أنه إذا كان مؤلف هذه المقالة لديه القليل أو لا يعرفون المعرفة حول آلة التعلم، وقال انه أفضل لا تجعل من سخرية منه.
كما المؤلف، وهذا ليس القصد. استخدام مل له فوائد، لا خلاف مني.
أداء الجهاز يميل يعتمد على الميزات، والمتنبئات، والعوامل، الخ المستخدمة. بناء ميزات إضافية، الهندسة ميزة a. k.a، التي تقترحها البيانات وبأي وسيلة رياضية هو بالضبط ما مقارنات متعددة و P - القرصنة هي كل شيء. ومع ذلك، يبدو التعلم الآلي للعمل بشكل جيد مع الميزات التي لها قيمة اقتصادية وتستند على أساس متين. ولكن بشكل عام، الطريقة التي يمارس بها تعلم الآلة يؤدي إلى نماذج غير ذات دلالة إحصائية. وذلك لأن 95٪ من العمل هو العثور على الميزات ذات الصلة، والتعلم الآلي هو مجرد 5٪ من وظيفة لتصنيف والحصول على احتمالات الطبقة 1.
بريمان & # 8217؛ s (سب؟) خوارزميات الغابات العشوائية على سبيل المثال لا تتطلب منك الانخراط في & # 8216؛ الهندسة ميزة & # 8217 ؛. فإن فرز الخصائص ذات الصلة هو جزء من العملية. وبالمثل، باستخدام حبات، في، على سبيل المثال. سفم، يمكنك تقليل الحاجة إلى بناء ميزات معقدة من البيانات الخام.
الحدود بين تعلم الآلة والأساليب الإحصائية غامض تماما. ما الذي يطلق عليه اسم فيشر & # 8217؛ s؟ ولدى انكوش نقطة طفيفة لكنه يبالغ في قضيته.
لا أعتقد أنني ادعى أن هندسة الميزة مطلوبة. وبقدر ما كان بريمان & # 8217؛ s رف، مع الإشارة كمسابقة نوميراي، كان أدنى أداء من حوالي اثني عشر ألغوس اعتدت لعدة أشهر. وعلاوة على ذلك، باستخدام حبات، يتم زيادة خطر الإفراط في تركيب. في خطر عام من الإفراط في تركيب مرتفع مع مل ولكن مرة أخرى باستخدام مل هو أكثر من فن من العلم المعنية.
شكرا لنشر جاك! ورقة مثيرة للاهتمام بطريقة أنه يوفر اختبارا مباشرا للقرصنة P في الفضاء الشذوذ، ولكن أنا أتفق مع انكوش أن تتصل P القرصنة / استخراج البيانات إلى التعلم آلة غير عادلة بعض الشيء ومربكة.
سعيد للنشر. أنا لا توافق مل فوائد؛ هذه الورقة ببساطة يسلط الضوء على أن استخدام منهجيتها (من أجل التوصل إلى 2+ مليون استراتيجيات التداول) يعطي استراتيجيات قليلة جدا التي تلبي عقبات المؤلف & # 8217؛ s المفروضة على البيانات.
يبدو مثل بوجل لول.
تحليل ممتاز للورقة ولكن ادعي أن الدلالة الإحصائية هي الطريقة الخطأ للذهاب لهذه المشكلة بسبب كل من النوع الأول ولكن أيضا أخطاء النوع الثاني. تحديد عندما تتغير ظروف السوق هو أكثر أهمية بكثير في نهاية اليوم من أي تحليل إحصائي. هنا ورقتي على th9is paper. ssrn / sol3 / paper. cfm؟ abstract_id = 2810170.
شكرا على بريدك الرائع الاخر!
فيما يتعلق بمتغيرات كومستات كيف تحصل على إبيت (كجزء من شاشة التقييم إبيت / إيف في بناء & # 8220؛ فهرس القيمة & # 8221 ؛؟). الشيء خزانة يمكنني العثور عليه كان & # 8220؛ الدخل التشغيلي بعد الاستهلاك & # 8221؛.
إغلاق، نضيف مرة أخرى الدخل غير التشغيل كذلك. قمنا بفحص طرق متعددة لحساب هذا ولم تكن هناك فروق ذات دلالة إحصائية.
2090365 استراتيجيات تبدو مثيرة للإعجاب ولكن بالكاد يمس مساحة البحث. النظر فقط المعلمات، لدينا 2 ^ 156 مجموعات فرعية المعلمة (طيب، طرح واحد لمجموعة فارغة) التي لبناء الصيغ مع. لكل من هذه، ثم النظر في كل الصيغ الخطية الممكنة، ثم كل الصيغ التربيعية الممكنة، الإعلان اللانهائي. لا يمكن للبشر فهم، ولكن المتعلم العميق قد يذهب أبعد بكثير، وخاصة مدعوم من محرك الكم تحت. بالنسبة لي، فإن المساهمات الأكبر هي نهج قائم على البيانات لاختيار المعلمة، والقبول بأن العديد منها ليست مستقلة، وأفكار تقييم الاستراتيجية.
Comments
Post a Comment