3 روش - در این مطالعه ، ما یک چارچوب مبتنی بر GAN ایجاد می کنیم که ترکیب رویکرد PLR ، LSTM و سه مدل GAN برای تولید اقدامات تجاری با عملکرد بالا است. روند کلی در شکل 1 نشان داده شده است ، و می توان آن را به سه مرحله به شرح زیر تقسیم کرد:
- مرحله اول: پیش پردازش داده ها:
- مرحله 1: ایجاد ویژگی های ورودی برای آموزش مدل از جمله قیمت افتتاح روزانه ، قیمت بسته شدن ، بالاترین قیمت ، کمترین قیمت ، حجم معاملات و شاخص های فنی.
- مرحله 2: از رویکرد PLR برای تولید اهداف خروجی واقعی مانند اقدامات معاملاتی با شناسایی نقاط معاملاتی (زمان معاملات) بر اساس قیمت بسته شدن تعدیل شده استفاده کنید. پس از آن ، تمام نقاط معاملاتی را به اقدامات معاملاتی مانند خرید ، فروش یا برگزاری تبدیل کنید.
- مرحله 3: برای به دست آوردن داده های نمونه براساس تاریخ ، ویژگی ها و اقدامات معاملاتی را ادغام کنید.
- مرحله 1: برای پیش بینی توالی های معاملاتی بر اساس ویژگی ها ، یک ژنراتور را در چارچوب مبتنی بر GAN بسازید.
- مرحله 2: برای تعیین اینکه آیا یک دنباله معاملاتی ورودی ، دنباله معاملاتی واقعی است که با استفاده از PLR یا دنباله معاملاتی پیش بینی شده توسط ژنراتور GAN پیش بینی شده است ، یک تبعیض ساز در چارچوب مبتنی بر GAN ایجاد کنید.

از همگرایی کلیه پارامترهای مدل چارچوب مبتنی بر GAN با توجه به عملکرد مختلف از دست دادن ، یعنی آنتروپی متقابل و MSE اطمینان حاصل کنید.
برای ارزیابی عملکرد هر یک از چارچوب های مبتنی بر GAN ، از بازده تجمعی سرمایه گذاری (CR) ، نسبت شارپ (SR) و درصد برنده ( (WPTC )) استفاده کنید.
جریان دقیق فرآیند چارچوب مبتنی بر GAN پیشنهادی به شرح زیر است:
3. 1 پیش پردازش داده
روند تولید نمونه های آموزشی شامل سه مرحله ، یعنی تولید ویژگی ، تولید دنباله معاملات و تولید نمونه آموزش است.
3. 1. 1 تولید ویژگی به عنوان ورودی
قیمت افتتاحیه روزانه ، قیمت بسته شدن ، بالاترین قیمت ، کمترین قیمت ، قیمت بسته بندی تعدیل شده ( ( overline )) و از حجم معاملات برای محاسبه شاخص های فنی به عنوان ویژگی های ورودی استفاده می شود ، که شامل کل 152 شاخص فنی تولید شده با استفاده است97 روش تحلیل فنی. پاورقی 1 در مجموع 157 ویژگی استفاده می شود ، از جمله 152 شاخص فنی و 5 قطعه از داده های معاملات سهام (باز ، نزدیک ، زیاد ، کم ، حجم). ویژگی ورودی نهایی برای هر روز به عنوان (F ) مشخص می شود.<mathrm>>3. 1. 2 تولید توالی معاملات به عنوان هدف<overline
>_, <overline
>از روش PLR برای تولید یک توالی نقطه عطف شناخته شده استفاده می شود (d = [_ ، _ ، نقاط ، _^<overline
>_^<mathrm>>] ) از داده های تاریخی ( overline = [<mathrm>_ ، dots ،<mathrm>>] ) ، جایی که (^
- ) طول دوره معاملات در داده های آموزش است. سپس ، توالی نقطه عطف به یک توالی عمل تجارت تبدیل می شود (a = [_ ، _ ، dots ، _^
- ] ). مراحل مربوط به تولید دنباله معاملات به شرح زیر است:
- مرحله 1: نقاط شروع و پایان را در دنباله برای تقسیم داده های آموزش تنظیم کنید.
- مرحله 2: با استفاده از روش کمترین مربع ، یک عملکرد رگرسیون خطی ساده را محاسبه کنید.<underset<mathrm>_, if_=1>) .
- مرحله 3: نقطه T را با حداکثر انحراف بین قیمت واقعی یک سهام و قیمت پیش بینی شده با استفاده از عملکرد رگرسیون خطی در کل تقسیم بندی پیدا کنید. این نقطه نشان دهنده نقطه جدید تقسیم شده T است. (_ = 1 ) را تنظیم کنید.
مرحله 4: تقسیم بازگشتی را در نقطه تازه تقسیم بندی شده ، که دارای بخش های چپ و راست است ، انجام دهید. مراحل 1-4 را برای هر بخش جدید تکرار کنید تا یک آستانه توقف ( upgamma ) برآورده شود ، که بارها انحراف استاندارد چند برابر از کل تقسیم بندی است. سرانجام ، توالی نقطه عطف نهایی D پس از اتمام مرحله 1-4 به دست می آید ، و شاخص نقطه عطف (di ) به عنوان ( () بدست می آید.<prime>=>\_>مرحله 5: دنباله نقطه تنظیم نهایی D را به یک دنباله عمل معاملات A تبدیل کنید ، که به طور پیش فرض 0 است. انواع اقدامات معاملاتی نهایی در این نقاط عطف به شرح زیر است: $ $ a^
(الف) $ $<mathbb>3. 1. 3 تولید نمونه آموزش
$$<mathbb>در این بخش ، یک فرآیند نمونه گیری آموزش ویژه در نظر گرفته شده است. طول دوره معاملاتی (TP ) و تعدادی از روزهای داده تاریخی برای پیش بینی برای هر روز معاملاتی در نظر گرفته شده است. یک نمونه نمونه کامل ( ) از x با طول TP از (f ) تشکیل شده است:
$$= [_ ، dots _ dots ، _] $ $ که در آن (_ ) ویژگی های روز معاملات K را نشان می دهد. هر x حاوی ویژگی های (s ) است:
_ = سمت چپ [_ ، _ ، نقاط ، _ درست] $ $<^<prime>>که در آن (_ ) ویژگی روز K - S قبلی را نشان می دهد. برای هدف آموزش ، همان فرایند نمونه برداری اعمال می شود:<^<prime>>$ $ y = سمت چپ [_^<^<prime>>، dots _^ نقاط ، _^
درست] $ $
برای اعتبار سنجی و داده های آزمون ، از قیمت بسته شدن تنظیم شده برای محاسبه اقدامات معاملاتی هدف استفاده نمی شود و نمونه گیری طول (TP ) انجام نمی شود.<mathbb>3. 2 ساختمان چارچوب مبتنی بر گان
مدل مبتنی بر GAN پیشنهادی از یک ژنراتور و یک تبعیض آمیز تشکیل شده است. ژنراتور توالی معاملات ( widetilde ) را بر اساس ویژگی ها پیش بینی می کند ((
) نمونه های آموزش ؛تبعیض آمیز متمایز می کند که آیا دنباله معاملات دنباله معاملاتی پیش بینی شده ( widetilde ) یا دنباله معاملاتی واقعی (y ) است.
$$3. 2. 1 ژنراتور ژنراتور شامل دو لایه LSTM و دو لایه خطی است ، که در آن لایه اول (^) ویژگی پنهان یک روز را بر اساس ویژگی های روز قبل تخمین می زند ، لایه دوم (^) ویژگی های پنهان متوالی را برآورد می کندبا استفاده از خروجی لایه اول ، و لایه سوم (^) با استفاده از دو لایه خطی ، احتمال اقدامات معاملاتی را پیش بینی می کند. ابتدا همه (x ) را به لایه LSTM اول (^) وارد می کنیم تا ویژگی های پنهان هر روز را بدست آوریم (_^) از طریق ویژگی نقطه زمانی S-th (_^):<[h>_^=^ سمت چپ (_^ راست) ، s in [1 ، dots ، s] $ $
$$پس از آن ، ما از آخرین ویژگی پنهان در نقطه S استفاده می کنیم تا وضعیت نهایی هر روز را نشان دهیم. بنابراین ، بردارهای حالت نهایی (_^، dots ، _^ dots ، _^] ) از (^) برای به دست آوردن ویژگی های پنهان پی در پی (_^) به صورت زیر وارد لایه lStm دوم می شوند: _^=^ سمت چپ (
where (>_) contains (>_^) , (>_^) , and (>_^ راست) ، k in [1 ، dots ، mathrm] $ $
خروجی (_^) لایه دوم برای پیش بینی اقدامات معاملاتی از طریق (^) منتقل می شود. در (^) ، تخمین خط لوله با استفاده از لایه خطی اول با یک عملکرد Leaky Relu و لایه خطی دوم با یک عملکرد SoftMax انجام می شود:=[>_,dots>_dots ,>_]$$ _^) برای هر روز تجارت ؛اینها به ترتیب احتمال برگزاری ، خرید و فروش را نشان می دهند:
$ $ widetilde
که در آن ( widetilde ) توالی اقدامات پیش بینی شده معاملات را در تمام روزهای معاملاتی در کل دوره معاملاتی نشان می دهد. ژنراتور پیشنهادی همچنین مدل سلسله مراتبی-LSTM (H-LSTM) نامیده می شود.
3. 2. 2 تبعیض آمیز
این تبعیض شامل سه لایه LSTM است. اولین لایه LSTM (^
) ویژگی پنهان هر روز را تخمین می زند (_^
$$_^=^left(>) در نقطه زمانی k-th بر اساس قیمت بسته بندی تعدیل شده ( overline ) در یک نمونه آموزشی ، جایی که (k in [1 ، dots ، tp] ): دنباله عمل تجارت ( widetilde ) ، که یا واقعی (y ) یا پیش بینی شده ( widehat ) است ، برای به دست آوردن ویژگی پنهان عمل روزانه وارد یک لایه LSTM دیگر می شود. به شرح زیر است:
_ درست) $ $
(_^
) و (_^) از هر روز تجارت از (^<^<prime>>) لایه و لایه (^) به لایه LSTM سوم برای برآورد ویژگی پنهان متوالی هر روز تجارت:
آخرین خروجی (_^
(_<mathrm>) در زمان زمان TP از لایه سوم وارد لایه (^) می شود تا مشخص شود که آیا این توالی تجارت هدف واقعی است یا دنباله معاملاتی پیش بینی شده. در لایه (^) ، تخمین خط لوله با استفاده از یک لایه خطی با یک عملکرد Leaky Relu و یک لایه خطی دیگر با یک عملکرد SoftMax انجام می شود:<mathrm>3. 3 آموزش مدل و بهینه سازی<mathrm>) خروجی تبعیض آمیز است که با وارد کردن قیمت سهام واقعی ( overline ) و توالی عمل معاملات پیش بینی شده ( widetilde ) تولید شده توسط ژنراتور بدست می آید. (_<mathrm>) خروجی تبعیض آمیز با وارد کردن قیمت سهام واقعی ( overline ) و توالی عمل تجارت هدف (y ) تولید شده با استفاده از روش PLR است. پارامترهای مدل ژنراتور با استفاده از تنها (_ به روز می شوند.<mathrm>) برای به دست آوردن شیب. پارامترهای مدل تبعیض آمیز با استفاده از هر دو (_ (_) به روز می شوند
) و (_
) برای به دست آوردن شیب. علاوه بر این ، پارامترهای مدل از تمام چارچوب مبتنی بر GAN با استفاده از بهینه ساز آدام بهینه می شوند.
$$_^<mathrm>3. 3. 1 توابع از دست دادن در چارچوب ساده GAN<mathrm>)$$ در چارچوب ساده GAN ، از دست دادن ژنراتور L_G^GAN با استفاده از عملکرد آنتروپی متقاطع باینری محاسبه می شود:<mathrm>= Mathrm (1-_
$$_^<mathrm>جایی که ورود به سیستم عملکرد لگاریتم را نشان می دهد. به همین ترتیب ، ضرر تبعیض آمیز (_^<mathrm>) با استفاده از عملکرد متقاطع آنتروپی محاسبه می شود:<mathrm>)$$ = mathrm2 سمت چپ (_
راست)+ Mathrm (1-_<mathrm>3. 3. 2 عملکرد از دست دادن در چارچوب LSGAN
با توجه به مفهوم آموزش الگوریتم LSGAN ، از دست دادن ژنراتور (_^<mathrm>3. 3. 2 عملکرد از دست دادن در چارچوب LSGAN
$$_^<mathrm>ضرر تبعیض آمیز (_^<(_<mathrm>-0)>) در چارچوب LSGAN با استفاده از عملکرد MSE محاسبه می شود:<(_<mathrm>-1)>^$$ = frac
^+ frac<mathrm>3. 3. 3 عملکرد از دست دادن در چارچوب WGAN<mathrm>در چارچوب WGAN ، از دست دادن ژنراتور (_^<mathrm>) با استفاده از عملکرد آنتروپی باینری ، که همان است در مورد چارچوب ساده GAN محاسبه می شود. ضرر تبعیض آمیز (_^
$$_^<mathrm>=-_<mathrm>+_<mathrm>) در چارچوب WGAN با استفاده از الگوریتم WGAN-GP که توسط Gulrajani و همکاران تهیه شده است.(2017). گرادیان L2 هنجار از عملکرد ضرر تبعیض آمیز در چارچوب WGAN استفاده می کند. بنابراین ، (_^<(<Vert <abla>__<mathrm>>__<mathrm>>Vert>_-1)>^$$ ) به شرح زیر ارائه شده است:<mathrm>>+ lambda<mathrm>>جایی که ( lambda ) وزن مجازات را در خروجی نشان می دهد (__<mathrm>) ، و ( lambda ) روی 0. 1 تنظیم شده است. (__<mathrm>) خروجی تبعیض آمیز در چارچوب WGAN است و با وارد کردن قیمت سهام واقعی ( overline ) و دنباله عمل معاملات مختلط (_ به دست می آید.
$$_<mathrm>)از روش وزنی برای به دست آوردن توالی عمل معاملات مخلوط استفاده می شود (_) ، که شامل ( widetilde ) و (y ) است: = epsilon سمت چپ (y راست)+ سمت چپ (1- epsilon راست) سمت چپ ( widetilde
راست) ، 0 le epsilon le 1 $ $
جایی که ( epsilon ) یک مقدار تصادفی از 0 تا 1 را نشان می دهد.>3. 3. 4 توابع از دست دادن چارچوب های H-LSTM ، GAN-S ، LSGAN-S و WGAN-S
$$_>=sum_^sum_^_^mathrm(>_^)$$ $$_^<mathrm-S>,_^<mathrm-S>ضرر تبعیض آمیز (_^<mathrm) همگرایی مدل ژنراتورهای هر چارچوب مبتنی بر GAN را تقویت می کند. عملکرد از دست دادن مدل H-LSTM از عملکرد متقاطع طبقه بندی شده به شرح زیر است:<mathrm>= frac_>>$$ سمت چپ ( 1-_
$$_^<mathrm-S>ضرر تبعیض آمیز (_^<<(_<mathrm>-1)>^+_>>$$ در این حالت ، وزن متوسط هر دو مدل H-LSTM و مدل های مبتنی بر GAN در نظر گرفته شده است. عملکرد از دست دادن ژنراتور مدل LSGAN-S به شرح زیر است:
There are three indicators such as CR , SR , and WPCT to evaluate predicting performance for each framework. The probabilities that the daily predicted trading actions (widetilde) = ([>_,>_,dots ,>= frac