본문 바로가기

BITS

[Reinforcement Learning in Finance] Options and Option pricing

Reinforcement Learning in Finance 에 관한 testing 환경을 조성

- 유연하고 확장성을 지님

- discrete action 과 continuous action 을 비교

- hedging, trading, pricing in financial market 의 문제를 다룸


Black Scholes Merton (BSM) Model

- 현대 finance의 cornerstone이 되는 model


Corporate Default: The Merton Model

- Merton Model은 한개의 회사에 대해 단순화하는데 이는 firm value 라고 불리는 single asset을 가지고 있다. 

- firm은 equity holders 에 의해 운영되는데, 만약 time T에 firm의 asset이 debt의 face value인 D보다 크면 D를 지불하고, 나머지를 유지한다. 만약 적은 경우에는 bond holders가 이를 가지고 recovery value $V_t$를 회복하고, equity holders는 아무것도 얻지 못한다. 

- Merton Model을 이용하여 corporate defaults를 예측하고,  structural model 기반으로한 default model이 system의 dynamics에 대해 매우 구체적으로 접근한다.

Merton model for corporate default 은 default 할 확률을 제공하고, 한 회사의 빚이나 주식의 가치를 계산한다.


Option Pricing: Black-Scholes-Merton

- equity holder가 본인의 future (time T에 돌려받을) 주식을 현재 사기를 권한다. 현재 이회사는 $V_0$ = $1m, 이고 debt D = $600k 이다. 그렇다면 얼마를 지불해야 할까?

- 이러한 상황을 option이나 financial derivative라고 부른다. 

- stock option은 미래에 앞서 정해진 가격으로 주식을 사게 되는 계약을 의미한다. 

- 이는 option이라는 이름처럼 선택적이며, 강제적이지 않다. 즉, time T에 해당 주식이 좋지 않다고 생각하며 price K를 지불하지 않을수 있다. 

- derivative라는 이름처럼, stock의 가치로부터 derived 된 값을 의미한다. 

- 더 구체적으로 위의 정의는 european call option이다. 이러한 option의 buyer는 주식을 미래의 T라는 시간에 앞서 정해진 금액인 K라는 금액 (option strike) 으로 살수 있는 권리를 갖게된다. maturity time t에 option의 가치는 

$C_T = max(S_T - K, 0) $ 인데, 

이는 final stock price인 S_T가 stirke K보다 높으면, buyer가 이러한 option의 stock을 k 에 사는것이 합당하다. 왜냐하면, 주식은 시장가격으로 바로 다시 resold 될수 있기 때문이다.  여기서 profit 은 $S_T - K$ 이다. 

 - 그러나 terminal price가 K보다 작은 경우, option의 stock을 사는것은 합당하지 않다. 이럴떄 profit은 0이 된다.

- final sell price를 모르는 경우는? 아마 이를 BSM모델이 해결해줄것같다. (아직 모름..)  

This is a translated note for the coursera course (linked below).  

https://www.coursera.org/learn/reinforcement-learning-in-finance/lecture/gaTCt/options-and-option-pricing