투자 도구

마지막 업데이트: 2022년 6월 22일 | 0개 댓글
  • 네이버 블로그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 트위터 공유하기
  • 카카오스토리 공유하기
국가가 내손안에!! 국채!

투자 도구

투자모델을 개발하기 위한 도구에 대해

    본문 폰트 크기 조정 본문 폰트 크기 작게 보기 본문 폰트 크기 크게 보기 가

저도 비슷한 질문을 많이 받는데 제 마음처럼 답을 해주셨네요.

(참고로 아래글 투자 도구 쓰신분은 현직 초고수 퀀트십니다.)

많이 듣는 질문이라 대답해 봤습니다.

개인 투자자나 막 투자론을 배우기 시작한 학생의 입장에서 투자모델을 개발하기 위한 도구에 대한 질문이 있습니다.

흔히 사용하는 ‘엑셀’로도 개발이 가능한지, 더 정교한 프로그래밍 언어를 배워야하는지 궁금하네요.

이 질문에 투자 도구 대한 답은 없습니다. 엑셀로 충분한 작업도 존재합니다. 그래도 여건이 허락한다면 파이썬이나 R, SQL, Go 언어등 다양한 툴을 알아두면 큰 도움이 된다고 생각합니다.

만약 목적이 글로벌 주식에 대한 투자기회의 발굴이나 Alternative Factor의 개발이라면 당연히 엑셀로는 불가능 합니다. 정보처리의 효율성 측면에서도 보면 엑셀보다는 다른 언어로 코딩하는게 편리합니다. 일일이 회사 정보를 찾지 않고 컴퓨터가 자동으로 정보를 긁어오게 하려면 웹 스크래핑(web scraping) 기술을 사용하면 네이버나 금감원에서 필요한 재무정보 들도 자동으로 신속하게 정리하고 모델링 할 수 있습니다.

금융인이 프로그래밍 투자 도구 언어를 안다는 의미는 기능적인 측면보다 사실 사고의 범위가 넓어진다는 의미가 더 큽니다. 엑셀만 사용하면 엑셀이 제공하는 기능에 사고가 한정됩니다. 엑셀이 제공하는 기능에 한정해서 투자 아이디어를 발굴할 수 밖에 없습니다.

여담이지만 파이썬이나 R이 그렇게 배우기 어려운 언어가 아닙니다. 오히려 엑셀 VBA가 더 어렵습니다. VBA는 무작정 외워야 할 함수나 기능이 많은데 파이썬이나 R등은 더 간결하죠. 파이썬이나 R은 추상화가 잘 되어있고 자연어에 가까워서 누구든 바로 배워서 사용하기 어렵지 않습니다. 전공과 상관없이요.

금융 이론을 실제적으로 어려움 없이 모두 구현할수 있는 코딩 능력 수준이 30점 정도이면 누구나 도달 가능합니다.(100점은 MS나 구글의 핵심 개발자 수준 프로그래머)

대고객 서비스를 만드는 전문가가 아니라는 전제에서 말이죠.

35점 정도까지 실력을 쌓고 나머지는 투자 공부를 하시면 됩니다. 다만 엑셀로는 35점 실력에 도달하지 못합니다.

* 필요스킬 30점 + 5점(약간의 코딩센스) 정도 더 잘하면 이쪽에서는 엄청 전문가 취급 받습니다.

주식 백테스팅을 한다고 했을 때 엑셀을 엄청 잘 다루는 사람도 데이터를 모으는 데만 두세시간이 걸릴 수 있습니다. 그러나 파이썬 웹 스크래핑 코드와 SQL 데이터베이스를 사용하면 간단한 백테스팅이 5분도 안립니다. 누구는 5분 동안 백테스팅 할 동안 다른 사람은 세 시간동안 데이터 모으기만 하는 거죠.

효율성에 엄청 큰 차이가 생깁니다. 때로는 엑셀로 일주일 걸릴 작업이 두세시간이면 끝나는 경우도 많습니다. 퀀트 모델링 분석에서는 시행착오(Try and error)를 많이 해보는 사람일수록 전문가입니다. 최신 논문이 나왔을 때도 본인이 직접 구현하면 지식이 쌓이는 속도가 향상되죠. 단순히 읽기 만한 논문 내용은 언젠가 머리속에서 휘발 되기 마련이기 때문에 얼마나 많은 논문을 직접 구현해봤고 실세계에 적용해 봤는지가 더 중요합니다. 그런 측면에서 프로그래밍을 사용했을 때의 모델 구현을 했을 때의 시행착오 횟수와 쌓이는 전략의 양은 차원이 다르다고 할 수 있습니다.

앞으로는 단순한 형태로 되어있는 국내 주식만 핸들링 하는 일보다 복잡한 형태의 글로벌 주식 데이터를 핸들링 할 일이 점점 많아질 것입니다.

거래 및 투자 도구

금융 시장을 이끄는 모든 주요 이벤트를 이 라이브 경제 캘린더로 확인해 보세요. 통화, 이벤트의 중요성, 일자 등의 필터링을 통해 여러분을 위한 맞춤형 캘린더를 만들 수 있습니다. 펀더멘탈 트레이딩을 하는 분들에게 매우 유용한 툴입니다.

휴가 캘린더를 통해 곧 있을 글로벌 시장의 폐장 시점을 파악할 수 있습니다. 휴가 중에는 글로벌 마켓이 악영향을 받을 수 있기 때문에 이 캘린더는 장기 트레이더에게 아주 중요한 툴입니다.

당사의 실적 발표 캘린더를 이용하여 전세계 기업의 분기 및 연간 실적보고 예상치 및 실제 발표치를 확인해 보세요. 발표 전 예상 주당순이익 (EPS)은 물론, 이전 및 발표 당시 주당 순이익도 조회할 수 있습니다.

주식 배당 캘린더에는 이미 발표된 배당과 배당락일이 포함되어 있습니다.

주식 분할 캘린더는 공지된 분할 정보는 물론 주식 병합 정보도 제공합니다. 전세계 기업의 최신 시장 공지와 기업 성과를 파악하세요.

이 페이지에서는 전세계 외화/주식 시장 오픈 시간 지도를 볼 수 있습니다. 외환 지도는 4개 주요 외환 거래소 운영 시간 및 겹치는 시간대를 보여드립니다. 주식시장 지도에서는 주요 글로벌 증권거래소의 거래시간을 보실 수 있습니다.

코스피지수2,426.89-54.14-2.18%
코스피200 선물 (F)315.70-8.80-2.71%
US 5004,017.9-39.8-0.98%
US Tech 10012,452.3-152.9-1.21%
DAX12,774.09-197.38-1.52%
닛케이27,878.96-762.42-2.66%
미국 달러 지수109.090+0.339+0.31%
투자 도구
1,732.95-16.85-0.96%
18.308-0.438-2.34%
브렌트유99.71+0.70+0.71%
WTI유93.75+0.69+0.74%
천연가스9.507+0.238+2.57%
구리3.5707-0.1263-3.42%
미국 옥수수670.25+6.25+0.94%
달러/원1,350.97+8.79+0.65%
유로/달러0.9954-0.0008-0.08%
브라질 헤알/원266.91+2.17+0.82%
엔/원9.7447-0.0104-0.11%
파운드/달러1.1679-0.0068-0.58%
태국 바트/원37.038-0.018-0.05%
달러/엔138.63+1.11+0.80%
애플163.62-6.41-3.77%
알리바바 ADR98.00-1.89-1.89%
트위터40.46-0.59-1.44%
알코아55.84-1.08-1.90%
뱅크오브아메리카34.03-1.11-3.16%
코카콜라63.11-1.56-2.41%
엑슨모빌97.87-1.22-1.23%

다운로드 App store

리스크 고지: 금융 상품 및/또는 가상화폐 거래는 투자액의 일부 또는 전체를 상실할 수 있는 높은 리스크를 동반하며, 모든 투자자에게 적합하지 않을 수 있습니다. 가상화폐 가격은 변동성이 극단적으로 높고 금융, 규제 또는 정치적 이벤트 등 외부 요인의 영향을 받을 수 있습니다. 특히 마진 거래로 인해 금융 리스크가 높아질 수 있습니다.
금융 상품 또는 가상화폐 거래를 시작하기에 앞서 금융시장 거래와 관련된 리스크 및 비용에 대해 완전히 숙지하고, 자신의 투자 목표, 경험 수준, 위험성향을 신중하게 고려하며, 필요한 경우 전문가의 조언을 구해야 합니다.
Fusion Media는 본 웹사이트에서 제공되는 데이터가 반드시 정확하거나 실시간이 아닐 수 있다는 점을 다시 한 번 알려 드립니다. 본 웹사이트의 데이터 및 가격은 시장이나 거래소가 아닌 투자전문기관으로부터 제공받을 수도 있으므로, 가격이 정확하지 않고 시장의 실제 가격과 다를 수 있습니다. 즉, 가격은 지표일 뿐이며 거래 목적에 적합하지 않을 수도 있습니다. Fusion Media 및 본 웹사이트 데이터 제공자는 웹사이트상 정보에 의존한 거래에서 발생한 손실 또는 피해에 대해 어떠한 법적 책임도 지지 않습니다.
Fusion Media 및/또는 데이터 제공자의 명시적 사전 서면 허가 없이 본 웹사이트에 기재된 데이터를 사용, 저장, 복제, 표시, 수정, 송신 또는 배포하는 것은 금지되어 있습니다. 모든 지적재산권은 본 웹사이트에 기재된 데이터의 제공자 및/또는 거래소에 있습니다.
Fusion Media는 본 웹사이트에 표시되는 광고 또는 광고주와 사용자 간의 상호작용에 기반해 광고주로부터 보상을 받을 수 있습니다. 본 리스크 고지의 원문은 영어로 작성되었으므로 영어 원문과 한국어 번역문에 차이가 있는 경우 영어 원문을 우선으로 합니다.

투자 도구

투자에 사실 필승, 100% 이기는 전략은 없다.

앞서 작성했던 10가지 투자 법칙을 따른다고 해서 반드시 돈을 벌 수 있는 것은 아니다.

투자를 실제로 실행하게 되면 겪게되는 심리적 압박과 갈등의 상황에서 사람들이 발휘할 수 있는 인내심과 리스크 수용력은 각기 다르다. 그렇기에 같은 투자상품을 대하더라도 서로 다르게 조작하고 누군가는 수익을 올리고 누군가는 그렇지 못하기 마련이다.

그렇기에 시장에 나와있는 투자상품, 투자도구들이 어떤 것들이 있나 파악하고 내게 맞는 투자를 찾아 해내는 것이 중요하다. 그래서 오늘은 투자 상품들에 대해 소개해보는 시간을 갖는다

국가가 내손안에!! 국채!

국채는 국가 재정의 신용을 담보로 하기에 안정성을 우선시 하는 투자자들에게 사랑받는 상품이다. 국채는 수익을 얻을 수 있는가에 있어 주식보다 리스크는 적고 신용은 높다. 이자 수익도 상대적으로 높고 수익도 보장된다. 하지만 다른 상품과 비교하게 되면 상대적으로 투자수익률이 굉장히 낮은 편이다.

편리하고 자금 융통성이 높아 현금흐름을 유지할 수 투자 도구 투자 도구 있으며 안전한 투자도구다. 주로 납입금과 이자의 축적으로 부를 실현하는 전략에 사용된다. 하지만 저축에는 수익이 다른 투자에 비해 매우 낮기 때문에 자산을 다른 곳에 활용하는 기회비용을 날리는 꼴이 될 수 있고, 유동성이 크다보니 자금이 축적되는 긴 시간동안 집 값, 결혼하여 아이가 있을 경우 자녀의 교육비나 기타지출등으로 인해 축적계획에 영향을 받게 된다는 단점이 있다. 그럼에도 불구하고 저축은 안전성을 중시하는 가정에서는 자본을 지키고 리스크는 없는 가치유지의 목적은 확실히 수행할 수 있다.

통화팽창을 헷징하며 부동산을 소유한 시간, 투자 도구 사용에 대한 가격으로 이익을 얻는 투자도구다. 부동산 투자는 일정한 상승 잠재력을 가진 투자방식이 됐다. 그렇지만 현재 부동산 시장의 가격이 요동치고 있기 때문에 투자자는 반드시 신중하게 행동해야 한다.

다른 상품들에 비해 비교적으로 리스크도, 수익도 높은 투자 방식이다. 펀드는 많은 투자자들의 자금을 모아서 펀드관리자에게 맡긴 뒤 공동으로 투자를 진행하여 적은 투자금으로도 비싼 종목의 주식을 보유할 수 있다는 점, 적은 자금들을 모아서 큰 돈을 만들기에 자금의 규모우세를 발휘할 수 있게 된다는 점등의 장점이 있다.

펀드매니저는 일반적으로 대량의 전문투자연구원과 튼튼한 정보망을 사용해 증권시장의 전체적인 움직임을 잘 따라가며 분석할 수 있기에 자금을 펀드매니저에게 맡겨 관리하게 된다면 중소투자자도 전문적인 투자나 자산관리 서비스를 누릴 수 있다. 하지만 아무리 전문투자자라고 해도 나가는 전투마다 이기고 돌아올 수는 없기에 리스크는 언제나 존재하며, 수익에 따른 수수료로 별도로 발생한다는 단점이 있다.

펀드보다도 높은 리스크와 높은 수익의 투자방식이다. 예측이 불가한 주식시장의 특성에 따라 하이리스크 하이 리턴도 가능하지만, 하이 리스크가 항상 도사리고 있다는 특징이 있다. 전문투자자의 경우도 투자실패의 리스크, 정책리스크, 정보리스크를 직면하게 되는데, 주식투자는 심리적인 요인과 논리적 사고, 판단 능력을 많이 필요로 하기에 리스크 수용력이 떨어지는 경우에는 적합한 투자상품으로 보기 어렵다.

우리나라의 돈만 소유하고 있을 때, 화폐가치가 하락하거나 환율파동이 일어남에 따라 가치가 하락한다는 리스크를 피할수도 있으며, 거래를 통해서 이익을 얻을 수도 있다. 외환투자자들의 말에 따르면 리스크가 주식보다 작지만 그만큼 수익도 낮기는 하다고 말한다. 다만 외환투자를 하기 위해서는 국제 금융의 추세를 알아야하기에 공부에 따른 시간과 노력투입량이 많이 필요하다.

투자 도구


지난 4 년 동안 헤지 펀드 매니저 데스몬드 룬이 올린 연평균 21% 수익률은 정말 같지 않은 곳에서 나왔다 . 바로 조류 배양 접시다 .

룬 (37 세 ) 은 신종 퀀트다 . 인공지능의 마법과 기존의 생물학을 결합에 선물 거래에 이용한다 . 운용 중인 타파이트 캐피털 매니지먼트는 규모는 작지만 , 대단한 주장을 한다 . 자연 세계의 가장 오래된 세계 ( 즉 , 생체 세포 ) 에 대한 연구를 통해 금융 시장의 비밀을 풀 수 있는 단서를 잡았다는 것이다 .

룬 같은 컴퓨터 생물학자들은 헤지 펀드를 뒤집어 놓은 퀀트 대열에 비교적 늦게 합류했다. 물리학자와 수학자들이 최초의 파괴적 혁신가였다 . 이들은 통계 모델 , 신경 네트워크 및 기계 학습 도구가 승리를 안겨준 만큼 걸림돌이기도 하다는 사실을 발견했다 . 룬은 애초에는 세포의 신비를 알아내기 위해 스스로 개발했던 알고리즘이 있었는데 , 이를 다시 변형한 인공 지능을 사용하고 있다 . 이런 아이디어는 투자 전략이라기보다는 아주 인상적인 논문 주제처럼 보인다 . 하지만 한 가지 예외가 있다 . 룬이 시장을 이기고 있다는 사실이다 .

룬은 MIT 박사 출신으로 , 10 년 동안 유전자들이 어떻게 상호 작용하고 , 서로에게 어떤 영향을 주는지 알아내기 위한 모델을 개발했고 , 세포의 행동 예측과 관련된 18 개의 논문을 발표했다 . 그는 금융 시장에 맞게 변형한 자기 모델이 주식과 원자재 같은 거래 수단들이 어떻게 상호 작용하고 가격에 어떤 영향을 미치는지를 파악하는 데 아주 유용 하다고 말한다 .

현재 뉴저지의 러트커스 대학교수로 있는 룬은 " 인과 관계의 상호 작용은 생물학적 시스템과 금융 시스템 모두에서 중요합니다 . 시스템을 복잡하게 만들기 때문입니다 . 인과 관계가 있는 것은 예측이 가능하다는 것 입니다 . 어느 정도 자신할 수 있습니다 .“ 라고 말한다 .


인공 지능이라는 기계

룬의 기계 학습 시스템은 글로벌 인덱스 가격의 상승 또는 하락 요인을 찾아낸다 . 수천 개의 유가 증권 , 상품 및 지수에서 수만 가지의 가격 ( 퀀트 말로 노드 ) 을 조사한다 . 즉 , 거래 전에 알고리즘이 노드 쌍들 간의 수십억 개 상호 작용이 잠재적 조사 대상이 된다는 의미다 . 6 월 30 일 현재 , 가장 큰 두 거래는 FTSE 100 지수에 롱 포지션을 MSCI 신흥 시장 지수에 숏 포지션을 취하고 있는 것이다 .

컴퓨터를 이용하면 수많은 변수를 조사할 수 있기 때문에 , 룬 자신도 어떻게 신호를 잡아내는 지는 완전히 이해하지 못한다고 한다 . 하지만 상관없다 . 블룸버그 통신이 살펴본 투자자 보고서에 따르면 , 2014 년 이래 평균 헤지 펀드의 수익률이 벤치마크보다 훨씬 뒤떨어져있는 반면 , 자산 규모 2 천만 달러인 그의 회사 수익률은 S&P 500 지수를 크게 상회하고 있다 .

룬의 컴퓨터는 평균 6 일 동안 거래를 유지한다 . 그는 " 블랙박스는 아닙니다 . 물건을 집어넣은 다음 무엇이 나올지 전혀 모르는 것이 아닙니다 . 우리는 매개 변수를 가지고 있습니다 . 하지만 , 시스템이 결정에 이르게 되는 모든 요인을 설명할 수 있는 날이 올지는 모르겠습니다 ." 라고 말한다 .

룬의 컴퓨터 생물학 분야는 20 년 전 처음 세상에 선보인 이래 , 2003 년 유전자 청사진을 제공 한 인간 게놈 프로젝트에 의해 탄력을 받았다 . UC 버클리에서 프린스턴에 이르기까지 최고 대학들이 박사 프로그램을 운영하고 있다 . 또한 헤지 펀드 억만장자 데이비드 쇼도 여기에 뛰어들어, 암과 당뇨병과 같은 질병의 궁극적 치료를 목표로 , 2000 년대 초반 출범한 컴퓨터 생화학 그룹 D. E. 쇼 리서치에서 대부분의 시간을 보내고 있다 .


게놈 프로젝트가 많은 양의 데이터를 생산해내면서 , 룬은 컴퓨터 생물학 밖으로 나올 기회를 발견했고 , 2006 년 MIT 와 하버드가 공동으로 운영한 브로드 연구소에 가입했습니다 . 이 연구소는 과학자들과 헤지 펀드 매니저들로 이루어져 있다 . 거기서 룬은 전직 암호학자인 닉 패터슨을 만났다 . 그는 10 년 동안 르네상스 테크놀로지에서 수학 모델을 만든 인물이었다 . 룬의 또 다른 동료인 게놈 연구원 제이드 빈슨은 브로드 연구소를 떠나 10 년 동안 선구적인 퀀트 헤지 펀드에서 일하고 있다 .

생물학자를 모십니다

이제 월스트리트의 회사들은 데이터 과학 혁명의 최첨단에 서 있는 이들 생물학자들을 찾고 있다 . 이들은 거대한 데이터 작업만 하는 것이 아니다 . 클로닝은 생물학자들에게 또 다른 무기를 쥐여준다. 뉴욕 대학에서 세포생물학을 연구하는 리처드 본노 교수는 , 생물학자들은 여러 차례 실험을 반복함으로써 , 세포 내부의 인과관계의 상호 작용을 보다 잘 볼 수 있다고 말한다 .

뉴욕 대학의 데이터 과학 센터장이기 한 본노는 " 우리는 다른 어떤 다른 데이터 과학에서보다 더 많은 것을 시도하고 있습니다 ." 라고 말한다 . 금융 회사들도 주목하고 있다 . 그는 " 그들은 내 박사 연구원들을 훔쳐 가고 있습니다 . 짜증 나는 일이긴 하지만 , 그 연구원들에게는 좋은 일이죠 . 좋은 일자리를 얻은 것이니까요 ." 라고 말한다 .

세포와 시장은 공통점이 없는 것처럼 보인다 . 하나는 미세하고 자연적인 반면 , 다른 하나는 세계적이고 인간에 의해 만들어진 것이기 때문이다 . 하지만 , 컴퓨터 과학 교수이자 UC 데이비스 게놈 센터의 연구원인 일라이어스 태그코풀로스는 이 둘이 다소 유사하다고 말한다 .

크레디트 스위스 그룹에서 퀀트로 일하기도 했던 태그코풀로스는 " 생물학자는 무질서한 유전자 발현의 스냅 샷을 관찰함으로써 세포의 복잡한 조직과 기능을 이해하려고 노력합니다 . 이는 주식 시장과 매우 ​​ 유사합니다 . 퀀트는 시계열 가격 데이터를 이해하려고 노력합니다 . 이 데이터는 처음에는 아주 혼란스럽습니다 . 상이한 매개 변수와 그들 관계를 알지 못하기 때문이죠 . 따라서 그것들을 한데 모으려고 노력합니다 . 생물학적 데이터로 할 수 있는 것처럼 말입니다 .“ 라고 말한다 .

물론 의심하는 사람들도 있다 . 월스트리트에 들어왔던 최초의 물리학자 중 한 명인 임마누엘 더만은 생물학자들이 ‘ 투자의 비법 ’ 을 아는지 의심한다 . 더만은 17 년 동안 골드만 삭스 그룹에서 일하면서 퀀트 위험 전략 그룹을 이끌었다 . 그는 물리학자들이 운동 법칙 , 원자 및 수학에 대한 전문 지식을 투자에 적용해 왔지만 , 이 모델이 실험실에서처럼 효과가 없었음을 발견했다 .

더만은 뉴턴의 중력 법칙은 영원히 바뀌지 않겠지만 , 시장에서 인간 행동은 항상 변하고 , 과학자들이 만들어낸 최고의 모델조차도 혼란에 빠진다 고 말한다 .

“Models. Behaving. Badly” 의 저자이자 콜롬비아 대학 금융 공학 교수이기도 한 더만은 " 자신의 전문 지식을 한 분야에서 다른 분야에 적용하는 사람들에게 회의적인 생각입니다 . 그들은 주식을 원자 같다거나 , 유전자 같다고 말합니다 . 하지만 주식은 원자나 유전자가 아닙니다 . 닮은 점이 없는 건 아니지만 , 궁극적으로 아주 다릅니다 . " 라고 말한다 .

더 많은 투자 자금을 목표로

룬이 자기 기계를 믿는 데는 근거가 있다 . 그의 기계는 2016 6 월 의외의 브렉시트 투표 결과와 이어 11 월 도널드 트럼프의 깜짝 당선이 있은 후에도 수익을 냈기 때문 이다 . 올해 6 월까지 그의 대표 펀드의 수익률은 9.8% 였다 . 보고서에 따르면 , 2016 년에는 22.1% 의 수익률을 올렸으며 , 2015 년에는 33.8% 였다 . 유일하게 손실을 본 해는 2014 년으로 2% 손실을 기록했다 .

홍콩에서 태어난 룬은 펜실베이니아에 있는 사무실과 러트거스의 연구소 사이에서 오가고 있다 . 연구소에서는 야심찬 장기 프로젝트를 수행하고 있다 : 남조류 등으로부터 얻은 데이터를 이용해 세포가 어떻게 행동하는지 예측할 수 있는 컴퓨터 모델을 만드는 것이다 . 룬은 이 모델을 통해 유용한 목적으로 유전자를 재설계 할 수 있다 . 대장균을 변형시켜 바이오 연료를 생산한 바 있다 .

다른 꿈은 투자 도구 다음 6 개월 내지 12 개월까지 가족 회사들과 헤지 펀드의 펀드들로부터 자금을 끌어들여 운용 자산 규모를 2 억 달러로 늘리는 것이다 . 하지만 인공 지능을 이용해 투자한다는 것에 의심의 눈길을 보내는 투자자들도 있다 . 단지 새롭다는 이유에서다 .

룬은 멜버른에서 자랐기 때문에 , 호주에서 발견된 희귀 원석 타파이트를 자기 회사 이름으로 삼았다 . " 우리 시스템이 왜 또 어떻게 작동하는지 간단하게 설명하는 것은 어렵습니다 . 하지만 자금 모집 목표는 분명합니다 .“ 라고 그는 말한다 .

Chapter 1 퀀트 투자의 심장: 데이터와 프로그래밍

몇 년 전까지만 하더라도 퀀트 투자는 일반 투자자들에게 매우 낯선 영역이었지만, 최근에는 각종 커뮤니티와 매체를 통해 많은 사람들에게 익숙한 단어가 되었습니다. 퀀트 투자에서 ‘퀀트’란 모형을 기반으로 금융상품의 가격을 산정하거나, 이를 바탕으로 투자를 하는 사람을 말합니다. 퀀트(Quant)라는 단어가 ’계량적’을 의미하는 퀀티터티브(Quantitative)의 앞 글자를 따왔음을 생각하면 쉽게 이해가 될 것입니다.

일반적으로 투자자들이 산업과 기업을 분석해 가치를 매기는 정성적인 투자법과는 달리, 퀀트 투자는 수학과 통계를 기반으로 전략을 만들고 이를 바탕으로 투자하는 정량적인 투자법을 의미합니다. 이처럼 데이터를 수집·가공한 후 이를 바탕으로 모델을 만들고 실행하는 단계는 데이터 과학의 업무 흐름도와 매우 유사합니다. 해들리 위컴 (Hadley Wickham) (Grolemund and Wickham 2018) 에 따르면 데이터 과학의 업무 과정은 그림 1.1과 같습니다.

데이터 과학 업무 과정

그림 1.1: 데이터 과학 업무 과정

데이터 과학자들은 프로그래밍을 통해 데이터를 불러온 후 이를 정리하고, 원하는 결과를 찾기 위해 데이터를 변형하거나 시각화하고 모델링합니다. 이러한 결과를 바탕으로 타인과 소통하는 일련의 과정을 거칩니다.

퀀트 투자의 단계 역시 이와 매우 유사합니다. 투자에 필요한 주가, 재무제표 등의 데이터를 수집해 정리한 후 필요한 지표를 얻기 위해 가공합니다. 그 후 각종 모형을 이용해 투자 종목을 선택하거나 백테스트를 수행하며, 이를 바탕으로 실제로 투자하고 성과를 평가합니다. 따라서 퀀트 투자는 데이터 과학이 금융에 응용된 사례라고도 볼수 있으며, 퀀트 투자의 중심에는 데이터와 프로그래밍이 있습니다.

이 책에서도 데이터 과학의 업무 단계와 동일하게 데이터 불러오기, 데이터별로 정리하고 가공하기, 시각화를 통해 데이터의 특징 파악하기, 퀀트 모델을 이용해 종목 선택하기, 백테스트를 실시한 후 성과 및 위험 평가하기에 대해 알아보겠습니다. 이에 앞서 이 CHAPTER에서는 퀀트 투자의 심장이라고 할 수 있는 데이터를 어떻게 얻을 수 있는지, 왜 프로그래밍을 해야 하는지, 그중에서도 R이 무엇인지에 대해 간략히 살펴보겠습니다.

1.1 데이터 구하기

퀀트 투자에 필요한 데이터는 여러 데이터 제공업체의 서비스를 이용해서 매우 쉽게 구할 수 있습니다. 해외 데이터 수집에는 블룸버그 혹은 Factset, 국내 데이터 수집에는 DataGuide가 흔히 사용됩니다. 물론 비용을 더 지불한다면 단순 데이터 수집뿐만 아니라 즉석에서 백테스트 및 성과 평가까지 가능합니다. Factset에서 판매하는 Alpha Testing 혹은 S&P Global에서 판매하는 ClariFI(그림 1.2)를 사용한다면, 전 세계 주식을 대상으로 원하는 전략의 백테스트 결과를 마우스 몇 번 클릭해서 얻을 수 있습니다.

ClariFI®의 백테스트 기능

그림 1.2: ClariFI®의 백테스트 기능

데이터 제공업체를 이용하는 방법의 최대 단점은 바로 비용입니다. 블룸버그 단말기는 1년 사용료가 대리 한 명의 연봉과 비슷해, 흔히 ’블대리’라고 부르기도 합니다. 국내 데이터 업체의 사용료는 이보다 저렴하기는 하지만, 역시 1년 사용료가 수백만 원 정도로, 일반 개인 투자자가 감당하기에는 부담이 됩니다.

해외데이터는 Quandl 1 이나 tiingo 2 등의 업체가 제공하는 서비스를 이용하면 상대적으로 저렴한 가격에 데이터를 구할 수 있습니다. 물론 대형 데이터 제공업체에 비해 데이터의 종류가 적고 기간은 짧은 편이지만, 대부분의 일반 투자자가 사용하기에는 충분한 데이터를 얻을 수 있습니다. tiingo에서는 전 세계 64,386개 주식의 30년 이상 가격 정보, 21,352개 주식의 12년 이상 재무정보를 월 $10에 받을 수 있으며, 한정된 종목과 용량에 대해서는 무료로 데이터를 받을 수도 있습니다. 더군다나 API를 통해 프로그램 내에서 직접 데이터를 받을 수 있어 편리합니다.

NAVER 금융 제공 재무정보

그림 1.3: NAVER 금융 제공 재무정보

이러한 정보를 잘만 활용한다면 장기간의 주가 및 재무정보를 무료로 수집할 수 있습니다. 물론 데이터 제공업체가 제공하는 깔끔한 형태의 데이터가 아니므로 클렌징 작업이 필요하고 상장폐지된 기업의 데이터를 구하기 힘들다는 단점이 있습니다. 그러나 비용이 들지 않는 데다 현재 시점에서 투자 종목을 선택할 때는 상장폐지된 기업의 정보가 필요하지 않는다는 점을 고려하면 이는 큰 문제가 되지 않습니다.

1.2 퀀트 투자와 프로그래밍

우리가 구한 데이터는 연구나 투자에 바로 사용할 수 있는 형태로 주어지는 경우가 거의 없습니다. 따라서 데이터를 목적에 맞게 처리하는 과정을 거쳐야 하며, 이를 흔히 데이터 클렌징 작업이라고 합니다. 또한 정제된 데이터를 활용한 투자 전략의 백테스트나 종목 선정을 위해서 프로그래밍은 필수입니다. 물론 모든 퀀트 투자에서 프로그래밍이 필수인 것은 아닙니다. 엑셀을 이용해도 간단한 형태의 백테스트 및 종목 선정은 얼마든지 가능합니다. 그러나 응용성 및 효율성의 측면에서 엑셀은 매우 비효율적입니다.

데이터를 수집하고 클렌징 작업을 할 때 대상이 몇 종목 되지 않는다면 엑셀을 이용해도 충분히 가능합니다. 그러나 종목 수가 수천 종목을 넘어간다면 데이터를 손으로 일일이 처리하기가 사실상 불가능에 가깝습니다. 이러한 단순 반복 작업은 프로그래밍을 이용한다면 훨씬 효율적으로 수행할 수 있습니다.

백테스트에서도 프로그래밍이 훨씬 효율적입니다. 과거 12개월 누적수익률이 높은 종목에 투자하는 모멘텀 전략의 백테스트를 한다고 가정합시다. 처음에는 엑셀로 백테스트를 하는 것이 편하다고 생각할 수 있습니다. 그러나 만일 12개월이 아닌 6개월 누적 수익률로 백테스트를 하고자 한다면 어떨까요? 엑셀에서 다시 6개월 누적수익률을 구하기 위해 명령어를 바꾸고 드래그하는 작업을 반복해야 할 것입니다. 그러나 프로그래밍을 이용한다면 n = 12 였던 부분을 n = 6 으로 변경한 후 단지 클릭 한 번만으로 새로운 백테스트가 완료됩니다.

전체 데이터가 100MB 정도라고 가정할 때, 투자 전략이 계속해서 늘어날 경우는 어떨까요? 엑셀에서 A라는 전략을 백테스트하기 위해서는 해당 데이터로 작업한 후 저장할 것입니다. 그 후 B라는 전략을 새롭게 백테스트하려면 해당 데이터를 새로운 엑셀 파일에 복사해 작업한 후 다시 저장해야 합니다. 결과적으로 10개의 전략만 백테스트 하더라도 100MB짜리 엑셀 파일이 10개, 즉 1GB 정도의 엑셀 파일이 쌓이게 됩니다. 만일 데이터가 바뀔 경우 다시 10개 엑셀 시트의 데이터를 일일이 바꿔야 하는 귀찮음도 감수해야 합니다. 물론 하나의 엑셀 파일 내에서 모든 전략을 수행할 수도 있지만, 이러한 경우 속도가 상당히 저하되는 문제가 있습니다.

프로그래밍을 이용한다면 어떨까요? 백테스트를 수행하는 프로그래밍 스크립트는 불과 몇 KB에 불과하므로, 10개의 전략에 대한 스크립트 파일을 합해도 1MB가 되지 않습니다. 데이터가 바뀌더라도 원본 데이터 파일 하나만 수정해주면 됩니다.

물론 대부분의 사람들에게 프로그래밍은 낯선 도구입니다. 그러나 퀀트 투자에 필요한 프로그래밍은 매우 한정적이고 몇 가지 기능을 반복적으로 쓰기 때문에 몇 개의 단어와 구문만 익숙해지면 사용하는 데 큰 어려움이 없습니다. 또한 전문 개발자들의 프로그래밍에 비하면 상당히 쉬운 수준이므로, 비교적 빠른 시간 내에 원하는 전략을 테스트하고 수행하는 정도의 능력을 갖출 수도 있습니다.

1.3 R 프로그램

인간이 사용하는 언어의 종류가 다양하듯이, 프로그래밍 언어의 종류 역시 다양합니다. 대략 700여 개 이상의 프로그래밍 언어 중 4 대중적으로 사용하는 언어는 그리 많지 않으므로, 대중성과 효율성을 위해 사용량이 많은 언어를 이용하는 것이 좋습니다.

그림 1.5는 프로그래밍 언어의 사용 순위 5 입니다. 이 중 R과 Python은 매우 대중적인 언어입니다. 해당 언어가 많이 사용되는 가장 큰 이유는 무료인 데다 일반인들이 사용하기에도 매우 편한 형태로 구성되어 있기 때문입니다.

2017년 기준 프로그래밍 언어 사용 통계 순위

그림 1.4: 2017년 기준 프로그래밍 언어 사용 통계 순위

이러한 프로그래밍 언어 중 이 책에서는 R을 이용합니다. R의 장점은 무료라는 점 이외에도 타 언어와 비교할 수 없이 다양한 패키지가 있다는 점입니다. R은 두터운 사용자층을 기반으로 두고 있어 상상할 수 없을 정도로 패키지가 많으며, 특히 통계나 계량분석과 관련된 패키지는 독보적이라고 할 수 있습니다.

CRAN 등록 패키지 수

그림 1.5: CRAN 등록 패키지 수

1.4 퀀트 투자에 유용한 R 패키지

R에는 여러 연구자와 실무자의 헌신적인 노력 덕분에 금융 연구와 퀀트 투자를 위한 다양한 패키지가 만들어져 있으며, 누구나 무료로 이용할 수 있습니다. 이 책에서 사용되는 패키지 중 중요한 것은 다음과 투자 도구 같습니다. 각 패키지에 대한 자세한 설명은 구글에서 패키지명을 검색한 후 PDF 파일을 통해 확인할 수 있습니다.

quantmod: 이름에서 알 수 있듯이 퀀트 투자에 매우 유용한 패키지입니다. API를 이용해 데이터를 다운로드하는 getSymbols() 함수는 대단히 많이 사용됩니다. 이 외에도 투자 도구 볼린저밴드, 이동평균선, 상대강도지수(RSI) 등 여러 기술적 지표를 주가 차트에 나타낼 수도 있습니다.

PerformanceAnalytics: 포트폴리오의 성과와 위험을 측정하는 데 매우 유용한 패키지입니다. Return.portfolio() 함수는 포트폴리오 백테스트에 필수적인 함수입니다.

xts: 기본적으로 금융 데이터는 시계열 형태이며, xts 패키지는 여러 데이터를 시계열 형태(eXtensible TimeSeries)로 변형해줍니다. 일별 수익률을 월별 수익률 혹은 연도별 수익률로 변환하는 apply.monthly() 와 apply.yearly() 함수, 데이터들의 특정 시점을 찾아주는 endpoints() 함수 역시 백테스트에 필수적으로 사용되는 함수입니다. 이 패키지는 PerformanceAnalytics 패키지 설치 시 자동으로 설치됩니다.

zoo: zoo 패키지 역시 시계열 데이터를 다루는 데 유용한 함수가 있습니다. rollapply() 함수는 apply() 함수를 전체 데이터가 아닌 롤링 윈도우 기법으로 활용할 수 있게 해주며, NA 데이터를 채워주는 na.locf() 함수는 시계열 데이터의 결측치를 보정할 때 매우 유용합니다.

httr & rvest: 데이터를 웹에서 수집하기 위해서는 크롤링이 필수이며, httr과 rvest는 크롤링에 사용되는 패키지입니다. httr은 http의 표준 요청을 수행하는 패키지로서 단순히 데이터를 받는 GET() 함수와 사용자가 필요한 값을 선택해 요청하는 POST() 함수가 대표적으로 사용됩니다. rvest는 HTML 문서의 데이터를 가져오는 패키지이며, 웹페이지에서 데이터를 크롤링한 후 원하는 데이터만 뽑는데 필요한 여러 함수가 포함되어 있습니다.

dplyr: 데이터 처리에 특화되어 R을 이용한 데이터 과학 분야에서 많이 사용되는 패키지입니다. C++로 작성되어 매우 빠른 처리 속도를 보이며, API나 크롤링을 통해 수집한 데이터들을 정리할 때도 매우 유용합니다.

ggplot2: 데이터를 시각화할 때 가장 많이 사용되는 패키지입니다. 물론 R에서 기본적으로 내장된 plot() 함수를 이용해도 시각화가 가능하지만, 해당 패키지를 이용하면 훨씬 다양하고 깔끔하게 데이터를 그림으로 표현할 수 있습니다.


0 개 댓글

답장을 남겨주세요