量化的本质是依靠数据来做投资决策。
数据是量化的基础,数据之于量化投资就好比汽油之于汽车,其重要性不言而喻。
相比于其他行业,金融行业的数据丰富度好,结构化程度高,可获得性门槛相对较低。
即便如此,个人投资者并没有证券公司,基金公司那么多的研发投入,有强大的数据中台支撑投资研究,传统散户只能通过第三方软件如大智慧、同花顺等金融终端获取数据。
通过金融终端不太方便之处在于,是按照传统金融软件的思路去分析市场,看K线为主,高级一些的功能,可以写一些技术指标规则,但无法按照自己的思路去做量化。
另外,另类数据(公告,新闻等)也是alpha的重要来源。
综上,建立自己的金融数据采集管道是量化投资至关重要的基础一环,让你实现量化的“数据自由”。
Requests是一个python的http包,它的官网是:
https://docs.python-requests.org/zh_CN/latest/,有中文文档。
官网介绍的第一句话就是“Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用。”
大家知道,python内置的urllib及urllib2比较偏底层,有大量的工作需要我们处理。而Requests在urllib3的基础做了很多人性化的封装,使得它极其易用,同时保持了它强大的功能。
直接使用pip安装即可:pipinstall requests。
import requests
url = 'https://baidu.com/'
r = requests.get(url)
返回的r是一个Response对象,可以通过r.text取得文本,如果是网址,那就是页面的html。如果是api,可以通过r.json()直接转换成json对象——也就是python的字典(dict)类型。
是的,就是这么简单,这对于获取tushare金融数据包,已经够用了。
Tushare数据包有几年了,很佩服作者的坚持。一件是你只要坚持下去,做成熟了,就会有商业价值。早年是http://tushare.org/这个网址,通过爬虫去各财经网站比如新浪财经,网易财经采集数据,现在已经不维护了。主要原因是通过网址去采集会出现网络不稳定,或者目标网站限制等因素。
现在官网专业版的网址是https://tushare.pro/。
用自己的手机号做个注册,然后获取一个token。
在这里把token(一个字符串)复制出来即可。
导航栏上点击“数据接口”,可以看到tushare提供的所有数据。
A股股票,指数,基金,可转债,期货数据还是比较全的(没有高频数据)。
Tushare的接口根据积分的不同,不同的接口有不同的限制。比如取股票日线的数据,
就是说,如果积分超过5000就可以随意使用。
积分如何获得呢?最快捷的办法就是“赞助500块”,可以联系管理员获取5000积分,时效是1年。——其实非常便宜了,商业接口的数据,一般都需要2万5一年甚至更多。
如果只是简单使用,没有建立自己数据库的需求,免费的接口也够用。
另外,“数据工具”是一个比较贴心的功能。
就是可以不写代码就查询数据,看到数据的结构以及手动导出数据。
查询数据后,点击“导出csv”可以将数据直接下载到本地。