模块介绍
store_data
通过调用国泰安数据库(CSMAR)与Tushare Pro接口,分别获取股票、指数的行情数据与财务数据,并以HDF5文件格式存储在本地。
数据获取
get_data
提供从本地获取数据功能。
- 获取股票交易日数据
接口:get_trade_cal
描述:根据交易频率,筛选指定时段交易日
输入参数:
|位置|名称|类型|描述|
|:-:|:-:|:-:|:-:|
|输入|from_date|str|起始日期,例如’2022-01-01’|
|输入|end_date|str|终止日期,例如’2022-01-01’|
|输入|freq|str|频率,其中包括stock_code列|
|输入|stock_code|list|股票代码列表,股票代码例为’000001’|
|输出|df|dataframe|指定股票代码的数据集|
- 获取指定股票数据
接口:get_stocks_sub
描述:根据股票代码,筛选指定股票数据
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | df | dataframe | 原始数据集,其中包括stock_code列 |
输入 | stock_code | list | 股票代码列表,股票代码例如’000001’ |
输出 | df | dataframe | 指定股票代码的数据集 |
- 获取周期内季末日期
接口:get_quarters
描述:根据起止日期,筛选周期内期末日期
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | from_date | str | 起始日期,例如’2022-01-01’ |
输入 | end_date | str | 终止日期,例如’2022-01-01’ |
输出 | Quarter_list | list | 周期内所有季末日期 |
- 获取股票日线行情数据
接口:get_stocks_daily
描述:返回股票日频行情数据
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | stock_code | list/str | 股票代码,形如’000001’,以指定特定股票数据或股票代码列表 |
输入 | trade_date | str | 交易日期,例如’2022-01-01’ |
输入 | from_date | str | 起始日期,例如’2022-01-01’ |
输入 | end_date | str | 终止日期,例如’2022-01-01’ |
输入 | pool | str | 股票池,包括’all_a_market’,’hushen300’,’zhongzheng500’,’liquid_perc70’ |
输出 | output | dataframe | 指定股票代码的日行情数据 |
stock_code为可选项,默认为全部股票;trade_date和(from_date,end_date)二选其一,可分别获取单日/周期内股票日线行情数据;股票池为可选项,默认为全部A股
- 获取股票月线行情数据
接口:get_stocks_monthly
描述:返回股票月频行情数据
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | stock_code | list/str | 股票代码,例如’000001’,以指定特定股票数据或股票代码列表 |
输入 | trade_date | str | 交易日期,例如’2022-01-01’ |
输入 | from_date | str | 起始日期,例如’2022-01-01’ |
输入 | end_date | str | 终止日期,例如’2022-01-01’ |
输出 | output | dataframe | 指定股票代码的月行情数据 |
stock_code为可选项,默认为全部股票;trade_date和(from_date,end_date)二选其一,可分别获取单日/周期内股票月线行情数据。
- 获取股票每日指标数据
接口:get_daily_basic
描述:返回股票日频指标数据
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | trade_date | str | 交易日期,例如’2022-01-01’ |
输入 | from_date | str | 起始日期,例如’2022-01-01’ |
输入 | end_date | str | 终止日期,例如’2022-01-01’ |
输出 | output | dataframe | 交易日指标数据 |
- 获取每日停复牌数据
接口:get_daily_suspended
描述:返回股票日频停复牌数据
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | trade_date | str | 交易日期,例如’2022-01-01’ |
输出 | output | dataframe | 交易日停复牌数据 |
- 获取ST股票数据
接口:get_st_stocks
描述:返回日频ST股票数据
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | trade_date | str | 交易日期,例如’2022-01-01’ |
输出 | st_list | list | 交易日停复牌数据 |
- 获取非流动股票数据
接口:get_illiq_stocks
描述:返回日频非流动股票数据
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | trade_date | str | 交易日期,例如’2022-01-01’ |
输出 | illiq_stocks | dataframe | 交易日非流动股票数据 |
- 获取行业分类数据
接口:get_industry
描述:返回行业分类数据
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | industry_type | str | 分类标准,默认为证监会,可选‘shenwan’ |
输出 | industry_data | dataframe | 行业分类数据 |
- 获取指数日线行情数据
接口:get_index_daily
描述:返回股票日频行情数据
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | index_code | str | 指数代码,以指定特定指数数据 |
输入 | from_date | str | 起始日期,例如’2022-01-01’ |
输入 | end_date | str | 终止日期,例如’2022-01-01’ |
输出 | index_data | dataframe | 指定指数代码的日行情数据 |
- 获取指数月线行情数据
接口:get_index_monthly
描述:返回指数月频行情数据
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | index_code | str | 指数代码,以指定特定指数数据 |
输入 | from_date | str | 起始日期,例如’2022-01-01’ |
输入 | end_date | str | 终止日期,例如’2022-01-01’ |
输出 | index_data | dataframe | 指定指数代码的日行情数据 |
- 获取新上市股票代码
接口:get_new_stocks_code
描述:返回新上市股票代码
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | trade_date | str | 交易日期,例如’2022-01-01’ |
输入 | days | int | 天数,指定当日前N天 |
输出 | new_stock+cdr | list | 周期内新上市股票代码 |
- 获取利润表数据
接口:get_income
描述:返回利润表数据
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | stock_code | list/str | 股票代码,例如’000001’或股票代码列表 |
输入 | end_date | str | 季末日期,例如’2022-01-01’ |
输入 | from_date | str | 起始日期,例如’2022-01-01’ |
输入 | end_date | str | 终止日期,例如’2022-01-01’ |
输出 | output | dataframe | 指定股票代码的季度利润表数据 |
stock_code为可选项,默认为全部股票,trade_date和(from_date,end_date)二选其一,可分别获取单日/周期内利润表数据。
- 获取资产负债表数据
接口:get_balancesheet
描述:返回资产负债表数据
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | stock_code | list/str | 股票代码,例如’000001’或股票代码列表 |
输入 | end_date | str | 季末日期,例如’2022-01-01’ |
输入 | from_date | str | 起始日期,例如’2022-01-01’ |
输入 | end_date | str | 终止日期,例如’2022-01-01’ |
输出 | output | dataframe | 指定股票代码的季度资产负债表数据 |
stock_code为可选项,默认为全部股票,trade_date和(from_date,end_date)二选其一,可分别获取单日/周期内资产负债表数据。
- 获取现金流量表数据
接口:get_cashflow
描述:返回现金流量表数据
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | stock_code | list/str | 股票代码,例如’000001’或股票代码列表 |
输入 | end_date | str | 季末日期,例如’2022-01-01’ |
输入 | from_date | str | 起始日期,例如’2022-01-01’ |
输入 | end_date | str | 终止日期,例如’2022-01-01’ |
输出 | output | dataframe | 指定股票代码的季度现金流量表数据 |
stock_code为可选项,默认为全部股票,trade_date和(from_date,end_date)二选其一,可分别获取单日/周期内现金流量表数据。
- 获取财务指标数据
接口:get_fina_indicator
描述:返回财务指标数据
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | stock_code | list/str | 股票代码,例如’000001’或股票代码列表 |
输入 | end_date | str | 季末日期,例如’2022-01-01’ |
输入 | from_date | str | 起始日期,例如’2022-01-01’ |
输入 | end_date | str | 终止日期,例如’2022-01-01’ |
输出 | output | dataframe | 指定股票代码的季度财务指标数据 |
stock_code为可选项,默认为全部股票,trade_date和(from_date,end_date)二选其一,可分别获取单日/周期内财务指标数据。
- 获取定价模型因子收益率(日)
接口:get_factor_pricing_model
描述:返回定价模型因子日收益率
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | pricing_model | str | 定价模型,默认为’FF-3’,可取’FF-5’ |
输入 | freq | str | 频率,默认为日频,可取’month’ |
输入 | kechuangye | boolean | 股票类型,默认包括科创板与创业板 |
输入 | portfolio_method | str | 投资组合类型,默认为’2*3’,可取’2*2’或’2*2*2*2’ |
输出 | model | dataframe | 指定因子收益率数据 |
- 获取定价模型因子变量
接口:get_factor_pricing_variable
描述:返回定价模型因子变量
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | pricing_model | str | 定价模型,默认为’FF-3’,可取’CAPM’ |
输出 | fa_pr_var | dataframe | 指定因子变量 |
- 获取无风险收益率
接口:get_risk_free_rate
描述:返回无风险收益率
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输出 | rfr_data | dataframe | 无风险收益率数据 |
- 获取市场收益率
接口:get_mkt_ret
描述:返回市场收益率
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输出 | mkt_ret | dataframe | 市场收益率数据 |
- 获取股票池
接口:get_stocks_pool
描述:返回股票池
输入参数:
位置 | 名称 | 类型 | 描述 |
---|---|---|---|
输入 | trade_date | str | 交易日期,例如’2022-01-01’ |
输入 | from_date | str | 起始日期,例如’2022-01-01’ |
输入 | end_date | str | 终止日期,例如’2022-01-01’ |
输入 | pool | str | 股票池,默认为’hushen300’,可为’zhongzheng500’,’liquid_perc70’ |
输出 | stocks_pool | dataframe | 交易日股票池数据 |