上一篇
通达信提取数据库方法
- 数据库
- 2025-06-12
- 3828
通达信提取数据库数据主要通过软件自带功能实现:使用“数据导出”功能选择品种、周期和字段导出;或通过公式系统编写指标公式,利用文件输出函数将计算结果保存至本地文件。
专业方法与注意事项
为何需要提取通达信数据库?
通达信软件存储了海量股票、期货、指数等金融数据(如K线、分时、财务指标),用户常需提取数据用于:
- 量化分析:构建策略模型、回测交易系统
- 研究报告:导出历史数据制作图表
- 跨平台应用:迁移至Python/Excel等工具处理
注意:提取数据需遵守《证券法》及交易所规定,严禁用于非规商业用途。
官方支持的提取方法(推荐)
内置数据导出功能
步骤:
- 打开通达信软件,进入
K线图
界面 - 右键菜单 → 选择
数据导出
→高级导出
- 设置参数:
- 数据类型:日线/分钟线/财务数据
- 时间范围:自定义起止日期
- 输出格式:Excel/Text/CSV
- 勾选所需股票(支持全市场或自选股)
- 点击
执行导出
,生成文件至指定路径
优势:
- 官方功能,零风险
- 操作简单,无需编程
局限:
- 单次最多导出2000只股票
- 分钟线数据需逐只导出
TDSQL插件(机构版专用)
机构用户可通过内置TDSQL模块直连数据库:
- 菜单栏 →
系统
→TDX数据中心
- 使用SQL语法查询数据(例:
SELECT * FROM SZ000001.DAY
) - 支持导出结果到DBF/CSV格式
适用场景:
- 批量获取全市场历史日线
- 高频提取Level2行情
第三方工具方案(技术向)
解析本地数据文件
通达信数据存储路径:Tdxvipdoc
- 日线数据:
shlday
(沪市)szlday
(深市) → 文件如sh000001.day
- 分钟数据:
min_data
目录
推荐工具:
- Python库
tdxpy
from tdxpy.reader import TdxDailyBarReader reader = TdxDailyBarReader() data = reader.get_df("sh000001.day") # 读取上证指数日线 data.to_csv("data.csv") # 导出CSV
- 软件工具:
TDX2DBF
(转换.day文件为DBF格式)
内存实时捕获
通过WinAPI钩子技术监听通达信数据流:
- 工具:
通达信DLL插件开发包
(需C++编程) - 原理:拦截
TDXW.dll
传输的数据包并解码
风险提示:
- 可能触发软件安全机制
- 需反编译处理,存在法律风险
关键注意事项
- 版权合规
- 个人研究使用需标注数据来源:”数据源自通达信”
- 禁止转售原始数据(违反《反不正当竞争法》)
- 数据完整性
- 检查导出数据的复权状态(前复权/后复权)
- 分钟数据可能缺失集合竞价时段
- 技术风险
- 第三方工具可能携带反面代码
- 非常规提取可能导致软件崩溃
最佳实践建议
- 入门用户:优先使用官方导出功能
- 量化开发者:
- 日线/财务数据 → Python调用
tdxpy
解析本地文件 - 实时行情 → 券商官方API(如华泰涨乐财富通)
- 日线/财务数据 → Python调用
- 机构用户:申请开通TDSQL数据库权限
引用说明
本文方法参考通达信2025版官方手册《TDX数据中心使用指南》,第三方工具tdxpy
文档详见GitHub开源项目tdxpy,数据提取请遵守《证券期货业数据分类分级指引》及交易所相关规定。