股票分析技能入门：从数据获取到技术指标实战

13次阅读

共计 2764 个字符，预计需要花费 7 分钟才能阅读完成。

作为金融科技领域的新手开发者，在构建股票分析系统时常常会遇到几个典型问题：

数据源混乱：网上能找到的数据源五花八门，质量参差不齐，有些数据甚至存在缺失或错误
指标计算不准确：技术指标的实现看似简单，但若不理解其数学原理，很容易在边界条件处理上出错
回测过拟合：在历史数据上表现良好的策略，实盘时却可能完全失效

Yahoo Finance API
优点：免费、数据全面、支持多种金融市场
缺点：接口稳定性一般，历史数据可能有调整
Tushare
优点：专门针对 A 股市场，数据质量较好
缺点：部分高级功能需要付费

Pandas
成熟稳定，社区支持好
适合中小规模数据处理
Polars
性能更高，特别适合大规模时间序列数据
语法略有不同，学习曲线稍陡

import pandas as pd

# 计算简单移动平均
# data: 包含收盘价 (close) 的 DataFrame
# window: 移动窗口大小
def calc_ma(data, window=20):
    return data['close'].rolling(window=window).mean()

布林带由三条线组成：
– 中轨：N 日移动平均线
– 上轨：中轨 + k 倍标准差
– 下轨：中轨 – k 倍标准差

数学公式：
$ 上轨 = MA(close,N) + k\times\sigma$
$ 下轨 = MA(close,N) – k\times\sigma$

def bollinger_bands(data, window=20, k=2):
    ma = data['close'].rolling(window=window).mean()
    std = data['close'].rolling(window=window).std()

    # 异常值处理：标准差为 0 时设为极小值
    std = std.replace(0, 1e-6)

    upper = ma + k * std
    lower = ma - k * std

    return pd.DataFrame({
        'ma': ma,
        'upper': upper,
        'lower': lower
    })

import matplotlib.pyplot as plt
from mpl_finance import candlestick_ohlc

# 准备 OHLC 数据
data['date_num'] = data['date'].apply(lambda x: plt.date2num(x))
ohlc = data[['date_num', 'open', 'high', 'low', 'close']].values

# 创建图表
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(12, 8))

# 绘制 K 线图
candlestick_ohlc(ax1, ohlc, width=0.6, colorup='r', colordown='g')

# 绘制技术指标
ax2.plot(data['date'], data['ma'], label='MA20')
ax2.plot(data['date'], data['upper'], label='Upper Band')
ax2.plot(data['date'], data['lower'], label='Lower Band')
ax2.legend()

plt.show()

使用复权价格进行计算
常见复权方式：前复权、后复权
Tushare 等 API 通常提供复权因子字段

确保每个时间点的计算只使用该时点之前的数据
避免在策略中使用未来信息

使用 time.sleep() 控制请求频率
实现指数退避策略处理限流

import time
import random

def safe_request(url):
    try:
        # 发送请求
        response = requests.get(url)

        # 如果被限流，等待一段时间后重试
        if response.status_code == 429:
            wait_time = random.uniform(1, 5)
            time.sleep(wait_time)
            return safe_request(url)

        return response
    except Exception as e:
        print(f"Request failed: {e}")
        time.sleep(1)
        return safe_request(url)

向量化计算通常比循环快 10-100 倍
示例：计算 RSI(相对强弱指数)

# 不推荐：使用循环
rsi_loop = []
for i in range(len(data)):
    # 复杂计算...
    pass

# 推荐：使用向量化操作
delta = data['close'].diff()
gain = delta.where(delta > 0, 0)
loss = -delta.where(delta < 0, 0)

avg_gain = gain.rolling(window=14).mean()
avg_loss = loss.rolling(window=14).mean()

rs = avg_gain / avg_loss
rsi = 100 - (100 / (1 + rs))

from numba import jit

@jit(nopython=True)
def numba_ma(values, window):
    result = np.empty(len(values))
    result[:] = np.nan

    for i in range(window-1, len(values)):
        result[i] = np.mean(values[i-window+1:i+1])

    return result

使用统计检验方法
进行样本外测试
考虑不同市场环境下的表现

定义统一接口
实现插件注册机制
提供配置化参数

class IndicatorPlugin:
    def __init__(self, params):
        self.params = params

    def calculate(self, data):
        raise NotImplementedError

# 示例插件
class MAIndicator(IndicatorPlugin):
    def calculate(self, data):
        return data['close'].rolling(window=self.params['window']).mean()

股票分析系统的开发涉及多个技术环节，从数据获取到指标计算，再到可视化展示和性能优化。本文介绍了一些核心技术和常见问题的解决方案，希望能帮助开发者快速构建可靠的股票分析工具。在实际开发中，还需要不断测试和优化，特别是在处理实盘数据时要格外小心。

正文完