Zotero ChatGPT插件开发指南：从技术选型到生产环境部署

7次阅读

共计 2870 个字符，预计需要花费 8 分钟才能阅读完成。

学术研究者在文献管理过程中常面临两大核心问题：

信息过载处理效率低：当 Zotero 库中积累数百篇 PDF 时，快速理解文献核心内容需要逐篇阅读摘要
人工分类维护成本高：按主题 / 方法学手动打标签耗时且存在主观偏差，难以保持分类体系一致性

传统解决方案如 Zotero 的标签系统或 Notes 功能仍需要大量人工干预。我们开发的插件通过集成 ChatGPT 实现：

自动生成结构化摘要（研究问题 / 方法 / 结论）
智能推荐分类标签
批量处理历史文献库

方案	优点	缺点
JavaScript	原生支持 Zotero 插件开发	复杂 NLP 处理能力有限
Python	强大的 AI 生态	需额外处理跨进程通信

最终选择：采用混合架构，JavaScript 处理 Zotero 交互，Python 微服务负责 NLP 任务，通过 HTTP API 通信

本地 SQLite：适合隐私敏感场景，但无法跨设备同步
Firebase：实时同步优势，需考虑 GDPR 合规问题
IndexedDB：浏览器端存储，适合临时缓存

推荐方案：核心元数据存 Zotero 本地库，AI 生成内容用 IndexedDB 缓存

flowchart TB
    subgraph Zotero
        A[插件入口] --> B[获取文献元数据]
        B --> C[调用 Python 微服务]
    end
    subgraph Python
        C --> D[预处理文本]
        D --> E[调用 ChatGPT API]
        E --> F[解析响应]
    end
    F --> G[更新 Zotero 条目]

// 注册右键菜单项
function init() {
  Zotero.addMenuItem({
    tag: 'menu-item',
    label: 'Generate AI Summary',
    command: 'generate-summary',
    callback: processSelectedItems
  });
}

// 获取选中文献
async function processSelectedItems() {const items = Zotero.getSelectedItems();
  if (items.length === 0) return;

  const metadata = items.map(item => ({
    id: item.id,
    title: item.getField('title'),
    abstract: item.getField('abstractNote'),
    authors: item.getCreators().map(c => `${c.lastName}, ${c.firstName}`)
  }));

  const summaries = await callAIService(metadata);
  updateItems(items, summaries);
}

@app.route('/process', methods=['POST'])
def process_text():
    data = request.json

    # 构造 ChatGPT 提示
    prompt = f"""Summarize this academic paper in 3 bullet points:
    Title: {data['title']}
    Abstract: {data['abstract']}

    Focus on:
    - Research problem
    - Methodology
    - Key findings"""

    response = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.3  # 控制输出稳定性
    )

    return {'summary': response.choices[0].message.content,
        'tokens_used': response.usage.total_tokens
    }

批量处理策略
每 10 篇文献合并为一个 API 请求
使用 Promise.all 实现并发控制

const BATCH_SIZE = 10;

async function batchProcess(items) {const batches = [];
  for (let i = 0; i < items.length; i += BATCH_SIZE) {batches.push(items.slice(i, i + BATCH_SIZE));
  }

  return Promise.all(batches.map(batch => 
    callAIService(batch).catch(e => {console.error(`Batch failed: ${e}`);
      return null;
    })
  ));
}

缓存层设计
基于文献 DOI 建立哈希索引
本地缓存有效期 7 天
速率限制处理
实现指数退避重试机制
监控 OpenAI 的 x-ratelimit-remaining 头部

文献全文不上传云端，仅处理元数据
支持用户自定义 API endpoint
提供匿名化选项（移除作者信息）

async function safeAICall(payload) {
  try {
    const resp = await fetch(API_ENDPOINT, {
      method: 'POST',
      headers: {'Content-Type': 'application/json'},
      body: JSON.stringify(payload)
    });

    if (!resp.ok) {throw new Error(`HTTP ${resp.status}: ${await resp.text()}`);
    }

    return await resp.json();} catch (e) {Zotero.logError(`AI service error: ${e.message}`);
    showNotification('Failed to get AI analysis');
    return null;
  }
}

平台	测试重点
Windows	中文路径支持
macOS	权限沙箱限制
Linux	Python 环境兼容性

进阶功能建议
文献间关系图谱生成
自动生成文献综述草稿
方法学质量评估

自定义提示工程

PROMPT_TEMPLATES = {
    'clinical': "Analyze this medical study for PICO elements...",
    'cs': "Identify algorithms and datasets used in this paper..."
}