Zotero 7 接入 ChatGPT 实战指南：从配置到自动化文献处理

13次阅读

没有评论

共计 3153 个字符，预计需要花费 8 分钟才能阅读完成。

作为一名经常需要处理大量文献的科研人员，我深刻体会到手动整理文献的繁琐和低效。每天需要阅读数十篇论文，手动提取摘要、分类和标注关键词，这个过程不仅耗时耗力，还容易出错。特别是在写综述或整理参考文献时，重复性的工作让人疲惫不堪。

Zotero 作为一款优秀的文献管理工具，虽然提供了强大的组织功能，但在智能化处理方面仍有不足。这时候，我想到了结合 ChatGPT 的能力来自动化这些繁琐的任务。

在考虑如何将 ChatGPT 集成到 Zotero 时，我研究了三种主要的方案：

直接 API 调用 ：通过 Zotero 的 JavaScript API 获取文献数据，然后直接调用 OpenAI API 进行处理。这种方式灵活性强，但需要一定的编程基础。
浏览器扩展 ：开发一个 Chrome 扩展，在 Zotero 的网页界面中直接嵌入 ChatGPT 功能。这种方式用户体验较好，但开发复杂度较高。
本地脚本 ：编写本地脚本定时扫描 Zotero 数据库，自动处理新添加的文献。这种方式适合批量处理，但对实时性要求不高。

经过权衡，我选择了第一种方案，因为它最灵活且易于调试。

Zotero 提供了丰富的 JavaScript API，可以方便地获取文献数据。首先，我们需要初始化 Zotero 对象并获取当前选中的文献：

const zotero = require('zotero');

async function getSelectedItems() {
    try {
        const items = await zotero.items.get({
            libraryType: 'user',
            libraryID: 'your_library_id',
            itemType: 'journalArticle'
        });
        return items;
    } catch (error) {console.error('Failed to get items:', error);
        return [];}
}

接下来，我们需要设置 OpenAI API 的认证并调用 ChatGPT 来处理文献数据。这里我们使用 openai 官方库：

const {Configuration, OpenAIApi} = require('openai');

const configuration = new Configuration({apiKey: process.env.OPENAI_API_KEY});
const openai = new OpenAIApi(configuration);

async function generateSummary(text) {
    try {
        const response = await openai.createCompletion({
            model: 'text-davinci-003',
            prompt: `Summarize the following text:\n\n${text}`,
            max_tokens: 150
        });
        return response.data.choices[0].text.trim();} catch (error) {console.error('Failed to generate summary:', error);
        return null;
    }
}

为了实现高效的文献处理，我设计了一个简单的数据处理管道：

从 Zotero 获取文献元数据
提取文献摘要或全文（如果可用）
调用 ChatGPT 生成摘要和关键词
将处理结果写回 Zotero

这个管道可以很容易地扩展，比如添加自动分类或翻译功能。

以下是一个完整的 Node.js 脚本示例，展示了如何实现上述功能：

const zotero = require('zotero');
const {Configuration, OpenAIApi} = require('openai');

// 初始化 Zotero 和 OpenAI
const zoteroClient = new zotero({
    libraryType: 'user',
    libraryID: 'your_library_id',
    apiKey: 'your_zotero_api_key'
});

const openaiConfig = new Configuration({apiKey: process.env.OPENAI_API_KEY});
const openai = new OpenAIApi(openaiConfig);

// 主函数
async function processLiterature() {
    try {
        // 获取选中的文献
        const items = await zoteroClient.items.top();

        // 处理每篇文献
        for (const item of items) {const text = item.data.abstractNote || await getFullText(item);
            if (!text) continue;

            // 生成摘要
            const summary = await generateSummary(text);
            if (summary) {
                item.data.abstractNote = summary;
                await zoteroClient.items.update(item);
            }

            // 生成关键词
            const keywords = await generateKeywords(text);
            if (keywords) {item.data.tags = keywords.split(',').map(k => ({ tag: k.trim() }));
                await zoteroClient.items.update(item);
            }
        }

        console.log('Processed', items.length, 'items');
    } catch (error) {console.error('Error processing literature:', error);
    }
}

// 辅助函数：获取全文
async function getFullText(item) {// 实现略...}

// 辅助函数：生成摘要
async function generateSummary(text) {// 实现略...}

// 辅助函数：生成关键词
async function generateKeywords(text) {// 实现略...}

// 启动处理
processLiterature();

为了提升处理效率，我采用了以下几种优化策略：