跨平台AI研究合成：last30days-skill技术解析

在 AI 助手与编程工具快速迭代的今天，如何快速获取任意主题的最新社区讨论与实践技巧，成为开发者与研究人员的核心需求。last30days-skill 是一个运行于 Claude Code、Codex CLI 等 AI 编程环境中的技能（skill），它能够同时检索 Reddit、X（原 Twitter）、YouTube、Hacker News、Polymarket 预测市场以及全网内容，在 2 至 8 分钟内完成跨平台话题聚合，并通过大语言模型生成带有真实引用的问题与答案摘要。

多平台研究架构与数据源整合

last30days-skill 的核心设计理念是 “多源信号融合”。该技能目前支持八大内容来源：Reddit、X、Bluesky（AT Protocol）、YouTube、TikTok、Instagram、Hacker News 以及 Polymarket 预测市场。每一轮研究任务都会并行搜索这些平台（最多 10 个来源同时检索），随后通过统一的评分 pipeline 对所有结果进行去重、排序与合成。

Reddit 搜索在 v2.9 版本后默认使用 ScrapeCreators API，一个 API Key 即可覆盖 Reddit、TikTok 和 Instagram 三个平台，大幅简化了配置复杂度。X 搜索则采用内置的 Twitter GraphQL 客户端（需要 Node.js 22+），通过 AUTH_TOKEN 与 CT0 Cookie 实现无头本地搜索，也支持 xAI API 作为备选方案。YouTube 搜索依赖 yt-dlp 工具，在检测到该工具存在于系统 PATH 时自动激活，并额外提取视频的自动生成字幕作为内容来源。Hacker News 通过 Algolia 的公开 API 获取 Stories、Show HN 与 Ask HN 帖子，而 Polymarket 则通过 Gamma API 拉取实时预测市场数据 —— 这两者均无需 API Key。

v2.9.5 新增的 Bluesky 支持进一步扩展了社交信号来源。用户仅需配置 BSKY_HANDLE 与 BSKY_APP_PASSWORD，即可将 Bluesky/AT Protocol 纳入搜索范围，实现与 Reddit、X 等平台完全一致的搜索、评分、去重与渲染流程。

预测市场整合：Polymarket 的独特价值

last30days-skill 最有特色的功能之一是对 Polymarket 预测市场的深度整合。与传统社交媒体仅反映用户观点不同，预测市场代表的是真金白银的集体判断。当用户搜索某个话题时，技能不仅返回 Reddit 讨论与 X 帖子，还会展示相关的 Polymarket 投注赔率、24 小时交易量、流动性深度以及价格变动速率。

例如，搜索 "Anthropic odds" 会返回这样的结果：Polymarket 给出 Anthropic 在 2 月底拥有最佳 AI 模型的概率为 98%，3 月份为 61%，而 IPO 首选概率为 64%，但 2026 年 6 月前上市的概率仅为 5%。同时，系统还会展示 "Claude 在 FrontierMath 上能否达到 50% 准确率" 的实时投注赔率 —— 这类信息在传统搜索引擎中极难获取，但对于判断技术发展趋势具有重要参考价值。

Polymarket 搜索采用双通道查询扩展（two-pass query expansion）技术。第一轮搜索将用户输入的关键词拆解为独立词素，在预测市场数据库中并行检索；第二轮则利用第一轮返回的分类标签（如 "NCAA CBB"、"地缘政治" 等）进行域桥接搜索。这种方法能够发现那些将目标实体作为结果选项之一、但标题中并未直接提及的市场 —— 例如搜索 "Arizona Basketball" 可以发现 "NCAA 锦标赛冠军" 市场中 Arizona 为 12% 的赔率。

多信号质量评分 pipeline

面对来自八大平台的数十甚至上百条结果，如何判断哪些内容真正值得呈现？last30days-skill 在 v2.5 版本中引入了复合评分 pipeline，对每条结果进行多维度质量评估。

文本相似度引擎采用双向子串匹配结合同义词扩展与 token 级别重叠评分。例如，"hip hop" 会匹配 "rap"，"MacBook" 会匹配 "Mac"，"AI video" 会匹配 "text to video"。这种方法确保了即使标题表述与查询词不完全一致，相关内容也不会被遗漏。

跨平台收敛检测是该评分系统的另一核心机制。当同一故事在多个平台同时出现时（例如某初创工具同时被 Reddit 讨论、被 X 转发、被 Hacker News 报道），系统会标记 [also on: Reddit, HN] 这样的信号，表明这是一个跨社区共识的重要话题。算法使用混合相似度（字符三元组 Jaccard 加上 token Jaccard）来检测即使标题表述不同但内容实质相同的跨平台内容。

Polymarket 市场的评分采用五因子加权组合：文本相关性占 30%、24 小时成交量占 30%、流动性深度占 15%、价格变动速率占 10%、结果竞争度占 10%。Outcome-aware 评分会将查询词与各个独立投注选项进行匹配，而非仅与市场标题匹配，这使得 "搜索 Arizona 但发现其作为投注选项" 的场景成为可能。

根据开发者的盲测评估，引入 Polymarket 与 Hacker News 数据源以及改进后的评分系统后，v2.5 在 5 个测试主题上的平均质量得分为 4.38/5.0，相较于 v1 的 3.73/5.0 提升了约 17%。

X 句柄解析与增量搜索

X 平台的一个独特挑战是：用户想了解某个品牌或人物时，该品牌 / 人物自己的账号往往不会在推文中提及自己的名称。例如搜索 "Dor Brothers"，关键词匹配只能找到讨论他们的推文，而无法找到他们自己发布的、可能已经病毒式传播的帖子。

last30days-skill 通过前置的 WebSearch 步骤解决这一问题。在运行 X 搜索之前，系统会先查询 "{topic} X twitter handle site:x.com" 来解析目标对象的官方账号句柄。找到句柄后，第二步直接搜索该账号的所有近期推文（无关键词过滤），从而捕获那些从未提及自己名字但内容相关的病毒推文。系统还会验证解析到的账号是否为官方账号（排除 parody 或 fan 账号）。

比较模式与配置灵活性

v2.9.5 引入的 Comparatvie Mode 允许用户进行横向对比研究。当输入类似 "/last30days cursor vs windsurf" 这样的查询时，系统会执行三轮独立的研究搜索，分别针对 Cursor、Windsurf 以及两者的对比讨论，最终生成并排比较表格，列出各自的优势、劣势以及基于数据驱动的结论。

配置方面，系统支持全局配置（~/.config/last30days/.env）与项目级配置（.claude/last30days.env）两种方式。项目级配置可以覆盖全局设置，便于在不同的代码仓库中使用不同的 API 密钥或参数。v2.9 还增加了 SessionStart 配置检查功能，在 Claude Code 会话启动时自动验证配置完整性。

性能与使用建议

last30days-skill 的权衡在于：它能找到非常多的内容，但根据主题的冷门程度需要 2 至 8 分钟的执行时间。系统提供了三种速度模式：--quick 模式跳过补充搜索，每源仅抓取 8 至 12 条结果，适合快速验证；默认模式在速度与深度之间取得平衡；--deep 模式则进行 50 至 70 条 Reddit 帖子与 40 至 60 条 X 推文的全面搜索，配合扩展的补充搜索，适合深度研究。

对于需要持续追踪的主题，open 变体支持添加话题到观察列表（watchlist），配合 cron job 或常驻机器人可以实现定时自动研究，研究结果会自动积累到本地 SQLite 数据库中，用户可以随时用自然语言查询历史发现。

资料来源：GitHub mvanhorn/last30days-skill