在 AI 助手与编程工具快速迭代的今天,如何快速获取任意主题的最新社区讨论与实践技巧,成为开发者与研究人员的核心需求。last30days-skill 是一个运行于 Claude Code、Codex CLI 等 AI 编程环境中的技能(skill),它能够同时检索 Reddit、X(原 Twitter)、YouTube、Hacker News、Polymarket 预测市场以及全网内容,在 2 至 8 分钟内完成跨平台话题聚合,并通过大语言模型生成带有真实引用的问题与答案摘要。

多平台研究架构与数据源整合

last30days-skill 的核心设计理念是 “多源信号融合”。该技能目前支持八大内容来源:Reddit、X、Bluesky(AT Protocol)、YouTube、TikTok、Instagram、Hacker News 以及 Polymarket 预测市场。每一轮研究任务都会并行搜索这些平台(最多 10 个来源同时检索),随后通过统一的评分 pipeline 对所有结果进行去重、排序与合成。

Reddit 搜索在 v2.9 版本后默认使用 ScrapeCreators API,一个 API Key 即可覆盖 Reddit、TikTok 和 Instagram 三个平台,大幅简化了配置复杂度。X 搜索则采用内置的 Twitter GraphQL 客户端(需要 Node.js 22+),通过 AUTH_TOKENCT0 Cookie 实现无头本地搜索,也支持 xAI API 作为备选方案。YouTube 搜索依赖 yt-dlp 工具,在检测到该工具存在于系统 PATH 时自动激活,并额外提取视频的自动生成字幕作为内容来源。Hacker News 通过 Algolia 的公开 API 获取 Stories、Show HN 与 Ask HN 帖子,而 Polymarket 则通过 Gamma API 拉取实时预测市场数据 —— 这两者均无需 API Key。

v2.9.5 新增的 Bluesky 支持进一步扩展了社交信号来源。用户仅需配置 BSKY_HANDLEBSKY_APP_PASSWORD,即可将 Bluesky/AT Protocol 纳入搜索范围,实现与 Reddit、X 等平台完全一致的搜索、评分、去重与渲染流程。

预测市场整合:Polymarket 的独特价值

last30days-skill 最有特色的功能之一是对 Polymarket 预测市场的深度整合。与传统社交媒体仅反映用户观点不同,预测市场代表的是真金白银的集体判断。当用户搜索某个话题时,技能不仅返回 Reddit 讨论与 X 帖子,还会展示相关的 Polymarket 投注赔率、24 小时交易量、流动性深度以及价格变动速率。

例如,搜索 "Anthropic odds" 会返回这样的结果:Polymarket 给出 Anthropic 在 2 月底拥有最佳 AI 模型的概率为 98%,3 月份为 61%,而 IPO 首选概率为 64%,但 2026 年 6 月前上市的概率仅为 5%。同时,系统还会展示 "Claude 在 FrontierMath 上能否达到 50% 准确率" 的实时投注赔率 —— 这类信息在传统搜索引擎中极难获取,但对于判断技术发展趋势具有重要参考价值。

Polymarket 搜索采用双通道查询扩展(two-pass query expansion)技术。第一轮搜索将用户输入的关键词拆解为独立词素,在预测市场数据库中并行检索;第二轮则利用第一轮返回的分类标签(如 "NCAA CBB"、"地缘政治" 等)进行域桥接搜索。这种方法能够发现那些将目标实体作为结果选项之一、但标题中并未直接提及的市场 —— 例如搜索 "Arizona Basketball" 可以发现 "NCAA 锦标赛冠军" 市场中 Arizona 为 12% 的赔率。

多信号质量评分 pipeline

面对来自八大平台的数十甚至上百条结果,如何判断哪些内容真正值得呈现?last30days-skill 在 v2.5 版本中引入了复合评分 pipeline,对每条结果进行多维度质量评估。

文本相似度引擎采用双向子串匹配结合同义词扩展与 token 级别重叠评分。例如,"hip hop" 会匹配 "rap","MacBook" 会匹配 "Mac","AI video" 会匹配 "text to video"。这种方法确保了即使标题表述与查询词不完全一致,相关内容也不会被遗漏。

跨平台收敛检测是该评分系统的另一核心机制。当同一故事在多个平台同时出现时(例如某初创工具同时被 Reddit 讨论、被 X 转发、被 Hacker News 报道),系统会标记 [also on: Reddit, HN] 这样的信号,表明这是一个跨社区共识的重要话题。算法使用混合相似度(字符三元组 Jaccard 加上 token Jaccard)来检测即使标题表述不同但内容实质相同的跨平台内容。

Polymarket 市场的评分采用五因子加权组合:文本相关性占 30%、24 小时成交量占 30%、流动性深度占 15%、价格变动速率占 10%、结果竞争度占 10%。Outcome-aware 评分会将查询词与各个独立投注选项进行匹配,而非仅与市场标题匹配,这使得 "搜索 Arizona 但发现其作为投注选项" 的场景成为可能。

根据开发者的盲测评估,引入 Polymarket 与 Hacker News 数据源以及改进后的评分系统后,v2.5 在 5 个测试主题上的平均质量得分为 4.38/5.0,相较于 v1 的 3.73/5.0 提升了约 17%。

X 句柄解析与增量搜索

X 平台的一个独特挑战是:用户想了解某个品牌或人物时,该品牌 / 人物自己的账号往往不会在推文中提及自己的名称。例如搜索 "Dor Brothers",关键词匹配只能找到讨论他们的推文,而无法找到他们自己发布的、可能已经病毒式传播的帖子。

last30days-skill 通过前置的 WebSearch 步骤解决这一问题。在运行 X 搜索之前,系统会先查询 "{topic} X twitter handle site:x.com" 来解析目标对象的官方账号句柄。找到句柄后,第二步直接搜索该账号的所有近期推文(无关键词过滤),从而捕获那些从未提及自己名字但内容相关的病毒推文。系统还会验证解析到的账号是否为官方账号(排除 parody 或 fan 账号)。

比较模式与配置灵活性

v2.9.5 引入的 Comparatvie Mode 允许用户进行横向对比研究。当输入类似 "/last30days cursor vs windsurf" 这样的查询时,系统会执行三轮独立的研究搜索,分别针对 Cursor、Windsurf 以及两者的对比讨论,最终生成并排比较表格,列出各自的优势、劣势以及基于数据驱动的结论。

配置方面,系统支持全局配置(~/.config/last30days/.env)与项目级配置(.claude/last30days.env)两种方式。项目级配置可以覆盖全局设置,便于在不同的代码仓库中使用不同的 API 密钥或参数。v2.9 还增加了 SessionStart 配置检查功能,在 Claude Code 会话启动时自动验证配置完整性。

性能与使用建议

last30days-skill 的权衡在于:它能找到非常多的内容,但根据主题的冷门程度需要 2 至 8 分钟的执行时间。系统提供了三种速度模式:--quick 模式跳过补充搜索,每源仅抓取 8 至 12 条结果,适合快速验证;默认模式在速度与深度之间取得平衡;--deep 模式则进行 50 至 70 条 Reddit 帖子与 40 至 60 条 X 推文的全面搜索,配合扩展的补充搜索,适合深度研究。

对于需要持续追踪的主题,open 变体支持添加话题到观察列表(watchlist),配合 cron job 或常驻机器人可以实现定时自动研究,研究结果会自动积累到本地 SQLite 数据库中,用户可以随时用自然语言查询历史发现。

资料来源:GitHub mvanhorn/last30days-skill