AI 情报站 (fine-grained)
🤖 AI 情报站 (fine-grained)
每日全球 AI 技术动态自动采集站点
🌐 ai.hjhai.xyz | 📊 仪表盘 | 🗂️ GitHub
概述
自动化 AI 情报聚合系统:每日扫描 15 个 RSS 源 → 质量评分 → LLM 精选翻译 → GitHub Pages 发布。
技术栈
| 层 | 技术 |
|---|---|
| 前端 | React 19 + Vite + Tailwind CSS v4 + Recharts + React Router v7 |
| 采集 | Python + feedparser + requests (16 RSS 源) |
| 存储 | SQLite + FTS5 全文索引 |
| Pipeline | 5 阶段:scanner → dedup → scorer → curator → publisher |
| 精选 | LLM (DeepSeek V4) — 中文标题 + 摘要 + Why it matters |
| 部署 | 阿里云 ECS (pipeline) + GitHub Pages (前端) + 本地 Mac (Telegram 分发) |
| 调度 | Hermes Agent Cron (日扫 8:00 · 增量 30min · 周报 周日 10:00) |
数据源
- AI Lab: OpenAI, Google AI, DeepMind, Apple ML, NVIDIA
- Paper: ArXiv (cs.AI, cs.LG, cs.CL, cs.CV, stat.ML)
- Community: HuggingFace, PyTorch
- Blog: TechCrunch AI, VentureBeat AI
- 中文: 雷锋网 AI
Phase 1: 工程基座 ✅ (2026-06-02)
数据状态: 896 篇文章 · 16 信源 · 评分均分 51.3 (最高 84.6)
Phase 2: 内容深度 ✅ (2026-06-02)
新增模块: trends.py (趋势追踪) · paper_analyzer.py (论文解读) · weekly_report.py (周报生成) Cron: 每日精选 (每日 8:00) + 每周简报 (周日 10:00)
Phase 3: 知识图谱 ✅ (2026-06-02)
新增模块: model_tracker.py · paper_code_link.py新页面: leaderboard.html (🏆 AI 模型排行榜) 新表: models + model_benchmarks
Phase 4-6
详见 ROADMAP.md
Phase 4: 信源扩展 ✅ (2026-06-02)
新增模块: github_trending.py (GitHub Trending 抓取) 新页面元素: 首页 Trending 卡片区 新表: github_trending信源数: 15 → 16
Phase 5: 前端体验升级 ✅ (2026-06-03)
新增页面: timeline.html (📅 时间线) · clusters.html (🗺️ 话题聚类) 新增模块: cluster_viz.py (聚类计算) · sw.js (Service Worker) 导航栏: 搜索框 + 聚类 + 时间线入口 前端技术: Canvas 散点图、localStorage 状态管理、Service Worker 离线缓存
Phase 6: 分发 & 运营 ✅ (2026-06-03)
新增模块: telegram_digest.py (每日/每周 Telegram 摘要生成) Cron 更新: 每日扫描 +1 步 (Step 7),每周简报 +1 步 (Step 5)
Phase 7: React 前端重构 ✅ (2026-06-05)
新增: frontend/ 目录(React 源码)· React 组件 6 页 · TypeScript 类型严格 移除: 原生 JS HTML 页面 + Chart.js 依赖
Phase 8: 增量扫描 & 混合部署 ✅ (2026-06-12)
Phase 9: 中英双语 & 模型排行榜 & SEO ✅ (2026-06-13)
新增: useJsonLd.ts (结构化数据注入) · model_leaderboard.py (OpenRouter) · rss_feed.py / sitemap_gen.pyCron: 4 个自动化任务(日扫描 + 日推送 + 周简报 + 周推送)
当前数据 (2026-06-13)
- 📄 900+ 篇索引文章
- 📡 15+ 个 RSS 信源
- 🏷️ 8 个话题聚类
- 🏆 300+ 模型排行榜(OpenRouter)
- 🌐 中英双语 · SEO 全优化
- 📅 每日精选 Top 10 + 每周中英简报
本地运行
cd ~/Desktop/Projects/ai-intel
pip install feedparser requests sqlite-utils sqlite-vec
# 初始化
python scripts/db_init.py
python scripts/db_migrate.py
# 运行 Pipeline
python scripts/pipeline_run.py
# 单独运行某阶段
python -m scripts.pipeline.scorer