config.yaml 23 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510
  1. # ═══════════════════════════════════════════════════════════════
  2. # TrendRadar 配置文件
  3. # Version: 1.1.0
  4. # ═══════════════════════════════════════════════════════════════
  5. # 可视化配置编辑器地址: https://sansan0.github.io/TrendRadar/
  6. # ===============================================================
  7. # 1. 基础设置
  8. # ===============================================================
  9. app:
  10. # 时区配置(影响所有时间显示、推送窗口判断、数据存储)
  11. # 常用时区:
  12. # - Asia/Shanghai (北京时间 UTC+8)
  13. # - America/New_York (美东时间 UTC-5/-4)
  14. # - Europe/London (伦敦时间 UTC+0/+1)
  15. # 完整时区列表: https://en.wikipedia.org/wiki/List_of_tz_database_time_zones
  16. timezone: "Asia/Shanghai"
  17. show_version_update: true # 显示版本更新提示
  18. # ===============================================================
  19. # 2. 数据源 - 热榜平台
  20. #
  21. # enabled: 是否启用热榜抓取(总开关)
  22. # sources: 平台列表
  23. # - id: 平台唯一标识(勿修改)
  24. # - name: 显示名称(可自定义,修改后不影响运行)
  25. # ===============================================================
  26. platforms:
  27. enabled: true # 是否启用热榜平台抓取
  28. sources:
  29. - id: "toutiao"
  30. name: "今日头条"
  31. - id: "baidu"
  32. name: "百度热搜"
  33. - id: "wallstreetcn-hot"
  34. name: "华尔街见闻"
  35. - id: "thepaper"
  36. name: "澎湃新闻"
  37. - id: "bilibili-hot-search"
  38. name: "bilibili 热搜"
  39. - id: "cls-hot"
  40. name: "财联社热门"
  41. - id: "ifeng"
  42. name: "凤凰网"
  43. - id: "tieba"
  44. name: "贴吧"
  45. - id: "weibo"
  46. name: "微博"
  47. - id: "douyin"
  48. name: "抖音"
  49. - id: "zhihu"
  50. name: "知乎"
  51. # ===============================================================
  52. # 3. 数据源 - RSS 订阅
  53. #
  54. # 与热榜数据分开存储,按时间流展示
  55. # 每个源配置:id(唯一标识)、name(显示名称)、url(订阅地址)
  56. # enabled: 可选,默认 true
  57. # max_age_days: 可选,覆盖全局 freshness_filter.max_age_days
  58. # ===============================================================
  59. rss:
  60. enabled: true # 是否启用 RSS 抓取
  61. # 文章新鲜度过滤配置(全局默认值)
  62. # 过滤掉发布时间超过指定天数的旧文章,避免同一篇文章重复出现在推送中
  63. #
  64. # 过滤逻辑:
  65. # - 文章发布时间距当前时间(app.timezone 时区)超过 N 天则不推送
  66. # - 无发布时间的文章会被保留(不过滤)
  67. #
  68. # ⚠️ 过滤时机:在推送阶段过滤
  69. # - 所有文章都会存入数据库(MCP Server 的 AI 查询仍可访问)
  70. # - 只有新鲜的文章会被推送到通知渠道
  71. freshness_filter:
  72. enabled: true # 是否启用新鲜度过滤(默认启用)
  73. max_age_days: 3 # 最大文章年龄(天)
  74. # - 正整数:只推送 N 天内的文章
  75. # - 0:禁用过滤,推送所有文章
  76. # 单个 feed 可配置 max_age_days 覆盖全局设置:
  77. # - 不配置:使用全局 freshness_filter.max_age_days(默认 3 天)
  78. # - 正整数:覆盖全局设置,只推送此天数内的文章
  79. # - 0:禁用此频道的新鲜度过滤,推送所有文章
  80. feeds:
  81. - id: "hacker-news"
  82. name: "Hacker News"
  83. url: "https://hnrss.org/frontpage"
  84. # max_age_days: 1 # 示例:只推送1天内的文章
  85. - id: "ruanyifeng"
  86. name: "阮一峰的网络日志"
  87. url: "http://www.ruanyifeng.com/blog/atom.xml"
  88. # max_age_days: 7 # 示例:推送7天内的文章(更新较慢的博客)
  89. - id: "yahoo-finance"
  90. name: "雅虎财经"
  91. url: "https://finance.yahoo.com/news/rssindex"
  92. enabled: false # 禁用
  93. # 自定义源示例
  94. # - id: "custom-feed"
  95. # name: "自定义源"
  96. # url: "https://example.com/feed.xml"
  97. # enabled: false
  98. # max_age_days: 0 # 示例:禁用过滤,推送所有文章
  99. # ===============================================================
  100. # 4. 报告模式
  101. #
  102. # 🔸 daily(当日汇总模式)
  103. # • 推送时机:按时推送(默认每小时推送一次)
  104. # • 显示内容:当日所有匹配新闻 + 新增新闻区域
  105. # • 适用场景:日报总结、全面了解当日热点趋势
  106. #
  107. # 🔸 current(当前榜单模式)
  108. # • 推送时机:按时推送(默认每小时推送一次)
  109. # • 显示内容:当前榜单匹配新闻 + 新增新闻区域
  110. # • 适用场景:实时热点追踪、了解当前最火的内容
  111. #
  112. # 🔸 incremental(增量监控模式)
  113. # • 推送时机:有新增才推送
  114. # • 显示内容:新出现的匹配频率词新闻
  115. # • 适用场景:避免重复信息干扰
  116. # ===============================================================
  117. report:
  118. mode: "current" # 可选: daily | current | incremental
  119. display_mode: "keyword" # 分组维度: keyword | platform
  120. # keyword: 按关键词分组显示(默认)
  121. # platform: 按平台/来源分组显示
  122. # 关键词组排序方式(仅 display_mode: keyword 时生效)
  123. # true: 按 frequency_words.txt 中的定义顺序排列
  124. # false: 按匹配到的热点条数排序(条数多的在前)
  125. sort_by_position_first: false
  126. rank_threshold: 5 # 排名高亮阈值
  127. max_news_per_keyword: 0 # 每个关键词最大显示数量(0=不限制)
  128. # ===============================================================
  129. # 5. 推送内容控制
  130. #
  131. # 统一管理推送消息中显示哪些区域及其排列顺序
  132. # ===============================================================
  133. display:
  134. # 📋 区域显示顺序
  135. # 列表从上到下的顺序 = 推送消息中从上到下的显示顺序
  136. # 想调整顺序?直接剪切粘贴整行即可,例如把 ai_analysis 移到最前面:
  137. # region_order:
  138. # - ai_analysis ← 移到第一行,AI 分析就会显示在最顶部
  139. # - new_items
  140. # - hotlist
  141. # - ...
  142. # 注意:区域需同时满足两个条件才会显示:
  143. # 1. 在此列表中
  144. # 2. 下方 regions 中对应开关为 true
  145. region_order:
  146. - new_items # 1️⃣ 新增热点区域
  147. - hotlist # 2️⃣ 热榜区域(关键词匹配)
  148. - rss # 3️⃣ RSS 订阅区域
  149. - standalone # 4️⃣ 独立展示区
  150. - ai_analysis # 5️⃣ AI 分析区域
  151. # 推送区域开关
  152. # 控制各区域是否启用(配合 region_order 使用)
  153. regions:
  154. hotlist: true # 热榜区域(关键词匹配的热点新闻)
  155. new_items: true # 新增热点区域(含热榜新增 + RSS 新增)
  156. # 注:热点词汇统计中的新增标记🆕不受此配置影响
  157. rss: false # RSS 订阅区域
  158. # 开启后将对 RSS 进行关键词分析并在通知中展示
  159. # 关闭后跳过分析,但独立展示区不受影响
  160. standalone: false # 独立展示区(完整热榜/RSS,不受关键词过滤)
  161. ai_analysis: true # AI 分析区域
  162. # 📋 独立展示区配置(仅在 regions.standalone: true 时生效)
  163. # 用途:将指定平台的完整热榜/RSS 单独展示,不受关键词过滤影响
  164. # 适用场景:
  165. # - 想完整查看某个平台的热榜排名
  166. # - RSS 源内容较少,希望全部展示而非只显示关键词匹配的
  167. # 注意:同一新闻可能同时出现在关键词匹配区和独立展示区
  168. standalone:
  169. platforms: [] # 热榜平台 ID 列表(如 ["zhihu", "weibo"])
  170. rss_feeds: [] # RSS 源 ID 列表(如 ["hacker-news"])
  171. max_items: 20 # 每个源最多展示条数(0=不限制)
  172. # ===============================================================
  173. # 6. 推送通知
  174. #
  175. # ⚠️ 重要安全警告 ⚠️
  176. #
  177. # 🔴 请务必妥善保管好 webhooks,不要公开!!!
  178. # 🔴 如果你以 fork 的方式部署在 GitHub 上,请勿在此填写
  179. # 🔴 而是将 webhooks 填入 GitHub Secrets
  180. # (Settings → Secrets and variables → Actions)
  181. # 🔴 否则:
  182. # - 轻则:手机上收到大量垃圾广告推送
  183. # - 重则:webhook 被滥用造成严重安全隐患
  184. #
  185. # 📌 多账号支持说明
  186. #
  187. # • 使用分号(;)分隔多个账号,如:"url1;url2;url3"
  188. # • 需要配对的配置(如 Telegram 的 token 和 chat_id)数量必须一致
  189. # • 每个渠道最多支持 max_accounts_per_channel 个账号
  190. # • 邮箱已支持多收件人(逗号分隔)
  191. # ===============================================================
  192. notification:
  193. enabled: true # 是否启用通知功能
  194. # 🕐 推送时间窗口控制(可选功能)
  195. # 用途:限制推送的时间范围,避免非工作时间打扰
  196. # 适用场景:
  197. # • 只想在工作日白天接收推送(如 09:00-18:00)
  198. # • 希望在晚上固定时间收到汇总(如 20:00-22:00)
  199. # ⚠️ GitHub Actions 用户注意:
  200. # 执行时间不稳定,时间范围建议至少留足 2 小时
  201. # 💡 想要精准定时?建议使用 Docker 部署在个人服务器上
  202. push_window:
  203. enabled: false # 是否启用推送时间窗口控制
  204. start: "20:00" # 开始时间(北京时间)
  205. end: "22:00" # 结束时间(北京时间)
  206. once_per_day: true # true=窗口内只推送一次,false=窗口内每次执行都推送
  207. # 推送渠道配置
  208. channels:
  209. feishu:
  210. webhook_url: "" # 飞书机器人 webhook URL
  211. dingtalk:
  212. webhook_url: "" # 钉钉机器人 webhook URL
  213. wework:
  214. webhook_url: "" # 企业微信机器人 webhook URL
  215. msg_type: "markdown" # 消息类型:markdown(群机器人) | text(个人微信应用)
  216. telegram:
  217. bot_token: "" # Telegram Bot Token
  218. chat_id: "" # Telegram Chat ID
  219. email:
  220. from: "" # 发件人邮箱地址
  221. password: "" # 发件人邮箱密码或授权码
  222. to: "" # 收件人邮箱,多个用逗号分隔
  223. smtp_server: "" # SMTP 服务器(可选,留空自动识别)
  224. smtp_port: "" # SMTP 端口(可选,留空自动识别)
  225. ntfy:
  226. server_url: "https://ntfy.sh" # ntfy 服务器地址(可改为自托管)
  227. topic: "" # ntfy 主题名称
  228. token: "" # ntfy 访问令牌(可选,用于私有主题)
  229. bark:
  230. url: "" # Bark 推送 URL(格式:https://api.day.app/your_device_key)
  231. slack:
  232. webhook_url: "" # Slack Incoming Webhook URL
  233. generic_webhook:
  234. webhook_url: "" # 通用 Webhook URL(支持 Discord、Matrix、IFTTT 等)
  235. payload_template: "" # JSON 模板,支持 {title} 和 {content} 占位符
  236. # 示例:{"content": "{content}"}
  237. # 留空则使用默认格式:{"title": "{title}", "content": "{content}"}
  238. # ===============================================================
  239. # 7. 存储配置
  240. # ===============================================================
  241. storage:
  242. # 存储后端选择
  243. # - auto: 自动选择(GitHub Actions 且配置了远程存储 → remote,否则 → local)
  244. # - local: 本地 SQLite + TXT/HTML 文件
  245. # - remote: 远程云存储(S3 兼容协议,支持 R2/OSS/COS 等)
  246. backend: "auto"
  247. # 数据格式选项
  248. formats:
  249. sqlite: true # 主存储(必须启用)
  250. txt: false # 是否生成 TXT 快照
  251. html: true # 是否生成 HTML 报告(⚠️ 邮件推送或者需要看网页版报告必须设为 true)
  252. # 本地存储配置
  253. local:
  254. data_dir: "output" # 数据目录
  255. retention_days: 0 # 保留天数(0=永久保留)
  256. # 远程存储配置(S3 兼容协议)
  257. # 支持: Cloudflare R2, 阿里云 OSS, 腾讯云 COS, AWS S3, MinIO 等
  258. # 建议将敏感信息配置在 GitHub Secrets 或环境变量中
  259. remote:
  260. retention_days: 0 # 保留天数(0=永久保留)
  261. # S3 兼容配置(或使用环境变量 S3_ENDPOINT_URL 等)
  262. endpoint_url: "" # 服务端点
  263. # Cloudflare R2: https://<account_id>.r2.cloudflarestorage.com
  264. # 阿里云 OSS: https://oss-cn-hangzhou.aliyuncs.com
  265. # 腾讯云 COS: https://cos.ap-guangzhou.myqcloud.com
  266. bucket_name: "" # 存储桶名称
  267. access_key_id: "" # 访问密钥 ID
  268. secret_access_key: "" # 访问密钥
  269. region: "" # 区域(可选,部分服务商需要)
  270. # 数据拉取配置(从远程同步到本地)
  271. # 用于 MCP Server 等场景:爬虫存到远程,MCP 拉取到本地分析
  272. pull:
  273. enabled: false # 是否启用启动时自动拉取
  274. days: 7 # 拉取最近 N 天的数据
  275. # ===============================================================
  276. # 8. AI 模型配置(共享)
  277. #
  278. # ai_analysis 和 ai_translation 共用此模型配置
  279. # 基于 LiteLLM 统一接口,支持 100+ AI 提供商
  280. # ===============================================================
  281. ai:
  282. # LiteLLM 模型格式: provider/model_name
  283. # 示例:
  284. # - deepseek/deepseek-chat (DeepSeek)
  285. # - openai/gpt-4o (OpenAI)
  286. # - gemini/gemini-2.5-flash (Google Gemini)
  287. # - anthropic/claude-3-5-sonnet (Anthropic)
  288. # - ollama/llama3 (本地 Ollama)
  289. # 完整列表: https://docs.litellm.ai/docs/providers
  290. # 如果你对于看英文文档比较头疼,那么可以点击页面右下角的 【Ask AI】 ,用中文询问怎么配置
  291. model: "deepseek/deepseek-chat"
  292. api_key: "" # API Key(建议使用环境变量 AI_API_KEY)
  293. api_base: "" # 自定义 API 端点(可选,大多数情况留空)
  294. # 示例: https://api.openai.com/v1(自建代理或兼容接口)
  295. #
  296. # 💡 超级重要:连接任意兼容 OpenAI 协议的模型商
  297. # 如果你使用的模型商不在上述支持列表中,但提供了兼容 OpenAI 的接口:
  298. #
  299. # 1. api_base 填写: 服务商提供的接口地址
  300. # 例如: https://api.example.com/v1
  301. #
  302. # 2. model 填写: "openai/" + 实际模型名称
  303. # 例如: openai/deepseek-ai/DeepSeek-V3
  304. # (原理:前缀 openai/ 强制 LiteLLM 使用 OpenAI 协议格式进行通信)
  305. timeout: 120 # 请求超时(秒)
  306. temperature: 1.0 # 采样温度 (0.0-2.0)
  307. # 注意:部分模型(如 gpt-5)可能要求必须为 1.0,否则会报错
  308. max_tokens: 5000 # 最大生成 token 数
  309. # 注意:如果 API 不支持此参数(报 HTTP 400),请设为 0 以禁用发送
  310. # 高级选项
  311. num_retries: 1 # 失败重试次数
  312. fallback_models: [] # 备用模型列表(可选)
  313. # 示例: ["openai/gpt-4o-mini", "openai/deepseek-ai/DeepSeek-V3"]
  314. # ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
  315. # 额外参数 (高级选项,一般无需修改)
  316. # ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
  317. # LiteLLM 会自动将通用参数转换为各提供商格式,无需手动适配。
  318. # 仅在需要传递特殊参数时启用此项。
  319. #
  320. # 提示:你可以根据模型 API 文档自行添加任何支持的字段。
  321. # 操作:如需启用,请删掉该行最前方的 "# "(井号和空格)。
  322. # 注意:如果这几行都带着井号,则代表不使用额外参数(推荐做法)。
  323. # -------------------------------------------------------------
  324. # extra_params:
  325. # top_p: 1.0 # 核采样(通用)
  326. # presence_penalty: 0.0 # 话题多样性(OpenAI/DeepSeek)
  327. # stop: ["END"] # 停止词列表(通用)
  328. # ===============================================================
  329. # 9. AI 分析功能
  330. #
  331. # 使用 AI 大模型对推送内容进行深度分析
  332. # 模型配置见上方 ai 配置段
  333. # ===============================================================
  334. ai_analysis:
  335. enabled: true # 是否启用 AI 分析
  336. # 🕐 AI 分析时间窗口控制(可选功能)
  337. # 用途:限制 AI 分析的时间范围,避免非必要时段消耗 API 额度
  338. # 适用场景:
  339. # • 只在工作时间进行 AI 分析(如 09:00-18:00)
  340. # • 在特定时段进行深度分析(如 20:00-22:00)
  341. # ⚠️ GitHub Actions 用户注意:
  342. # 执行时间不稳定,时间范围建议至少留足 2 小时
  343. # 💡 想要精准定时?建议使用 Docker 部署在个人服务器上
  344. analysis_window:
  345. enabled: false # 是否启用 AI 分析时间窗口控制
  346. start: "12:00" # 开始时间(使用 app.timezone 配置的时区)
  347. end: "21:00" # 结束时间(使用 app.timezone 配置的时区)
  348. once_per_day: false # true=窗口内只分析一次,false=窗口内每次执行都分析
  349. # 分析报告输出语言
  350. # 格式:自然语言描述
  351. # 示例: "English", "Korean", "法语"
  352. language: "Chinese"
  353. # 提示词配置文件路径(相对于 config 目录)
  354. prompt_file: "ai_analysis_prompt.txt"
  355. # AI 分析模式(独立于推送报告模式)
  356. # 可选值:
  357. # - "follow_report": 跟随 report.mode 的设置(默认)
  358. # - "daily": 强制使用当日汇总模式(分析当天所有新闻)
  359. # - "current": 强制使用当前榜单模式(只分析当前在榜新闻)
  360. # - "incremental": 强制使用增量模式(只分析新增新闻)
  361. #
  362. # 使用场景:
  363. # - 推送 incremental(避免重复),AI 分析 current(看当前榜单变化)
  364. # - 推送 current(实时热点),AI 分析 daily(全天总结)
  365. #
  366. mode: "follow_report"
  367. # 分析内容配置
  368. max_news_for_analysis: 60 # 参与分析的新闻数量上限(控制成本关键项)
  369. # 推送消息顶部会显示实际的 AI 分析数供参考
  370. # api 成本估算 (仅供参考)
  371. # 按默认模型(deepseek)
  372. # max_news_for_analysis 为 50 条
  373. # include_rank_timeline 为 false
  374. # 则
  375. # GitHub Action 部署默认推送约 20 次(每小时推送一次), 约 0.1 元/天
  376. # Docker 部署默认推送 48 次(每半小时推送一次), 约 0.2 元/天
  377. include_rss: false # 是否包含 RSS 内容进行分析
  378. include_rank_timeline: true # 是否传递完整排名时间线
  379. # false: 使用简化格式(排名范围+时间范围+出现次数)
  380. # true: 传递完整排名变化轨迹(如 1(09:30)→2(10:00)→0(11:00))
  381. # 启用后 AI 能更精确分析热度趋势,但会额外增加 token 消耗(0.5 倍到 1 倍)
  382. # ===============================================================
  383. # 10. AI 翻译功能
  384. #
  385. # 对推送内容进行多语言翻译,不包含 ai_analysis 分析的内容
  386. # 模型配置见上方 ai 配置段
  387. # ===============================================================
  388. ai_translation:
  389. enabled: false # 是否启用翻译功能
  390. # 翻译目标语言
  391. # 格式:自然语言描述
  392. # 示例: "Chinese", "Korean", "法语"
  393. language: "English"
  394. # 提示词配置文件路径(相对于 config 目录)
  395. prompt_file: "ai_translation_prompt.txt"
  396. # ===============================================================
  397. # 11. 高级设置(一般无需修改)
  398. # ===============================================================
  399. advanced:
  400. # 调试模式
  401. debug: false
  402. # 版本检查
  403. version_check_url: "https://raw.githubusercontent.com/sansan0/TrendRadar/refs/heads/master/version"
  404. mcp_version_check_url: "https://raw.githubusercontent.com/sansan0/TrendRadar/refs/heads/master/version_mcp"
  405. configs_version_check_url: "https://raw.githubusercontent.com/sansan0/TrendRadar/refs/heads/master/version_configs"
  406. # 热榜爬虫技术参数
  407. crawler:
  408. request_interval: 2000 # 请求间隔(毫秒)
  409. use_proxy: false # 是否启用代理
  410. default_proxy: "http://127.0.0.1:10801"
  411. # RSS 设置
  412. rss:
  413. request_interval: 1000 # 请求间隔(毫秒)
  414. timeout: 15 # 请求超时(秒)
  415. use_proxy: false # 是否使用代理
  416. proxy_url: "" # RSS 专属代理(留空则使用 crawler.default_proxy)
  417. # 排序权重(用于重新排序不同平台的热搜)
  418. # 合起来等于 1
  419. weight:
  420. rank: 0.6 # 排名权重
  421. frequency: 0.3 # 频次权重
  422. hotness: 0.1 # 热度权重
  423. # 多账号限制
  424. max_accounts_per_channel: 3 # 每个渠道最大账号数量
  425. # 消息分批大小(字节)- 内部配置,请勿修改
  426. batch_size:
  427. default: 4000
  428. dingtalk: 20000
  429. feishu: 30000
  430. bark: 4000
  431. slack: 4000
  432. batch_send_interval: 3 # 批次发送间隔(秒)
  433. feishu_message_separator: "━━━━━━━━━━━━━━━━━━━"