config.yaml 12 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289
  1. # ═══════════════════════════════════════════════════════════════
  2. # TrendRadar 配置文件
  3. # ═══════════════════════════════════════════════════════════════
  4. # ===============================================================
  5. # 1. 基础设置
  6. # ===============================================================
  7. app:
  8. # 时区配置(影响所有时间显示、推送窗口判断、数据存储)
  9. # 常用时区:
  10. # - Asia/Shanghai (北京时间 UTC+8)
  11. # - America/New_York (美东时间 UTC-5/-4)
  12. # - Europe/London (伦敦时间 UTC+0/+1)
  13. # 完整时区列表: https://en.wikipedia.org/wiki/List_of_tz_database_time_zones
  14. timezone: "Asia/Shanghai"
  15. show_version_update: true # 显示版本更新提示
  16. # ===============================================================
  17. # 2. 数据源 - 热榜平台
  18. #
  19. # id: 平台唯一标识(勿修改)
  20. # name: 显示名称(可自定义,修改后不影响运行)
  21. # ===============================================================
  22. platforms:
  23. - id: "toutiao"
  24. name: "今日头条"
  25. - id: "baidu"
  26. name: "百度热搜"
  27. - id: "wallstreetcn-hot"
  28. name: "华尔街见闻"
  29. - id: "thepaper"
  30. name: "澎湃新闻"
  31. - id: "bilibili-hot-search"
  32. name: "bilibili 热搜"
  33. - id: "cls-hot"
  34. name: "财联社热门"
  35. - id: "ifeng"
  36. name: "凤凰网"
  37. - id: "tieba"
  38. name: "贴吧"
  39. - id: "weibo"
  40. name: "微博"
  41. - id: "douyin"
  42. name: "抖音"
  43. - id: "zhihu"
  44. name: "知乎"
  45. # ===============================================================
  46. # 3. 数据源 - RSS 订阅
  47. #
  48. # 与热榜数据分开存储,按时间流展示
  49. # 每个源配置:id(唯一标识)、name(显示名称)、url(订阅地址)
  50. # enabled: 可选,默认 true
  51. # max_age_days: 可选,覆盖全局 freshness_filter.max_age_days
  52. # ===============================================================
  53. rss:
  54. enabled: true # 是否启用 RSS 抓取
  55. # 文章新鲜度过滤配置(全局默认值)
  56. # 过滤掉发布时间超过指定天数的旧文章,避免同一篇文章重复出现在推送中
  57. #
  58. # 过滤逻辑:
  59. # - 文章发布时间距当前时间(app.timezone 时区)超过 N 天则不推送
  60. # - 无发布时间的文章会被保留(不过滤)
  61. #
  62. # ⚠️ 过滤时机:在推送阶段过滤
  63. # - 所有文章都会存入数据库(MCP Server 的 AI 查询仍可访问)
  64. # - 只有新鲜的文章会被推送到通知渠道
  65. freshness_filter:
  66. enabled: true # 是否启用新鲜度过滤(默认启用)
  67. max_age_days: 3 # 最大文章年龄(天)
  68. # - 正整数:只推送 N 天内的文章
  69. # - 0:禁用过滤,推送所有文章
  70. # 单个 feed 可配置 max_age_days 覆盖全局设置:
  71. # - 不配置:使用全局 freshness_filter.max_age_days(默认 3 天)
  72. # - 正整数:覆盖全局设置,只推送此天数内的文章
  73. # - 0:禁用此频道的新鲜度过滤,推送所有文章
  74. feeds:
  75. - id: "hacker-news"
  76. name: "Hacker News"
  77. url: "https://hnrss.org/frontpage"
  78. # max_age_days: 1 # 示例:只推送1天内的文章
  79. - id: "ruanyifeng"
  80. name: "阮一峰的网络日志"
  81. url: "http://www.ruanyifeng.com/blog/atom.xml"
  82. # max_age_days: 7 # 示例:推送7天内的文章(更新较慢的博客)
  83. - id: "yahoo-finance"
  84. name: "雅虎财经"
  85. url: "https://finance.yahoo.com/news/rssindex"
  86. enabled: false # 禁用
  87. # 自定义源示例
  88. # - id: "custom-feed"
  89. # name: "自定义源"
  90. # url: "https://example.com/feed.xml"
  91. # enabled: false
  92. # max_age_days: 0 # 示例:禁用过滤,推送所有文章
  93. # ===============================================================
  94. # 4. 报告模式
  95. #
  96. # 🔸 daily(当日汇总模式)
  97. # • 推送时机:按时推送(默认每小时推送一次)
  98. # • 显示内容:当日所有匹配新闻 + 新增新闻区域
  99. # • 适用场景:日报总结、全面了解当日热点趋势
  100. #
  101. # 🔸 current(当前榜单模式)
  102. # • 推送时机:按时推送(默认每小时推送一次)
  103. # • 显示内容:当前榜单匹配新闻 + 新增新闻区域
  104. # • 适用场景:实时热点追踪、了解当前最火的内容
  105. #
  106. # 🔸 incremental(增量监控模式)
  107. # • 推送时机:有新增才推送
  108. # • 显示内容:新出现的匹配频率词新闻
  109. # • 适用场景:避免重复信息干扰
  110. # ===============================================================
  111. report:
  112. mode: "current" # 可选: daily | current | incremental
  113. display_mode: "keyword" # 可选: keyword | platform
  114. # keyword: 按关键词分组显示(默认)
  115. # platform: 按平台/来源分组显示
  116. rank_threshold: 5 # 排名高亮阈值
  117. sort_by_position_first: false # true=按配置位置排序,false=按热点条数排序
  118. max_news_per_keyword: 0 # 每个关键词最大显示数量(0=不限制)
  119. reverse_content_order: false # false=热点词汇统计在前,true=新增热点新闻在前
  120. # ===============================================================
  121. # 5. 推送通知
  122. #
  123. # ⚠️ 重要安全警告 ⚠️
  124. #
  125. # 🔴 请务必妥善保管好 webhooks,不要公开!!!
  126. # 🔴 如果你以 fork 的方式部署在 GitHub 上,请勿在此填写
  127. # 🔴 而是将 webhooks 填入 GitHub Secrets
  128. # (Settings → Secrets and variables → Actions)
  129. # 🔴 否则:
  130. # - 轻则:手机上收到大量垃圾广告推送
  131. # - 重则:webhook 被滥用造成严重安全隐患
  132. #
  133. # 📌 多账号支持说明
  134. #
  135. # • 使用分号(;)分隔多个账号,如:"url1;url2;url3"
  136. # • 需要配对的配置(如 Telegram 的 token 和 chat_id)数量必须一致
  137. # • 每个渠道最多支持 max_accounts_per_channel 个账号
  138. # • 邮箱已支持多收件人(逗号分隔)
  139. # ===============================================================
  140. notification:
  141. enabled: true # 是否启用通知功能
  142. # 🕐 推送时间窗口控制(可选功能)
  143. # 用途:限制推送的时间范围,避免非工作时间打扰
  144. # 适用场景:
  145. # - 只想在工作日白天接收推送(如 09:00-18:00)
  146. # - 希望在晚上固定时间收到汇总(如 20:00-22:00)
  147. # 注意:GitHub Actions 执行时间不稳定,时间范围建议至少留足 2 小时
  148. # 如果想要精准的定时推送,建议使用 Docker 部署在个人服务器上
  149. push_window:
  150. enabled: false # 是否启用推送时间窗口控制
  151. start: "20:00" # 开始时间(北京时间)
  152. end: "22:00" # 结束时间(北京时间)
  153. once_per_day: true # true=窗口内只推送一次,false=窗口内每次执行都推送
  154. # 推送渠道配置
  155. channels:
  156. feishu:
  157. webhook_url: "" # 飞书机器人 webhook URL
  158. dingtalk:
  159. webhook_url: "" # 钉钉机器人 webhook URL
  160. wework:
  161. webhook_url: "" # 企业微信机器人 webhook URL
  162. msg_type: "markdown" # 消息类型:markdown(群机器人) | text(个人微信应用)
  163. telegram:
  164. bot_token: "" # Telegram Bot Token
  165. chat_id: "" # Telegram Chat ID
  166. email:
  167. from: "" # 发件人邮箱地址
  168. password: "" # 发件人邮箱密码或授权码
  169. to: "" # 收件人邮箱,多个用逗号分隔
  170. smtp_server: "" # SMTP 服务器(可选,留空自动识别)
  171. smtp_port: "" # SMTP 端口(可选,留空自动识别)
  172. ntfy:
  173. server_url: "https://ntfy.sh" # ntfy 服务器地址(可改为自托管)
  174. topic: "" # ntfy 主题名称
  175. token: "" # ntfy 访问令牌(可选,用于私有主题)
  176. bark:
  177. url: "" # Bark 推送 URL(格式:https://api.day.app/your_device_key)
  178. slack:
  179. webhook_url: "" # Slack Incoming Webhook URL
  180. # ===============================================================
  181. # 6. 存储配置
  182. # ===============================================================
  183. storage:
  184. # 存储后端选择
  185. # - auto: 自动选择(GitHub Actions 且配置了远程存储 → remote,否则 → local)
  186. # - local: 本地 SQLite + TXT/HTML 文件
  187. # - remote: 远程云存储(S3 兼容协议,支持 R2/OSS/COS 等)
  188. backend: "auto"
  189. # 数据格式选项
  190. formats:
  191. sqlite: true # 主存储(必须启用)
  192. txt: false # 是否生成 TXT 快照
  193. html: true # 是否生成 HTML 报告(⚠️ 邮件推送必须设为 true)
  194. # 本地存储配置
  195. local:
  196. data_dir: "output" # 数据目录
  197. retention_days: 0 # 保留天数(0=永久保留)
  198. # 远程存储配置(S3 兼容协议)
  199. # 支持: Cloudflare R2, 阿里云 OSS, 腾讯云 COS, AWS S3, MinIO 等
  200. # 建议将敏感信息配置在 GitHub Secrets 或环境变量中
  201. remote:
  202. retention_days: 0 # 保留天数(0=永久保留)
  203. # S3 兼容配置(或使用环境变量 S3_ENDPOINT_URL 等)
  204. endpoint_url: "" # 服务端点
  205. # Cloudflare R2: https://<account_id>.r2.cloudflarestorage.com
  206. # 阿里云 OSS: https://oss-cn-hangzhou.aliyuncs.com
  207. # 腾讯云 COS: https://cos.ap-guangzhou.myqcloud.com
  208. bucket_name: "" # 存储桶名称
  209. access_key_id: "" # 访问密钥 ID
  210. secret_access_key: "" # 访问密钥
  211. region: "" # 区域(可选,部分服务商需要)
  212. # 数据拉取配置(从远程同步到本地)
  213. # 用于 MCP Server 等场景:爬虫存到远程,MCP 拉取到本地分析
  214. pull:
  215. enabled: false # 是否启用启动时自动拉取
  216. days: 7 # 拉取最近 N 天的数据
  217. # ===============================================================
  218. # 7. 高级设置(一般无需修改)
  219. # ===============================================================
  220. advanced:
  221. # 版本检查
  222. version_check_url: "https://raw.githubusercontent.com/sansan0/TrendRadar/refs/heads/master/version"
  223. # 爬虫设置
  224. crawler:
  225. enabled: true # 是否启用爬取新闻功能
  226. request_interval: 1000 # 请求间隔(毫秒)
  227. use_proxy: false # 是否启用代理
  228. default_proxy: "http://127.0.0.1:10801"
  229. # RSS 设置
  230. rss:
  231. request_interval: 2000 # 请求间隔(毫秒)
  232. timeout: 15 # 请求超时(秒)
  233. use_proxy: false # 是否使用代理
  234. proxy_url: "" # RSS 专属代理(留空则使用 crawler.default_proxy)
  235. notification_enabled: true # 是否启用 RSS 通知推送
  236. # 排序权重(用于重新排序不同平台的热搜)
  237. # 合起来等于 1
  238. weight:
  239. rank: 0.6 # 排名权重
  240. frequency: 0.3 # 频次权重
  241. hotness: 0.1 # 热度权重
  242. # 多账号限制
  243. max_accounts_per_channel: 3 # 每个渠道最大账号数量
  244. # 消息分批大小(字节)- 内部配置,请勿修改
  245. batch_size:
  246. default: 4000
  247. dingtalk: 20000
  248. feishu: 30000
  249. bark: 4000
  250. slack: 4000
  251. batch_send_interval: 3 # 批次发送间隔(秒)
  252. feishu_message_separator: "━━━━━━━━━━━━━━━━━━━"