|
|
@@ -2,15 +2,15 @@
|
|
|
|
|
|
# 🎯 TrendRadar
|
|
|
|
|
|
-**多平台热点资讯监控分析系统**
|
|
|
+**你的专属热点助手 —— 让手机只推送你真正关心的新闻**
|
|
|
|
|
|
-<strong>🚀 一键部署,最快一分钟配置完毕!</strong>
|
|
|
+<strong>🚀 最快一分钟部署完毕!从此告别无效刷屏,只看有价值的信息</strong>
|
|
|
|
|
|
[](https://github.com/sansan0/TrendRadar/stargazers)
|
|
|
[](https://github.com/sansan0/TrendRadar/network/members)
|
|
|
[](LICENSE)
|
|
|
[](https://www.python.org/)
|
|
|
-[](https://github.com/sansan0/TrendRadar)
|
|
|
+[](https://github.com/sansan0/TrendRadar)
|
|
|
|
|
|
[](https://work.weixin.qq.com/)
|
|
|
[](https://telegram.org/)
|
|
|
@@ -21,32 +21,64 @@
|
|
|
|
|
|
</div>
|
|
|
|
|
|
-> 本项目是我玩微信公众号的副产品。如果项目对你有帮助,请 **点击 Star ⭐** 支持我~~有条件的可选择去【硅基茶水间】公众号对应的项目文章下面[点赞] or [转发] or [推荐],我能在后台看到你们的支持,成为老粉就在今天哈哈~(≧∇≦)ノ
|
|
|
+> 如果项目对你有帮助,请 **点击 Star ⭐** 支持我~~有条件的可选择去【硅基茶水间】公众号对应的项目文章下面【点赞】【转发】【推荐】,关注我,支持我,成为老粉就在今天哈哈~(≧∇≦)ノ也可以公众号【发消息】留言遇到的问题,欢迎来玩耍~
|
|
|
|
|
|
## ✨ 核心功能
|
|
|
|
|
|
-- **全网热点聚合** - 一站式监控 11 个主流平台(今日头条、百度热搜、微博、抖音、知乎、B 站、财联社等),统一获取多源热点信息,提升信息获取效率
|
|
|
+### **全网热点聚合**
|
|
|
|
|
|
-- **多维度热点分析** - 智能识别话题生命周期,追踪热点从爆发到消退的完整走势,为**媒体从业者**、**市场分析师**和**信息爱好者**提供舆情变化洞察
|
|
|
+一次监控 11+ 个主流平台(微博、知乎、抖音、百度等),再也不用逐个 APP 刷新闻
|
|
|
|
|
|
-- 或者像我一样通过这个工具来**反向减少对各种 APP** 的使用依赖的
|
|
|
+### **智能热度追踪**
|
|
|
|
|
|
-- **智能内容筛选** - 支持自定义频率词,过滤词和必须词的配置,精准定位关注话题,有效过滤无关信息噪音
|
|
|
+自动分析热点从爆发到消退的完整过程,帮你把握舆情变化趋势
|
|
|
|
|
|
-- **多渠道实时推送** - 通过**飞书机器人** 推送重要资讯或者**GitHub Pages** 自带的设置页面,一键跳转新闻详情。目前支持**企业微信**(10 秒配置完毕,设置速度最快,小白都会),**飞书**(消息显示最友好),**钉钉**,**telegram**推送渠道
|
|
|
+### **精准内容筛选**
|
|
|
|
|
|
-- **开箱即用部署** - 一键 Fork 即可部署,简化部署流程和技术门槛
|
|
|
+设置个人关键词(如:AI、比亚迪、教育政策),只推送相关热点,过滤无关信息
|
|
|
|
|
|
-**💡 提示:** GitHub Pages 自带的设置页面也方便, 配置一下,保存一个网页链接即可,比如我这里[TrendRadar 网页版](https://sansan0.github.io/TrendRadar/).要达到一分钟配置完毕的速度,请优先选择**企业微信通知**
|
|
|
+> _比如关注"新能源",自动筛选出特斯拉降价、政策补贴等相关新闻_
|
|
|
|
|
|
-## 更新日志
|
|
|
+### **多渠道实时推送**
|
|
|
|
|
|
-**📋 升级说明:** 已经**fork**的同学,如果想获得最新功能:只需要把本项目中 main.py 文件里的所有代码复制过来,替换掉你那边的旧代码就行了(可以直接在 GitHub 网页上编辑)。
|
|
|
-按照一般编程的逻辑,其实应该把 main.py 中的代码分散到多个不同的文件中,这样代码结构会更清晰,我写起来也更顺手。但考虑到大家升级版本的便捷性,我特意把所有功能都放在了一个文件里——这样你们只需要复制替换这一个文件就能完成升级 😘
|
|
|
+支持企业微信、飞书、钉钉、Telegram 主流聊天工具,消息直达手机
|
|
|
+
|
|
|
+### **零技术门槛部署**
|
|
|
+
|
|
|
+GitHub 一键 Fork 即可使用,无需服务器,无需编程基础。如果要手机接收通知, 要达到 1 分钟部署完毕的效果,请选择**企业微信**
|
|
|
+
|
|
|
+> _就,很快_
|
|
|
+
|
|
|
+### **减少 APP 依赖**
|
|
|
+
|
|
|
+不再需要频繁打开各种资讯 APP,有效控制手机使用时间
|
|
|
+
|
|
|
+> _从"被算法推荐绑架"变成"主动获取自己想要的信息"_
|
|
|
+
|
|
|
+**适合人群:** 投资者、自媒体人、企业公关、关心时事的普通用户
|
|
|
+
|
|
|
+**典型场景:** 股市投资监控、品牌舆情追踪、行业动态关注、生活资讯获取
|
|
|
+
|
|
|
+**💡 提示:** GitHub Pages 自带的设置页面也方便, 配置一下,保存一个网页链接即可,比如我这里[TrendRadar 网页版](https://sansan0.github.io/TrendRadar/),这个 30 秒配置完毕。
|
|
|
+
|
|
|
+<p align="center">
|
|
|
+ <img src="_image/2025-06-14.jpg" alt="最新推送效果" width="400"/>
|
|
|
+</p>
|
|
|
+
|
|
|
+## 📝 更新日志
|
|
|
+
|
|
|
+**升级说明:** 已经**fork**的同学,如果想获得最新功能:只需要把本项目中 main.py 文件里的所有代码复制过来,替换掉你那边的旧代码就行了(可以直接在 GitHub 网页上编辑)。
|
|
|
+
|
|
|
+### 2025/06/23 - v1.3.0
|
|
|
+
|
|
|
+企业微信 和 Telegram 的推送消息有长度限制,对此我采用将消息拆分推送的方式。开发文档详见[企业微信](https://developer.work.weixin.qq.com/document/path/91770) 和 [Telegram](https://core.telegram.org/bots/api)
|
|
|
+
|
|
|
+<details>
|
|
|
+<summary><strong>📝 查看历史更新</strong></summary>
|
|
|
|
|
|
### 2025/06/21 - v1.2.1
|
|
|
|
|
|
-已 fork 的同学除了 main.py 需要更新,还有 crawler.yml ,也需要你复制替换
|
|
|
+在本版本之前的旧版本,不仅 main.py 需要复制替换, crawler.yml 也需要你复制替换
|
|
|
https://github.com/sansan0/TrendRadar/blob/master/.github/workflows/crawler.yml
|
|
|
|
|
|
### 2025/06/19 - v1.2.0
|
|
|
@@ -71,10 +103,6 @@ https://github.com/sansan0/TrendRadar/blob/master/.github/workflows/crawler.yml
|
|
|
1. 去掉了兼容代码,之前 fork 的同学,直接复制代码会在当天显示异常(第二天会恢复正常)
|
|
|
2. feishu 和 html 底部增加一个新增新闻显示
|
|
|
|
|
|
-<p align="center">
|
|
|
- <img src="_image/2025-06-14.jpg" alt="更新" width="400"/>
|
|
|
-</p>
|
|
|
-
|
|
|
### 2025/06/09
|
|
|
|
|
|
**100 star⭐** 了,写个小功能给大伙儿助助兴
|
|
|
@@ -118,6 +146,8 @@ frequency_words.txt 文件增加了一个【必须词】功能,使用 + 号
|
|
|
</tr>
|
|
|
</table>
|
|
|
|
|
|
+</details>
|
|
|
+
|
|
|
## 🔍 支持的平台
|
|
|
|
|
|
目前已支持以下 11 个热门平台:
|
|
|
@@ -142,306 +172,294 @@ frequency_words.txt 文件增加了一个【必须词】功能,使用 + 号
|
|
|
|
|
|
2. **设置 GitHub Secrets(选择你需要的平台)**:
|
|
|
|
|
|
- 在你 Fork 后的仓库中,进入 `Settings` > `Secrets and variables` > `Actions`,然后根据需要配置以下任一或多个通知平台:
|
|
|
+ 在你 Fork 后的仓库中,进入 `Settings` > `Secrets and variables` > `Actions` > `New repository secret`,然后根据需要配置以下任一或多个通知平台:
|
|
|
+
|
|
|
+ **💡 提示:** 可以同时配置多个平台,系统会向所有配置的平台发送通知。点击下方对应平台展开详细配置步骤。
|
|
|
|
|
|
- ### 🟡 企业微信机器人(配置最简单最迅速)
|
|
|
+ <details>
|
|
|
+ <summary>🟡 <strong>企业微信机器人</strong>(配置最简单最迅速)</summary>
|
|
|
|
|
|
+ **GitHub Secret 配置:**
|
|
|
- 名称:`WEWORK_WEBHOOK_URL`
|
|
|
- 值:你的企业微信机器人 Webhook 地址
|
|
|
|
|
|
- ### 🟢 飞书机器人(消息显示最友好)
|
|
|
-
|
|
|
- - 名称:`FEISHU_WEBHOOK_URL`
|
|
|
- - 值:你的飞书机器人 Webhook 地址
|
|
|
-
|
|
|
- ### 🔵 钉钉机器人
|
|
|
+ **机器人设置步骤:**
|
|
|
|
|
|
- - 名称:`DINGTALK_WEBHOOK_URL`
|
|
|
- - 值:你的钉钉机器人 Webhook 地址
|
|
|
-
|
|
|
- ### 🟣 Telegram Bot (配置最复杂)
|
|
|
-
|
|
|
- - 名称:`TELEGRAM_BOT_TOKEN`
|
|
|
- - 值:你的 Telegram Bot Token
|
|
|
- - 名称:`TELEGRAM_CHAT_ID`
|
|
|
- - 值:你的 Telegram Chat ID
|
|
|
-
|
|
|
- **注意:** 可以同时配置多个平台,系统会向所有配置的平台发送通知。具体设置方法请参考下方对应的机器人设置教程。
|
|
|
-
|
|
|
-3. **自定义关键词**:
|
|
|
+ #### 手机端设置:
|
|
|
+ 1. 打开企业微信 App → 进入目标内部群聊
|
|
|
+ 2. 点击右上角"…"按钮 → 选择"群机器人"
|
|
|
+ 3. 点击"添加" → 点击"新建" → 设置机器人昵称
|
|
|
+ 4. 复制 Webhook 地址,配置到上方的 GitHub Secret 中
|
|
|
|
|
|
- - 修改`frequency_words.txt`文件,添加你需要监控的频率词,过滤词,必须词
|
|
|
-
|
|
|
-4. **自动运行**:
|
|
|
-
|
|
|
- - 项目已包含`.github/workflows/crawler.yml`配置文件,默认每 50 分钟自动运行一次
|
|
|
- - 你也可以在 GitHub 仓库的 Actions 页面手动触发运行
|
|
|
+ #### PC 端设置流程类似
|
|
|
+ </details>
|
|
|
|
|
|
-5. **查看结果**:
|
|
|
- - 运行结果将自动保存在仓库的`output`目录中
|
|
|
- - 同时通过飞书机器人发送通知到你的群组
|
|
|
+ <details>
|
|
|
+ <summary>🟢 <strong>飞书机器人</strong>(消息显示最友好)</summary>
|
|
|
|
|
|
-## 🤖 多平台机器人设置
|
|
|
+ **GitHub Secret 配置:**
|
|
|
+ - 名称:`FEISHU_WEBHOOK_URL`
|
|
|
+ - 值:你的飞书机器人 Webhook 地址
|
|
|
|
|
|
-### 🟡 企业微信机器人设置
|
|
|
+ **机器人设置步骤:**
|
|
|
|
|
|
-#### 手机端设置:
|
|
|
+ 1. 电脑浏览器打开 https://botbuilder.feishu.cn/home/my-app
|
|
|
|
|
|
-1. 打开企业微信 App → 进入目标内部群聊
|
|
|
-2. 点击右上角"…"按钮 → 选择"群机器人"
|
|
|
-3. 点击"添加" → 点击"新建" → 设置机器人昵称
|
|
|
-4. 复制 Webhook 地址
|
|
|
+ 2. 点击"新建机器人应用"
|
|
|
|
|
|
-#### PC 端也是类似设置流程
|
|
|
+ 3. 进入创建的应用后,点击"流程涉及" > "创建流程" > "选择触发器"
|
|
|
|
|
|
-**配置到 GitHub**:将获得的 Webhook URL 配置到 GitHub Secrets 中的 `WEWORK_WEBHOOK_URL`
|
|
|
+ 4. 往下滑动,点击"Webhook 触发"
|
|
|
|
|
|
-### 🟢 飞书机器人设置
|
|
|
+ 5. 此时你会看到"Webhook 地址",把这个链接先复制到本地记事本暂存,继续接下来的操作
|
|
|
|
|
|
-1. 电脑浏览器打开 https://botbuilder.feishu.cn/home/my-app
|
|
|
+ 6. "参数"里面放上下面的内容,然后点击"完成"
|
|
|
|
|
|
-2. 点击"新建机器人应用"
|
|
|
+ ```json
|
|
|
+ {
|
|
|
+ "message_type": "text",
|
|
|
+ "content": {
|
|
|
+ "total_titles": "{{内容}}",
|
|
|
+ "timestamp": "{{内容}}",
|
|
|
+ "report_type": "{{内容}}",
|
|
|
+ "text": "{{内容}}"
|
|
|
+ }
|
|
|
+ }
|
|
|
+ ```
|
|
|
|
|
|
-3. 进入创建的应用后,点击"流程涉及" > "创建流程" > "选择触发器"
|
|
|
+ 7. 点击"选择操作" > "发送飞书消息",勾选 "群消息",然后点击下面的输入框,点击"我管理的群组"(如果没有群组,你可以在飞书 app 上创建群组)
|
|
|
|
|
|
-4. 往下滑动,点击"Webhook 触发"
|
|
|
+ 8. 消息标题填写"TrendRadar 热点监控"
|
|
|
|
|
|
-5. 此时你会看到"Webhook 地址",把这个链接先复制到本地记事本暂存,继续接下来的操作
|
|
|
+ 9. 最关键的部分来了,点击 + 按钮,选择"Webhook 触发",然后按照下面的图片摆放
|
|
|
|
|
|
-6. "参数"里面放上下面的内容,然后点击"完成"
|
|
|
+ 
|
|
|
|
|
|
-```json
|
|
|
-{
|
|
|
- "message_type": "text",
|
|
|
- "content": {
|
|
|
- "total_titles": "{{内容}}",
|
|
|
- "timestamp": "{{内容}}",
|
|
|
- "report_type": "{{内容}}",
|
|
|
- "text": "{{内容}}"
|
|
|
- }
|
|
|
-}
|
|
|
-```
|
|
|
+ 10. 配置完成后,将第 5 步复制的 Webhook 地址配置到 GitHub Secrets 中的 `FEISHU_WEBHOOK_URL`
|
|
|
+ </details>
|
|
|
|
|
|
-7. 点击"选择操作" > "发送飞书消息" ,勾选 "群消息", 然后点击下面的输入框,点击"我管理的群组"(如果没有群组,你可以在飞书 app 上创建群组)
|
|
|
+ <details>
|
|
|
+ <summary>🔵 <strong>钉钉机器人</strong></summary>
|
|
|
|
|
|
-8. 消息标题填写"TrendRadar 热点监控"
|
|
|
+ **GitHub Secret 配置:**
|
|
|
+ - 名称:`DINGTALK_WEBHOOK_URL`
|
|
|
+ - 值:你的钉钉机器人 Webhook 地址
|
|
|
|
|
|
-9. 最关键的部分来了,点击 + 按钮,选择"Webhook 触发",然后按照下面的图片摆放
|
|
|
+ **机器人设置步骤:**
|
|
|
|
|
|
-
|
|
|
+ 1. **创建机器人(仅 PC 端支持)**:
|
|
|
+ - 打开钉钉 PC 客户端,进入目标群聊
|
|
|
+ - 点击群设置图标(⚙️)→ 往下翻找到"机器人"点开
|
|
|
+ - 选择"添加机器人" → "自定义"
|
|
|
|
|
|
-10. 配置完成后,将第 5 步复制的 Webhook 地址配置到 GitHub Secrets 中的 `FEISHU_WEBHOOK_URL`
|
|
|
+ 2. **配置机器人**:
|
|
|
+ - 设置机器人名称
|
|
|
+ - **安全设置**:
|
|
|
+ - **自定义关键词**:设置 "热点"
|
|
|
|
|
|
-### 🔵 钉钉机器人设置
|
|
|
+ 3. **完成设置**:
|
|
|
+ - 勾选服务条款协议 → 点击"完成"
|
|
|
+ - 复制获得的 Webhook URL
|
|
|
+ - 将 URL 配置到 GitHub Secrets 中的 `DINGTALK_WEBHOOK_URL`
|
|
|
|
|
|
-1. **创建机器人(仅 PC 端支持)**:
|
|
|
+ **注意**:移动端只能接收消息,无法创建新机器人。
|
|
|
+ </details>
|
|
|
|
|
|
- - 打开钉钉 PC 客户端,进入目标群聊
|
|
|
- - 点击群设置图标(⚙️)→ 往下翻找到"机器人"点开
|
|
|
- - 选择"添加机器人" → "自定义"
|
|
|
+ <details>
|
|
|
+ <summary>🟣 <strong>Telegram Bot</strong>(配置最复杂)</summary>
|
|
|
|
|
|
-2. **配置机器人**:
|
|
|
+ **GitHub Secret 配置:**
|
|
|
+ - 名称:`TELEGRAM_BOT_TOKEN` - 你的 Telegram Bot Token
|
|
|
+ - 名称:`TELEGRAM_CHAT_ID` - 你的 Telegram Chat ID
|
|
|
|
|
|
- - 设置机器人名称
|
|
|
- - **安全设置**:
|
|
|
- - **自定义关键词**:设置 "热点"
|
|
|
+ **机器人设置步骤:**
|
|
|
|
|
|
-3. **完成设置**:
|
|
|
- - 勾选服务条款协议 → 点击"完成"
|
|
|
- - 复制获得的 Webhook URL
|
|
|
- - 将 URL 配置到 GitHub Secrets 中的 `DINGTALK_WEBHOOK_URL`
|
|
|
+ 1. **创建机器人**:
|
|
|
+ - 在 Telegram 中搜索 `@BotFather`(大小写注意,有蓝色徽章勾勾,有类似 37849827 monthly users,这个才是官方的,有一些仿官方的账号注意辨别)
|
|
|
+ - 发送 `/newbot` 命令创建新机器人
|
|
|
+ - 设置机器人名称(必须以"bot"结尾,很容易遇到重复名字,所以你要绞尽脑汁想不同的名字)
|
|
|
+ - 获取 Bot Token(格式如:`123456789:AAHfiqksKZ8WmR2zSjiQ7_v4TMAKdiHm9T0`)
|
|
|
|
|
|
-**注意**:移动端只能接收消息,无法创建新机器人。
|
|
|
+ 2. **获取 Chat ID**:
|
|
|
|
|
|
-### 🟣 Telegram Bot 设置
|
|
|
+ **方法一:通过官方 API 获取**
|
|
|
+ - 先向你的机器人发送一条消息
|
|
|
+ - 访问:`https://api.telegram.org/bot<你的Bot Token>/getUpdates`
|
|
|
+ - 在返回的 JSON 中找到 `"chat":{"id":数字}` 中的数字
|
|
|
|
|
|
-1. **创建机器人**:
|
|
|
+ **方法二:使用第三方工具**
|
|
|
+ - 搜索 `@userinfobot` 并发送 `/start`
|
|
|
+ - 获取你的用户 ID 作为 Chat ID
|
|
|
|
|
|
- - 在 Telegram 中搜索 `@BotFather`(大小写注意,有蓝色徽章勾勾,有类似 37849827 monthly users ,这个才是官方的,有一些仿官方的账号注意辨别)
|
|
|
- - 发送 `/newbot` 命令创建新机器人
|
|
|
- - 设置机器人名称(必须以"bot"结尾,很容易遇到重复名字,所以你要绞劲脑汁想不同的名字)
|
|
|
- - 获取 Bot Token(格式如:`123456789:AAHfiqksKZ8WmR2zSjiQ7_v4TMAKdiHm9T0`)
|
|
|
+ 3. **配置到 GitHub**:
|
|
|
+ - `TELEGRAM_BOT_TOKEN`:填入第 1 步获得的 Bot Token
|
|
|
+ - `TELEGRAM_CHAT_ID`:填入第 2 步获得的 Chat ID
|
|
|
+ </details>
|
|
|
|
|
|
-2. **获取 Chat ID**:
|
|
|
+3. **自定义关键词**:
|
|
|
|
|
|
- **方法一:通过官方 API 获取**
|
|
|
+ - 修改`frequency_words.txt`文件,添加你需要监控的频率词,过滤词,必须词
|
|
|
|
|
|
- - 先向你的机器人发送一条消息
|
|
|
- - 访问:`https://api.telegram.org/bot<你的Bot Token>/getUpdates`
|
|
|
- - 在返回的 JSON 中找到 `"chat":{"id":数字}` 中的数字
|
|
|
+4. **自动运行**:
|
|
|
|
|
|
- **方法二:使用第三方工具**
|
|
|
+ - 项目已包含`.github/workflows/crawler.yml`配置文件,默认每 50 分钟自动运行一次
|
|
|
+ - 你也可以在 GitHub 仓库的 Actions 页面手动触发运行
|
|
|
|
|
|
- - 搜索 `@userinfobot` 并发送 `/start`
|
|
|
- - 获取你的用户 ID 作为 Chat ID
|
|
|
+5. **查看结果**:
|
|
|
+ - 运行结果将自动保存在仓库的`output`目录中
|
|
|
+ - 同时通过配置的机器人发送通知到你的群组
|
|
|
|
|
|
-3. **配置到 GitHub**:
|
|
|
- - `TELEGRAM_BOT_TOKEN`:填入第 1 步获得的 Bot Token
|
|
|
- - `TELEGRAM_CHAT_ID`:填入第 2 步获得的 Chat ID
|
|
|
|
|
|
-## ⚙️ frequency_words.txt 完整配置教程(三种语法)
|
|
|
+## ⚙️ frequency_words.txt 完整配置教程
|
|
|
|
|
|
-在`frequency_words.txt`文件中配置监控的频率词,过滤词和必须词
|
|
|
+在 `frequency_words.txt` 文件中配置监控的关键词,支持三种语法和词组功能。
|
|
|
|
|
|
-### 1. **频率词** - 关键词匹配
|
|
|
+### 📋 基础语法说明
|
|
|
|
|
|
+#### 1. **普通关键词** - 基础匹配
|
|
|
```txt
|
|
|
华为
|
|
|
-任正非
|
|
|
-鸿蒙
|
|
|
+OPPO
|
|
|
+苹果
|
|
|
```
|
|
|
+**作用:** 新闻标题包含其中**任意一个词**就会被捕获
|
|
|
|
|
|
-**作用:** 新闻标题包含其中**任意一个词**就会被捕获
|
|
|
-**举例:**
|
|
|
-
|
|
|
-- ✅ "华为发布新手机" ← 包含"华为"
|
|
|
-- ✅ "任正非接受采访" ← 包含"任正非"
|
|
|
-- ✅ "鸿蒙系统更新" ← 包含"鸿蒙"
|
|
|
-
|
|
|
-### 2. **必须词** `+词汇` - 限定主题
|
|
|
-
|
|
|
+#### 2. **必须词** `+词汇` - 限定范围
|
|
|
```txt
|
|
|
华为
|
|
|
-任正非
|
|
|
+OPPO
|
|
|
+手机
|
|
|
```
|
|
|
+**作用:** 必须同时包含普通词**和**必须词才会被捕获
|
|
|
|
|
|
-**作用:** 除了包含频率词,**还必须包含**`+`开头的词
|
|
|
-**举例:**
|
|
|
-
|
|
|
-- ✅ "华为手机销量第一" ← 有"华为"+有"手机" ✓
|
|
|
-- ❌ "华为汽车计划曝光" ← 有"华为"但没有"手机" ✗
|
|
|
-- ❌ "小米手机新品发布" ← 有"手机"但没有"华为/任正非" ✗
|
|
|
-
|
|
|
-### 3. **过滤词** `!词汇` - 排除干扰
|
|
|
-
|
|
|
+#### 3. **过滤词** `!词汇` - 排除干扰
|
|
|
```txt
|
|
|
-哪吒
|
|
|
-饺子
|
|
|
-!汽车
|
|
|
-!食品
|
|
|
+苹果
|
|
|
+华为
|
|
|
+!水果
|
|
|
+!价格
|
|
|
```
|
|
|
+**作用:** 包含过滤词的新闻会被**直接排除**,即使包含关键词
|
|
|
|
|
|
-**作用:** 标题包含`!`开头的词会被**直接排除**
|
|
|
-**举例:**
|
|
|
-
|
|
|
-- ✅ "导演饺子新电影" ← 有"饺子",没有"汽车/食品" ✓
|
|
|
-- ❌ "哪吒汽车销量增长" ← 有"哪吒"但包含"汽车" ✗
|
|
|
-- ❌ "饺子食品安全检查" ← 有"饺子"但包含"食品" ✗
|
|
|
|
|
|
-## 📝 配置文件示例
|
|
|
+### 🔗 词组功能 - 空行分隔的重要作用
|
|
|
|
|
|
-### frequency_words.txt 完整示例:
|
|
|
+**核心规则:** 用**空行**分隔不同的词组,每个词组独立统计
|
|
|
|
|
|
+#### 示例配置:
|
|
|
```txt
|
|
|
-华为
|
|
|
-任正非
|
|
|
-鸿蒙
|
|
|
-+手机
|
|
|
-
|
|
|
-哪吒
|
|
|
-饺子
|
|
|
-!汽车
|
|
|
-!食品
|
|
|
-
|
|
|
-AI
|
|
|
-人工智能
|
|
|
-+技术
|
|
|
-!绘画
|
|
|
-
|
|
|
-比亚迪
|
|
|
-王传福
|
|
|
-+新能源
|
|
|
-!玩具
|
|
|
-
|
|
|
-苹果
|
|
|
-库克
|
|
|
iPhone
|
|
|
-+科技
|
|
|
-!水果
|
|
|
-!手机壳
|
|
|
+华为
|
|
|
+OPPO
|
|
|
++发布
|
|
|
+
|
|
|
+A股
|
|
|
+上证
|
|
|
+深证
|
|
|
++涨跌
|
|
|
+!预测
|
|
|
+
|
|
|
+世界杯
|
|
|
+欧洲杯
|
|
|
+亚洲杯
|
|
|
++比赛
|
|
|
```
|
|
|
|
|
|
-## 🔍 实际效果演示
|
|
|
-
|
|
|
-### 词组 1:华为相关
|
|
|
+#### 词组解释及匹配效果:
|
|
|
|
|
|
-**配置:** 华为、任正非、鸿蒙 + 必须有"手机"
|
|
|
+**第1组 - 手机新品类:**
|
|
|
+- 关键词:iPhone、华为、OPPO
|
|
|
+- 必须词:发布
|
|
|
+- 效果:必须包含手机品牌名,同时包含"发布"
|
|
|
|
|
|
-```
|
|
|
-✅ "华为手机市场份额领先"
|
|
|
-✅ "任正非谈手机行业发展"
|
|
|
-✅ "鸿蒙手机用户破亿"
|
|
|
-❌ "华为云计算业务增长"(没有"手机")
|
|
|
-❌ "小米手机新品发布"(没有华为相关词)
|
|
|
-```
|
|
|
+**匹配示例:**
|
|
|
+- ✅ "iPhone 15正式发布售价公布" ← 有"iPhone"+"发布"
|
|
|
+- ✅ "华为Mate60系列发布会直播" ← 有"华为"+"发布"
|
|
|
+- ✅ "OPPO Find X7发布时间确定" ← 有"OPPO"+"发布"
|
|
|
+- ❌ "iPhone销量创新高" ← 有"iPhone"但缺少"发布"
|
|
|
|
|
|
-### 词组 2:哪吒相关
|
|
|
|
|
|
-**配置:** 哪吒、饺子 - 排除"汽车"和"食品"
|
|
|
+**第2组 - 股市行情类:**
|
|
|
+- 关键词:A股、上证、深证
|
|
|
+- 必须词:涨跌
|
|
|
+- 过滤词:预测
|
|
|
+- 效果:包含股市相关词,同时包含"涨跌",但排除包含"预测"的内容
|
|
|
|
|
|
-```
|
|
|
-✅ "导演饺子执导新片"
|
|
|
-✅ "哪吒动画获奖"
|
|
|
-❌ "哪吒汽车交付量创新高"(包含过滤词"汽车")
|
|
|
-❌ "速冻饺子食品安全"(包含过滤词"食品")
|
|
|
-```
|
|
|
+**匹配示例:**
|
|
|
+- ✅ "A股今日大幅涨跌分析" ← 有"A股"+"涨跌"
|
|
|
+- ✅ "上证指数涨跌原因解读" ← 有"上证"+"涨跌"
|
|
|
+- ❌ "专家预测A股涨跌趋势" ← 有"A股"+"涨跌"但包含"预测"
|
|
|
+- ❌ "A股成交量创新高" ← 有"A股"但缺少"涨跌"
|
|
|
|
|
|
-### 词组 3:AI 相关
|
|
|
|
|
|
-**配置:** AI、人工智能 + 必须有"技术" - 排除"绘画"
|
|
|
+**第3组 - 足球赛事类:**
|
|
|
+- 关键词:世界杯、欧洲杯、亚洲杯
|
|
|
+- 必须词:比赛
|
|
|
+- 效果:必须包含杯赛名称,同时包含"比赛"
|
|
|
|
|
|
-```
|
|
|
-✅ "AI技术助力医疗诊断"
|
|
|
-✅ "人工智能技术新突破"
|
|
|
-❌ "AI绘画工具走红"(包含过滤词"绘画")
|
|
|
-❌ "AI概念股大涨"(没有"技术")
|
|
|
-```
|
|
|
+**匹配示例:**
|
|
|
+- ✅ "世界杯小组赛比赛结果" ← 有"世界杯"+"比赛"
|
|
|
+- ✅ "欧洲杯决赛比赛时间" ← 有"欧洲杯"+"比赛"
|
|
|
+- ❌ "世界杯门票开售" ← 有"世界杯"但缺少"比赛"
|
|
|
|
|
|
-## 💡 配置技巧
|
|
|
|
|
|
-### 🎯 如何设置词组
|
|
|
+### 🎯 配置技巧
|
|
|
|
|
|
-1. **找准核心词**:先列出最重要的关键词
|
|
|
-2. **加必须词**:用`+`限定话题范围,避免误匹配
|
|
|
-3. **设过滤词**:用`!`排除干扰内容
|
|
|
+#### 1. **从宽到严的配置策略**
|
|
|
+```txt
|
|
|
+# 第一步:先用宽泛关键词测试
|
|
|
+人工智能
|
|
|
+AI
|
|
|
+ChatGPT
|
|
|
|
|
|
-### ✅ 好的配置示例
|
|
|
+# 第二步:发现误匹配后,加入必须词限定
|
|
|
+人工智能
|
|
|
+AI
|
|
|
+ChatGPT
|
|
|
++技术
|
|
|
|
|
|
-```txt
|
|
|
-特斯拉
|
|
|
-马斯克
|
|
|
-+汽车
|
|
|
-!玩具
|
|
|
-!模型
|
|
|
+# 第三步:发现干扰内容后,加入过滤词
|
|
|
+人工智能
|
|
|
+AI
|
|
|
+ChatGPT
|
|
|
++技术
|
|
|
+!广告
|
|
|
+!培训
|
|
|
```
|
|
|
|
|
|
-→ 只要特斯拉/马斯克的汽车新闻,排除玩具车、模型车
|
|
|
-
|
|
|
-### ❌ 不建议的配置示例
|
|
|
|
|
|
+#### 2. **避免过度复杂**
|
|
|
+❌ **不推荐:** 一个词组包含太多词汇
|
|
|
```txt
|
|
|
+华为
|
|
|
+OPPO
|
|
|
苹果
|
|
|
+三星
|
|
|
+vivo
|
|
|
+一加
|
|
|
+魅族
|
|
|
++手机
|
|
|
++发布
|
|
|
++销量
|
|
|
+!假货
|
|
|
+!维修
|
|
|
+!二手
|
|
|
```
|
|
|
|
|
|
-→ 会匹配到"苹果手机"、"苹果价格"(吃的苹果)、"苹果园"等无关内容
|
|
|
-
|
|
|
-## 🔧 使用步骤
|
|
|
-
|
|
|
-1. **创建配置文件**:新建 `frequency_words.txt` 文件
|
|
|
-2. **填写词组**:每个词组用空行分隔
|
|
|
-3. **测试效果**:手动运行 GitHub Actions 查看推送效果
|
|
|
-4. **调整优化**:根据结果增减词汇或调整过滤
|
|
|
-
|
|
|
-## 📊 权重排序说明
|
|
|
-
|
|
|
-配置好的新闻会自动按重要性排序:
|
|
|
+✅ **推荐:** 拆分成多个精确的词组
|
|
|
+```txt
|
|
|
+华为
|
|
|
+OPPO
|
|
|
++新品
|
|
|
|
|
|
-- **排名越高越靠前**(在各平台的排行榜位置)
|
|
|
-- **出现越多越靠前**(在多个平台都有)
|
|
|
-- **稳定性越好越靠前**(经常出现在前几名)
|
|
|
+苹果
|
|
|
+三星
|
|
|
++发布
|
|
|
|
|
|
-这样最重要的新闻总是显示在最前面!
|
|
|
+手机
|
|
|
+销量
|
|
|
++市场
|
|
|
+```
|
|
|
|
|
|
## 📊 输出示例
|
|
|
|
|
|
@@ -508,10 +526,13 @@ ids = [
|
|
|
- 查看程序输出中是否有发送失败的错误信息
|
|
|
- 确认飞书流程配置中的参数结构正确
|
|
|
|
|
|
-3. **想要停止爬虫行为但保留仓库怎么办?**
|
|
|
+3. **想要停止手机接收新闻通知消息?**
|
|
|
+
|
|
|
+ - 将`ENABLE_NOTIFICATION`设置为`False`
|
|
|
+
|
|
|
+4. **想要停止在本地继续生成新闻数据?**
|
|
|
|
|
|
- - 将`CONTINUE_WITHOUT_FEISHU`设置为`False`并删除`FEISHU_WEBHOOK_URL`secret
|
|
|
- - 或修改 GitHub Actions workflow 文件禁用自动执行
|
|
|
+ - 将`ENABLE_CRAWLER`设置为`False`
|
|
|
|
|
|
## 📧 学习交流
|
|
|
|