|
|
11 luni în urmă | |
|---|---|---|
| .github | 1 an în urmă | |
| _image | 11 luni în urmă | |
| LICENSE | 11 luni în urmă | |
| frequency_words.txt | 11 luni în urmă | |
| main.py | 11 luni în urmă | |
| readme.md | 11 luni în urmă | |
| version | 11 luni în urmă |
本项目只是我写文章的副产品...如果项目对你有帮助,请 点击 Star ⭐ 支持我~~有条件的可选择去【硅基茶水间】公众号对应文章下面[点赞][转发][推荐]任选其一就行,我能在后台看到你们的支持,成为老粉就在今天哈哈~在我写文章的萌新阶段雪中送炭,好处大大的有(≧∇≦)ノ
全网热点聚合 - 一站式监控 11 个主流平台(今日头条、百度热搜、微博、抖音、知乎、B 站、财联社等),统一获取多源热点信息,提升信息获取效率
多维度热点分析 - 智能识别话题生命周期,追踪热点从爆发到消退的完整走势,为媒体从业者、市场分析师和信息爱好者提供舆情变化洞察
或者像我一样通过这个工具来反向减少对各种 APP 的使用依赖的
智能内容筛选 - 支持自定义频率词,过滤词和必须词的配置,精准定位关注话题,有效过滤无关信息噪音
多渠道实时推送 - 通过飞书机器人 推送重要资讯或者GitHub Pages 自带的设置页面,一键跳转新闻详情。目前支持企业微信(10 秒配置完毕,设置速度最快,小白都会),飞书(消息显示最友好),钉钉,telegram推送渠道
开箱即用部署 - 一键 Fork 即可部署,简化部署流程和技术门槛
GitHub Pages 自带的设置页面也方便, 配置一下,保存一个网页链接即可,比如我这里TrendRadar 网页版
不定期更新,已 fork 的同学只需要复制本项目 main.py 的所有代码到你的 github 直接覆盖即可(github 在线编辑)
感谢 claude research 整理的各平台 api ,让我快速完成各平台适配(虽然代码更多冗余了~
200 star⭐ 了, 继续给大伙儿助兴~近期,在我的"怂恿"下,挺多人在我公众号点赞分享推荐助力了我,我都在后台看见了具体账号的鼓励数据,很多都成了天使轮老粉(我玩公众号才一个多月,虽然注册是七八年前的事了哈哈,属于上车早,发车晚),但因为你们没有留言或私信我,所以我也无法一一回应并感谢支持,在此一并谢谢!
100 star⭐ 了,写个小功能给大伙儿助助兴 frequency_words.txt 文件增加了一个【必须词】功能,使用 + 号
必须词语法如下:
唐僧或者猪八戒必须在标题里同时出现,才会收录到推送新闻中
+唐僧
+猪八戒
过滤词的优先级更高:
如果标题中过滤词匹配到唐僧念经,那么即使必须词里有唐僧,也不显示
+唐僧
!唐僧念经
优化前
|
优化后
|
目前已支持以下 11 个热门平台:
Fork 本项目到你的 GitHub 账户
设置 GitHub Secrets(选择你需要的平台):
在你 Fork 后的仓库中,进入 Settings > Secrets and variables > Actions,然后根据需要配置以下任一或多个通知平台:
### 🟡 企业微信机器人(配置最简单最迅速)
WEWORK_WEBHOOK_URL### 🟢 飞书机器人(消息显示最友好)
FEISHU_WEBHOOK_URL### 🔵 钉钉机器人
DINGTALK_WEBHOOK_URL### 🟣 Telegram Bot (配置最复杂)
TELEGRAM_BOT_TOKENTELEGRAM_CHAT_ID注意: 可以同时配置多个平台,系统会向所有配置的平台发送通知。具体设置方法请参考下方对应的机器人设置教程。
自定义关键词:
frequency_words.txt文件,添加你需要监控的频率词,过滤词,必须词自动运行:
.github/workflows/crawler.yml配置文件,默认每 50 分钟自动运行一次查看结果:
output目录中配置到 GitHub:将获得的 Webhook URL 配置到 GitHub Secrets 中的 WEWORK_WEBHOOK_URL
点击"新建机器人应用"
进入创建的应用后,点击"流程涉及" > "创建流程" > "选择触发器"
往下滑动,点击"Webhook 触发"
此时你会看到"Webhook 地址",把这个链接先复制到本地记事本暂存,继续接下来的操作
"参数"里面放上下面的内容,然后点击"完成"
{
"message_type": "text",
"content": {
"total_titles": "{{内容}}",
"timestamp": "{{内容}}",
"report_type": "{{内容}}",
"text": "{{内容}}"
}
}
点击"选择操作" > "发送飞书消息" ,勾选 "群消息", 然后点击下面的输入框,点击"我管理的群组"(如果没有群组,你可以在飞书 app 上创建群组)
消息标题填写"TrendRadar 热点监控"
最关键的部分来了,点击 + 按钮,选择"Webhook 触发",然后按照下面的图片摆放
FEISHU_WEBHOOK_URL创建机器人(仅 PC 端支持):
配置机器人:
完成设置:
DINGTALK_WEBHOOK_URL注意:移动端只能接收消息,无法创建新机器人。
创建机器人:
@BotFather(大小写注意,有蓝色徽章勾勾,有类似 37849827 monthly users ,这个才是官方的,有一些仿官方的账号注意辨别)/newbot 命令创建新机器人123456789:AAHfiqksKZ8WmR2zSjiQ7_v4TMAKdiHm9T0)获取 Chat ID:
方法一:通过官方 API 获取
https://api.telegram.org/bot<你的Bot Token>/getUpdates"chat":{"id":数字} 中的数字方法二:使用第三方工具
@userinfobot 并发送 /startTELEGRAM_BOT_TOKEN:填入第 1 步获得的 Bot TokenTELEGRAM_CHAT_ID:填入第 2 步获得的 Chat ID在frequency_words.txt文件中配置监控的频率词,过滤词和必须词
华为
任正非
鸿蒙
作用: 新闻标题包含其中任意一个词就会被捕获
举例:
+词汇 - 限定主题华为
任正非
+手机
作用: 除了包含频率词,还必须包含+开头的词
举例:
!词汇 - 排除干扰哪吒
饺子
!汽车
!食品
作用: 标题包含!开头的词会被直接排除
举例:
华为
任正非
鸿蒙
+手机
哪吒
饺子
!汽车
!食品
AI
人工智能
+技术
!绘画
比亚迪
王传福
+新能源
!玩具
苹果
库克
iPhone
+科技
!水果
!手机壳
配置: 华为、任正非、鸿蒙 + 必须有"手机"
✅ "华为手机市场份额领先"
✅ "任正非谈手机行业发展"
✅ "鸿蒙手机用户破亿"
❌ "华为云计算业务增长"(没有"手机")
❌ "小米手机新品发布"(没有华为相关词)
配置: 哪吒、饺子 - 排除"汽车"和"食品"
✅ "导演饺子执导新片"
✅ "哪吒动画获奖"
❌ "哪吒汽车交付量创新高"(包含过滤词"汽车")
❌ "速冻饺子食品安全"(包含过滤词"食品")
配置: AI、人工智能 + 必须有"技术" - 排除"绘画"
✅ "AI技术助力医疗诊断"
✅ "人工智能技术新突破"
❌ "AI绘画工具走红"(包含过滤词"绘画")
❌ "AI概念股大涨"(没有"技术")
+限定话题范围,避免误匹配!排除干扰内容特斯拉
马斯克
+汽车
!玩具
!模型
→ 只要特斯拉/马斯克的汽车新闻,排除玩具车、模型车
苹果
→ 会匹配到"苹果手机"、"苹果价格"(吃的苹果)、"苹果园"等无关内容
frequency_words.txt 文件配置好的新闻会自动按重要性排序:
这样最重要的新闻总是显示在最前面!
📊 热点词汇统计
🔥 人工智能 AI : 12 条
1. [百度热搜] 科技巨头发布新AI模型 [1] - 12时30分 (4次)
2. [今日头条] AI技术最新突破 [2] - [13时15分 ~ 14时30分] (2次)
| 格式元素 | 示例 | 含义 | 说明 |
|---|---|---|---|
| 关键词 | 人工智能 AI | 频率词组 | 表示本组匹配的关键词 |
| : N 条 | : 12 条 | 匹配数量 | 该关键词组匹配的标题总数 |
| [平台名] | [百度热搜] | 来源平台 | 标题所属的平台名称 |
| [数字] | [1] | 高排名标记 | 排名 ≤ 阈值(默认 5)的热搜,红色加粗显示 |
| [数字] | [7] | 普通排名标记 | 排名>阈值的热搜,普通显示 |
| - 时间 | - 12 时 30 分 | 首次发现时间 | 标题首次被发现的时间 |
| [时间 ~ 时间] | [12 时 30 分 ~ 14 时 00 分] | 时间范围 | 标题出现的时间范围(首次~最后) |
| (N 次) | (4 次) | 出现次数 | 标题在监控期间出现的总次数 |
如果想支持更多平台或者不想看某些平台,可以访问 newsnow 的源代码:https://github.com/ourongxing/newsnow/tree/main/server/sources ,根据里面的文件名自己来修改 main.py 中的下面代码:
ids = [
("toutiao", "今日头条"),
("baidu", "百度热搜"),
("wallstreetcn-hot", "华尔街见闻"),
("thepaper", "澎湃新闻"),
("bilibili-hot-search", "bilibili 热搜"),
("cls-hot", "财联社热门"),
("ifeng", "凤凰网"),
"tieba",
"weibo",
"douyin",
"zhihu",
]
GitHub Actions 不执行怎么办?
.github/workflows/crawler.yml文件是否存在没有收到飞书通知怎么办?
FEISHU_WEBHOOK_URL是否正确设置(环境变量或 CONFIG 中)想要停止爬虫行为但保留仓库怎么办?
CONTINUE_WITHOUT_FEISHU设置为False并删除FEISHU_WEBHOOK_URLsecret扫码关注微信公众号,里面有文章是讲我写的这些项目的,咳如果对你有了点帮助,献上【点赞,转发,推荐】三连,就算支持了俺这个作者的开发了,顺便也可以反馈使用问题:
本项目使用了 newsnow 提供的 API 服务,感谢其提供的数据支持。
GPL-3.0 License