server.py 27 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591592593594595596597598599600601602603604605606607608609610611612613614615616617618619620621622623624625626627628629630631632633634635636637638639640641642643644645646647648649650651652653654655656657658659660661662663664665666667668669670671672673674675676677678679680681682683684685686687688689690691692693694695696
  1. """
  2. TrendRadar MCP Server - FastMCP 2.0 实现
  3. 使用 FastMCP 2.0 提供生产级 MCP 工具服务器。
  4. 支持 stdio 和 HTTP 两种传输模式。
  5. """
  6. import json
  7. from typing import List, Optional, Dict
  8. from fastmcp import FastMCP
  9. from .tools.data_query import DataQueryTools
  10. from .tools.analytics import AnalyticsTools
  11. from .tools.search_tools import SearchTools
  12. from .tools.config_mgmt import ConfigManagementTools
  13. from .tools.system import SystemManagementTools
  14. # 创建 FastMCP 2.0 应用
  15. mcp = FastMCP('trendradar-news')
  16. # 全局工具实例(在第一次请求时初始化)
  17. _tools_instances = {}
  18. def _get_tools(project_root: Optional[str] = None):
  19. """获取或创建工具实例(单例模式)"""
  20. if not _tools_instances:
  21. _tools_instances['data'] = DataQueryTools(project_root)
  22. _tools_instances['analytics'] = AnalyticsTools(project_root)
  23. _tools_instances['search'] = SearchTools(project_root)
  24. _tools_instances['config'] = ConfigManagementTools(project_root)
  25. _tools_instances['system'] = SystemManagementTools(project_root)
  26. return _tools_instances
  27. # ==================== 数据查询工具 ====================
  28. @mcp.tool
  29. async def get_latest_news(
  30. platforms: Optional[List[str]] = None,
  31. limit: int = 50,
  32. include_url: bool = False
  33. ) -> str:
  34. """
  35. 获取最新一批爬取的新闻数据,快速了解当前热点
  36. Args:
  37. platforms: 平台ID列表,如 ['zhihu', 'weibo', 'douyin']
  38. - 不指定时:使用 config.yaml 中配置的所有平台
  39. - 支持的平台来自 config/config.yaml 的 platforms 配置
  40. - 每个平台都有对应的name字段(如"知乎"、"微博"),方便AI识别
  41. limit: 返回条数限制,默认50,最大1000
  42. 注意:实际返回数量可能少于请求值,取决于当前可用的新闻总数
  43. include_url: 是否包含URL链接,默认False(节省token)
  44. Returns:
  45. JSON格式的新闻列表
  46. **重要:数据展示建议**
  47. 本工具会返回完整的新闻列表(通常50条)给你。但请注意:
  48. - **工具返回**:完整的50条数据 ✅
  49. - **建议展示**:向用户展示全部数据,除非用户明确要求总结
  50. - **用户期望**:用户可能需要完整数据,请谨慎总结
  51. **何时可以总结**:
  52. - 用户明确说"给我总结一下"或"挑重点说"
  53. - 数据量超过100条时,可先展示部分并询问是否查看全部
  54. **注意**:如果用户询问"为什么只显示了部分",说明他们需要完整数据
  55. """
  56. tools = _get_tools()
  57. result = tools['data'].get_latest_news(platforms=platforms, limit=limit, include_url=include_url)
  58. return json.dumps(result, ensure_ascii=False, indent=2)
  59. @mcp.tool
  60. async def get_trending_topics(
  61. top_n: int = 10,
  62. mode: str = 'current'
  63. ) -> str:
  64. """
  65. 获取个人关注词的新闻出现频率统计(基于 config/frequency_words.txt)
  66. 注意:本工具不是自动提取新闻热点,而是统计你在 config/frequency_words.txt 中
  67. 设置的个人关注词在新闻中出现的频率。你可以自定义这个关注词列表。
  68. Args:
  69. top_n: 返回TOP N关注词,默认10
  70. mode: 模式选择
  71. - daily: 当日累计数据统计
  72. - current: 最新一批数据统计(默认)
  73. Returns:
  74. JSON格式的关注词频率统计列表
  75. """
  76. tools = _get_tools()
  77. result = tools['data'].get_trending_topics(top_n=top_n, mode=mode)
  78. return json.dumps(result, ensure_ascii=False, indent=2)
  79. @mcp.tool
  80. async def get_news_by_date(
  81. date_query: Optional[str] = None,
  82. platforms: Optional[List[str]] = None,
  83. limit: int = 50,
  84. include_url: bool = False
  85. ) -> str:
  86. """
  87. 获取指定日期的新闻数据,用于历史数据分析和对比
  88. Args:
  89. date_query: 日期查询,可选格式:
  90. - 自然语言: "今天", "昨天", "前天", "3天前"
  91. - 标准日期: "2024-01-15", "2024/01/15"
  92. - 默认值: "今天"(节省token)
  93. platforms: 平台ID列表,如 ['zhihu', 'weibo', 'douyin']
  94. - 不指定时:使用 config.yaml 中配置的所有平台
  95. - 支持的平台来自 config/config.yaml 的 platforms 配置
  96. - 每个平台都有对应的name字段(如"知乎"、"微博"),方便AI识别
  97. limit: 返回条数限制,默认50,最大1000
  98. 注意:实际返回数量可能少于请求值,取决于指定日期的新闻总数
  99. include_url: 是否包含URL链接,默认False(节省token)
  100. Returns:
  101. JSON格式的新闻列表,包含标题、平台、排名等信息
  102. **重要:数据展示建议**
  103. 本工具会返回完整的新闻列表(通常50条)给你。但请注意:
  104. - **工具返回**:完整的50条数据 ✅
  105. - **建议展示**:向用户展示全部数据,除非用户明确要求总结
  106. - **用户期望**:用户可能需要完整数据,请谨慎总结
  107. **何时可以总结**:
  108. - 用户明确说"给我总结一下"或"挑重点说"
  109. - 数据量超过100条时,可先展示部分并询问是否查看全部
  110. **注意**:如果用户询问"为什么只显示了部分",说明他们需要完整数据
  111. """
  112. tools = _get_tools()
  113. result = tools['data'].get_news_by_date(
  114. date_query=date_query,
  115. platforms=platforms,
  116. limit=limit,
  117. include_url=include_url
  118. )
  119. return json.dumps(result, ensure_ascii=False, indent=2)
  120. # ==================== 高级数据分析工具 ====================
  121. @mcp.tool
  122. async def analyze_topic_trend(
  123. topic: str,
  124. analysis_type: str = "trend",
  125. date_range: Optional[Dict[str, str]] = None,
  126. granularity: str = "day",
  127. threshold: float = 3.0,
  128. time_window: int = 24,
  129. lookahead_hours: int = 6,
  130. confidence_threshold: float = 0.7
  131. ) -> str:
  132. """
  133. 统一话题趋势分析工具 - 整合多种趋势分析模式
  134. Args:
  135. topic: 话题关键词(必需)
  136. analysis_type: 分析类型,可选值:
  137. - "trend": 热度趋势分析(追踪话题的热度变化)
  138. - "lifecycle": 生命周期分析(从出现到消失的完整周期)
  139. - "viral": 异常热度检测(识别突然爆火的话题)
  140. - "predict": 话题预测(预测未来可能的热点)
  141. date_range: 日期范围(trend和lifecycle模式),可选
  142. - **格式**: {"start": "YYYY-MM-DD", "end": "YYYY-MM-DD"}(必须是标准日期格式)
  143. - **说明**: AI必须根据当前日期自动计算并填入具体日期,不能使用"今天"等自然语言
  144. - **计算示例**:
  145. - 用户说"最近7天" → AI计算: {"start": "2025-11-11", "end": "2025-11-17"}(假设今天是11-17)
  146. - 用户说"上周" → AI计算: {"start": "2025-11-11", "end": "2025-11-17"}(上周一到上周日)
  147. - 用户说"本月" → AI计算: {"start": "2025-11-01", "end": "2025-11-17"}(11月1日到今天)
  148. - **默认**: 不指定时默认分析最近7天
  149. granularity: 时间粒度(trend模式),默认"day"(仅支持 day,因为底层数据按天聚合)
  150. threshold: 热度突增倍数阈值(viral模式),默认3.0
  151. time_window: 检测时间窗口小时数(viral模式),默认24
  152. lookahead_hours: 预测未来小时数(predict模式),默认6
  153. confidence_threshold: 置信度阈值(predict模式),默认0.7
  154. Returns:
  155. JSON格式的趋势分析结果
  156. **AI使用说明:**
  157. 当用户使用相对时间表达时(如"最近7天"、"过去一周"、"上个月"),
  158. AI必须根据当前日期(从环境 <env> 获取)计算出具体的 YYYY-MM-DD 格式日期。
  159. **重要**:date_range 不接受"今天"、"昨天"等自然语言,必须是 YYYY-MM-DD 格式!
  160. Examples (假设今天是 2025-11-17):
  161. - 用户:"分析AI最近7天的趋势"
  162. → analyze_topic_trend(topic="人工智能", analysis_type="trend", date_range={"start": "2025-11-11", "end": "2025-11-17"})
  163. - 用户:"看看特斯拉本月的热度"
  164. → analyze_topic_trend(topic="特斯拉", analysis_type="lifecycle", date_range={"start": "2025-11-01", "end": "2025-11-17"})
  165. - analyze_topic_trend(topic="比特币", analysis_type="viral", threshold=3.0)
  166. - analyze_topic_trend(topic="ChatGPT", analysis_type="predict", lookahead_hours=6)
  167. """
  168. tools = _get_tools()
  169. result = tools['analytics'].analyze_topic_trend_unified(
  170. topic=topic,
  171. analysis_type=analysis_type,
  172. date_range=date_range,
  173. granularity=granularity,
  174. threshold=threshold,
  175. time_window=time_window,
  176. lookahead_hours=lookahead_hours,
  177. confidence_threshold=confidence_threshold
  178. )
  179. return json.dumps(result, ensure_ascii=False, indent=2)
  180. @mcp.tool
  181. async def analyze_data_insights(
  182. insight_type: str = "platform_compare",
  183. topic: Optional[str] = None,
  184. date_range: Optional[Dict[str, str]] = None,
  185. min_frequency: int = 3,
  186. top_n: int = 20
  187. ) -> str:
  188. """
  189. 统一数据洞察分析工具 - 整合多种数据分析模式
  190. Args:
  191. insight_type: 洞察类型,可选值:
  192. - "platform_compare": 平台对比分析(对比不同平台对话题的关注度)
  193. - "platform_activity": 平台活跃度统计(统计各平台发布频率和活跃时间)
  194. - "keyword_cooccur": 关键词共现分析(分析关键词同时出现的模式)
  195. topic: 话题关键词(可选,platform_compare模式适用)
  196. date_range: **【对象类型】** 日期范围(可选)
  197. - **格式**: {"start": "YYYY-MM-DD", "end": "YYYY-MM-DD"}
  198. - **示例**: {"start": "2025-01-01", "end": "2025-01-07"}
  199. - **重要**: 必须是对象格式,不能传递整数
  200. min_frequency: 最小共现频次(keyword_cooccur模式),默认3
  201. top_n: 返回TOP N结果(keyword_cooccur模式),默认20
  202. Returns:
  203. JSON格式的数据洞察分析结果
  204. Examples:
  205. - analyze_data_insights(insight_type="platform_compare", topic="人工智能")
  206. - analyze_data_insights(insight_type="platform_activity", date_range={"start": "2025-01-01", "end": "2025-01-07"})
  207. - analyze_data_insights(insight_type="keyword_cooccur", min_frequency=5, top_n=15)
  208. """
  209. tools = _get_tools()
  210. result = tools['analytics'].analyze_data_insights_unified(
  211. insight_type=insight_type,
  212. topic=topic,
  213. date_range=date_range,
  214. min_frequency=min_frequency,
  215. top_n=top_n
  216. )
  217. return json.dumps(result, ensure_ascii=False, indent=2)
  218. @mcp.tool
  219. async def analyze_sentiment(
  220. topic: Optional[str] = None,
  221. platforms: Optional[List[str]] = None,
  222. date_range: Optional[Dict[str, str]] = None,
  223. limit: int = 50,
  224. sort_by_weight: bool = True,
  225. include_url: bool = False
  226. ) -> str:
  227. """
  228. 分析新闻的情感倾向和热度趋势
  229. Args:
  230. topic: 话题关键词(可选)
  231. platforms: 平台ID列表,如 ['zhihu', 'weibo', 'douyin']
  232. - 不指定时:使用 config.yaml 中配置的所有平台
  233. - 支持的平台来自 config/config.yaml 的 platforms 配置
  234. - 每个平台都有对应的name字段(如"知乎"、"微博"),方便AI识别
  235. date_range: **【对象类型】** 日期范围(可选)
  236. - **格式**: {"start": "YYYY-MM-DD", "end": "YYYY-MM-DD"}
  237. - **示例**: {"start": "2025-01-01", "end": "2025-01-07"}
  238. - **重要**: 必须是对象格式,不能传递整数
  239. limit: 返回新闻数量,默认50,最大100
  240. 注意:本工具会对新闻标题进行去重(同一标题在不同平台只保留一次),
  241. 因此实际返回数量可能少于请求的 limit 值
  242. sort_by_weight: 是否按热度权重排序,默认True
  243. include_url: 是否包含URL链接,默认False(节省token)
  244. Returns:
  245. JSON格式的分析结果,包含情感分布、热度趋势和相关新闻
  246. **重要:数据展示策略**
  247. - 本工具返回完整的分析结果和新闻列表
  248. - **默认展示方式**:展示完整的分析结果(包括所有新闻)
  249. - 仅在用户明确要求"总结"或"挑重点"时才进行筛选
  250. """
  251. tools = _get_tools()
  252. result = tools['analytics'].analyze_sentiment(
  253. topic=topic,
  254. platforms=platforms,
  255. date_range=date_range,
  256. limit=limit,
  257. sort_by_weight=sort_by_weight,
  258. include_url=include_url
  259. )
  260. return json.dumps(result, ensure_ascii=False, indent=2)
  261. @mcp.tool
  262. async def find_similar_news(
  263. reference_title: str,
  264. threshold: float = 0.6,
  265. limit: int = 50,
  266. include_url: bool = False
  267. ) -> str:
  268. """
  269. 查找与指定新闻标题相似的其他新闻
  270. Args:
  271. reference_title: 新闻标题(完整或部分)
  272. threshold: 相似度阈值,0-1之间,默认0.6
  273. 注意:阈值越高匹配越严格,返回结果越少
  274. limit: 返回条数限制,默认50,最大100
  275. 注意:实际返回数量取决于相似度匹配结果,可能少于请求值
  276. include_url: 是否包含URL链接,默认False(节省token)
  277. Returns:
  278. JSON格式的相似新闻列表,包含相似度分数
  279. **重要:数据展示策略**
  280. - 本工具返回完整的相似新闻列表
  281. - **默认展示方式**:展示全部返回的新闻(包括相似度分数)
  282. - 仅在用户明确要求"总结"或"挑重点"时才进行筛选
  283. """
  284. tools = _get_tools()
  285. result = tools['analytics'].find_similar_news(
  286. reference_title=reference_title,
  287. threshold=threshold,
  288. limit=limit,
  289. include_url=include_url
  290. )
  291. return json.dumps(result, ensure_ascii=False, indent=2)
  292. @mcp.tool
  293. async def generate_summary_report(
  294. report_type: str = "daily",
  295. date_range: Optional[Dict[str, str]] = None
  296. ) -> str:
  297. """
  298. 每日/每周摘要生成器 - 自动生成热点摘要报告
  299. Args:
  300. report_type: 报告类型(daily/weekly)
  301. date_range: **【对象类型】** 自定义日期范围(可选)
  302. - **格式**: {"start": "YYYY-MM-DD", "end": "YYYY-MM-DD"}
  303. - **示例**: {"start": "2025-01-01", "end": "2025-01-07"}
  304. - **重要**: 必须是对象格式,不能传递整数
  305. Returns:
  306. JSON格式的摘要报告,包含Markdown格式内容
  307. """
  308. tools = _get_tools()
  309. result = tools['analytics'].generate_summary_report(
  310. report_type=report_type,
  311. date_range=date_range
  312. )
  313. return json.dumps(result, ensure_ascii=False, indent=2)
  314. # ==================== 智能检索工具 ====================
  315. @mcp.tool
  316. async def search_news(
  317. query: str,
  318. search_mode: str = "keyword",
  319. date_range: Optional[Dict[str, str]] = None,
  320. platforms: Optional[List[str]] = None,
  321. limit: int = 50,
  322. sort_by: str = "relevance",
  323. threshold: float = 0.6,
  324. include_url: bool = False
  325. ) -> str:
  326. """
  327. 统一搜索接口,支持多种搜索模式
  328. Args:
  329. query: 搜索关键词或内容片段
  330. search_mode: 搜索模式,可选值:
  331. - "keyword": 精确关键词匹配(默认,适合搜索特定话题)
  332. - "fuzzy": 模糊内容匹配(适合搜索内容片段,会过滤相似度低于阈值的结果)
  333. - "entity": 实体名称搜索(适合搜索人物/地点/机构)
  334. date_range: 日期范围(可选)
  335. - **格式**: {"start": "YYYY-MM-DD", "end": "YYYY-MM-DD"}
  336. - **示例**: {"start": "2025-01-01", "end": "2025-01-07"}
  337. - **说明**: AI需要根据用户的自然语言(如"最近7天")自动计算日期范围
  338. - **默认**: 不指定时默认查询今天的新闻
  339. - **注意**: start和end可以相同(表示单日查询)
  340. platforms: 平台ID列表,如 ['zhihu', 'weibo', 'douyin']
  341. - 不指定时:使用 config.yaml 中配置的所有平台
  342. - 支持的平台来自 config/config.yaml 的 platforms 配置
  343. - 每个平台都有对应的name字段(如"知乎"、"微博"),方便AI识别
  344. limit: 返回条数限制,默认50,最大1000
  345. 注意:实际返回数量取决于搜索匹配结果(特别是 fuzzy 模式下会过滤低相似度结果)
  346. sort_by: 排序方式,可选值:
  347. - "relevance": 按相关度排序(默认)
  348. - "weight": 按新闻权重排序
  349. - "date": 按日期排序
  350. threshold: 相似度阈值(仅fuzzy模式有效),0-1之间,默认0.6
  351. 注意:阈值越高匹配越严格,返回结果越少
  352. include_url: 是否包含URL链接,默认False(节省token)
  353. Returns:
  354. JSON格式的搜索结果,包含标题、平台、排名等信息
  355. **重要:数据展示策略**
  356. - 本工具返回完整的搜索结果列表
  357. - **默认展示方式**:展示全部返回的新闻,无需总结或筛选
  358. - 仅在用户明确要求"总结"或"挑重点"时才进行筛选
  359. **AI使用说明:**
  360. 当用户使用相对时间表达时(如"最近7天"、"过去一周"、"最近半个月"),
  361. AI必须根据当前日期(从环境 <env> 获取)计算出具体的 YYYY-MM-DD 格式日期。
  362. **重要**:date_range 不接受"今天"、"昨天"等自然语言,必须是 YYYY-MM-DD 格式!
  363. **计算规则**(假设从 <env> 获取今天是 2025-11-17):
  364. - "今天" → 不传 date_range(默认查今天)
  365. - "最近7天" → {"start": "2025-11-11", "end": "2025-11-17"}
  366. - "过去一周" → {"start": "2025-11-11", "end": "2025-11-17"}
  367. - "上周" → 计算上周一到上周日,如 {"start": "2025-11-11", "end": "2025-11-17"}
  368. - "本月" → {"start": "2025-11-01", "end": "2025-11-17"}
  369. - "最近30天" → {"start": "2025-10-19", "end": "2025-11-17"}
  370. Examples (假设今天是 2025-11-17):
  371. - 用户:"今天的AI新闻" → search_news(query="人工智能")
  372. - 用户:"最近7天的AI新闻" → search_news(query="人工智能", date_range={"start": "2025-11-11", "end": "2025-11-17"})
  373. - 精确日期: search_news(query="人工智能", date_range={"start": "2025-01-01", "end": "2025-01-07"})
  374. - 模糊搜索: search_news(query="特斯拉降价", search_mode="fuzzy", threshold=0.4)
  375. """
  376. tools = _get_tools()
  377. result = tools['search'].search_news_unified(
  378. query=query,
  379. search_mode=search_mode,
  380. date_range=date_range,
  381. platforms=platforms,
  382. limit=limit,
  383. sort_by=sort_by,
  384. threshold=threshold,
  385. include_url=include_url
  386. )
  387. return json.dumps(result, ensure_ascii=False, indent=2)
  388. @mcp.tool
  389. async def search_related_news_history(
  390. reference_text: str,
  391. time_preset: str = "yesterday",
  392. threshold: float = 0.4,
  393. limit: int = 50,
  394. include_url: bool = False
  395. ) -> str:
  396. """
  397. 基于种子新闻,在历史数据中搜索相关新闻
  398. Args:
  399. reference_text: 参考新闻标题(完整或部分)
  400. time_preset: 时间范围预设值,可选:
  401. - "yesterday": 昨天
  402. - "last_week": 上周 (7天)
  403. - "last_month": 上个月 (30天)
  404. - "custom": 自定义日期范围(需要提供 start_date 和 end_date)
  405. threshold: 相关性阈值,0-1之间,默认0.4
  406. 注意:综合相似度计算(70%关键词重合 + 30%文本相似度)
  407. 阈值越高匹配越严格,返回结果越少
  408. limit: 返回条数限制,默认50,最大100
  409. 注意:实际返回数量取决于相关性匹配结果,可能少于请求值
  410. include_url: 是否包含URL链接,默认False(节省token)
  411. Returns:
  412. JSON格式的相关新闻列表,包含相关性分数和时间分布
  413. **重要:数据展示策略**
  414. - 本工具返回完整的相关新闻列表
  415. - **默认展示方式**:展示全部返回的新闻(包括相关性分数)
  416. - 仅在用户明确要求"总结"或"挑重点"时才进行筛选
  417. """
  418. tools = _get_tools()
  419. result = tools['search'].search_related_news_history(
  420. reference_text=reference_text,
  421. time_preset=time_preset,
  422. threshold=threshold,
  423. limit=limit,
  424. include_url=include_url
  425. )
  426. return json.dumps(result, ensure_ascii=False, indent=2)
  427. # ==================== 配置与系统管理工具 ====================
  428. @mcp.tool
  429. async def get_current_config(
  430. section: str = "all"
  431. ) -> str:
  432. """
  433. 获取当前系统配置
  434. Args:
  435. section: 配置节,可选值:
  436. - "all": 所有配置(默认)
  437. - "crawler": 爬虫配置
  438. - "push": 推送配置
  439. - "keywords": 关键词配置
  440. - "weights": 权重配置
  441. Returns:
  442. JSON格式的配置信息
  443. """
  444. tools = _get_tools()
  445. result = tools['config'].get_current_config(section=section)
  446. return json.dumps(result, ensure_ascii=False, indent=2)
  447. @mcp.tool
  448. async def get_system_status() -> str:
  449. """
  450. 获取系统运行状态和健康检查信息
  451. 返回系统版本、数据统计、缓存状态等信息
  452. Returns:
  453. JSON格式的系统状态信息
  454. """
  455. tools = _get_tools()
  456. result = tools['system'].get_system_status()
  457. return json.dumps(result, ensure_ascii=False, indent=2)
  458. @mcp.tool
  459. async def trigger_crawl(
  460. platforms: Optional[List[str]] = None,
  461. save_to_local: bool = False,
  462. include_url: bool = False
  463. ) -> str:
  464. """
  465. 手动触发一次爬取任务(可选持久化)
  466. Args:
  467. platforms: 指定平台ID列表,如 ['zhihu', 'weibo', 'douyin']
  468. - 不指定时:使用 config.yaml 中配置的所有平台
  469. - 支持的平台来自 config/config.yaml 的 platforms 配置
  470. - 每个平台都有对应的name字段(如"知乎"、"微博"),方便AI识别
  471. - 注意:失败的平台会在返回结果的 failed_platforms 字段中列出
  472. save_to_local: 是否保存到本地 output 目录,默认 False
  473. include_url: 是否包含URL链接,默认False(节省token)
  474. Returns:
  475. JSON格式的任务状态信息,包含:
  476. - platforms: 成功爬取的平台列表
  477. - failed_platforms: 失败的平台列表(如有)
  478. - total_news: 爬取的新闻总数
  479. - data: 新闻数据
  480. Examples:
  481. - 临时爬取: trigger_crawl(platforms=['zhihu'])
  482. - 爬取并保存: trigger_crawl(platforms=['weibo'], save_to_local=True)
  483. - 使用默认平台: trigger_crawl() # 爬取config.yaml中配置的所有平台
  484. """
  485. tools = _get_tools()
  486. result = tools['system'].trigger_crawl(platforms=platforms, save_to_local=save_to_local, include_url=include_url)
  487. return json.dumps(result, ensure_ascii=False, indent=2)
  488. # ==================== 启动入口 ====================
  489. def run_server(
  490. project_root: Optional[str] = None,
  491. transport: str = 'stdio',
  492. host: str = '0.0.0.0',
  493. port: int = 3333
  494. ):
  495. """
  496. 启动 MCP 服务器
  497. Args:
  498. project_root: 项目根目录路径
  499. transport: 传输模式,'stdio' 或 'http'
  500. host: HTTP模式的监听地址,默认 0.0.0.0
  501. port: HTTP模式的监听端口,默认 3333
  502. """
  503. # 初始化工具实例
  504. _get_tools(project_root)
  505. # 打印启动信息
  506. print()
  507. print("=" * 60)
  508. print(" TrendRadar MCP Server - FastMCP 2.0")
  509. print("=" * 60)
  510. print(f" 传输模式: {transport.upper()}")
  511. if transport == 'stdio':
  512. print(" 协议: MCP over stdio (标准输入输出)")
  513. print(" 说明: 通过标准输入输出与 MCP 客户端通信")
  514. elif transport == 'http':
  515. print(f" 监听地址: http://{host}:{port}")
  516. print(f" HTTP端点: http://{host}:{port}/mcp")
  517. print(" 协议: MCP over HTTP (生产环境)")
  518. if project_root:
  519. print(f" 项目目录: {project_root}")
  520. else:
  521. print(" 项目目录: 当前目录")
  522. print()
  523. print(" 已注册的工具:")
  524. print(" === 基础数据查询(P0核心)===")
  525. print(" 1. get_latest_news - 获取最新新闻")
  526. print(" 2. get_news_by_date - 按日期查询新闻(支持自然语言)")
  527. print(" 3. get_trending_topics - 获取趋势话题")
  528. print()
  529. print(" === 智能检索工具 ===")
  530. print(" 4. search_news - 统一新闻搜索(关键词/模糊/实体)")
  531. print(" 5. search_related_news_history - 历史相关新闻检索")
  532. print()
  533. print(" === 高级数据分析 ===")
  534. print(" 6. analyze_topic_trend - 统一话题趋势分析(热度/生命周期/爆火/预测)")
  535. print(" 7. analyze_data_insights - 统一数据洞察分析(平台对比/活跃度/关键词共现)")
  536. print(" 8. analyze_sentiment - 情感倾向分析")
  537. print(" 9. find_similar_news - 相似新闻查找")
  538. print(" 10. generate_summary_report - 每日/每周摘要生成")
  539. print()
  540. print(" === 配置与系统管理 ===")
  541. print(" 11. get_current_config - 获取当前系统配置")
  542. print(" 12. get_system_status - 获取系统运行状态")
  543. print(" 13. trigger_crawl - 手动触发爬取任务")
  544. print("=" * 60)
  545. print()
  546. # 根据传输模式运行服务器
  547. if transport == 'stdio':
  548. mcp.run(transport='stdio')
  549. elif transport == 'http':
  550. # HTTP 模式(生产推荐)
  551. mcp.run(
  552. transport='http',
  553. host=host,
  554. port=port,
  555. path='/mcp' # HTTP 端点路径
  556. )
  557. else:
  558. raise ValueError(f"不支持的传输模式: {transport}")
  559. if __name__ == '__main__':
  560. import argparse
  561. parser = argparse.ArgumentParser(
  562. description='TrendRadar MCP Server - 新闻热点聚合 MCP 工具服务器',
  563. formatter_class=argparse.RawDescriptionHelpFormatter,
  564. epilog="""
  565. 详细配置教程请查看: README-Cherry-Studio.md
  566. """
  567. )
  568. parser.add_argument(
  569. '--transport',
  570. choices=['stdio', 'http'],
  571. default='stdio',
  572. help='传输模式:stdio (默认) 或 http (生产环境)'
  573. )
  574. parser.add_argument(
  575. '--host',
  576. default='0.0.0.0',
  577. help='HTTP模式的监听地址,默认 0.0.0.0'
  578. )
  579. parser.add_argument(
  580. '--port',
  581. type=int,
  582. default=3333,
  583. help='HTTP模式的监听端口,默认 3333'
  584. )
  585. parser.add_argument(
  586. '--project-root',
  587. help='项目根目录路径'
  588. )
  589. args = parser.parse_args()
  590. run_server(
  591. project_root=args.project_root,
  592. transport=args.transport,
  593. host=args.host,
  594. port=args.port
  595. )