formatters.py 2.1 KB

1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980
  1. # coding=utf-8
  2. """
  3. 通知内容格式转换模块
  4. 提供不同推送平台间的格式转换功能
  5. """
  6. import re
  7. def strip_markdown(text: str) -> str:
  8. """去除文本中的 markdown 语法格式,用于个人微信推送
  9. Args:
  10. text: 包含 markdown 格式的文本
  11. Returns:
  12. 纯文本内容
  13. """
  14. # 去除粗体 **text** 或 __text__
  15. text = re.sub(r'\*\*(.+?)\*\*', r'\1', text)
  16. text = re.sub(r'__(.+?)__', r'\1', text)
  17. # 去除斜体 *text* 或 _text_
  18. text = re.sub(r'\*(.+?)\*', r'\1', text)
  19. text = re.sub(r'_(.+?)_', r'\1', text)
  20. # 去除删除线 ~~text~~
  21. text = re.sub(r'~~(.+?)~~', r'\1', text)
  22. # 转换链接 [text](url) -> text url(保留 URL)
  23. text = re.sub(r'\[([^\]]+)\]\(([^)]+)\)', r'\1 \2', text)
  24. # 去除图片 ![alt](url) -> alt
  25. text = re.sub(r'!\[(.+?)\]\(.+?\)', r'\1', text)
  26. # 去除行内代码 `code`
  27. text = re.sub(r'`(.+?)`', r'\1', text)
  28. # 去除引用符号 >
  29. text = re.sub(r'^>\s*', '', text, flags=re.MULTILINE)
  30. # 去除标题符号 # ## ### 等
  31. text = re.sub(r'^#+\s*', '', text, flags=re.MULTILINE)
  32. # 去除水平分割线 --- 或 ***
  33. text = re.sub(r'^[\-\*]{3,}\s*$', '', text, flags=re.MULTILINE)
  34. # 去除 HTML 标签 <font color='xxx'>text</font> -> text
  35. text = re.sub(r'<font[^>]*>(.+?)</font>', r'\1', text)
  36. text = re.sub(r'<[^>]+>', '', text)
  37. # 清理多余的空行(保留最多两个连续空行)
  38. text = re.sub(r'\n{3,}', '\n\n', text)
  39. return text.strip()
  40. def convert_markdown_to_mrkdwn(content: str) -> str:
  41. """
  42. 将标准 Markdown 转换为 Slack 的 mrkdwn 格式
  43. 转换规则:
  44. - **粗体** → *粗体*
  45. - [文本](url) → <url|文本>
  46. - 保留其他格式(代码块、列表等)
  47. Args:
  48. content: Markdown 格式的内容
  49. Returns:
  50. Slack mrkdwn 格式的内容
  51. """
  52. # 1. 转换链接格式: [文本](url) → <url|文本>
  53. content = re.sub(r'\[([^\]]+)\]\(([^)]+)\)', r'<\2|\1>', content)
  54. # 2. 转换粗体: **文本** → *文本*
  55. content = re.sub(r'\*\*([^*]+)\*\*', r'*\1*', content)
  56. return content