曾容康的作业二

代码


  import requests
  import re
  z=requests.get('http://www.jxufe.edu.cn/')
  html = z.text
  example1=re.compile("<.*?>(.*)<.*?>")
  txts = example1.findall(html)
  st=""
  for txt in txts:
      st +=str(txt)
  example2=re.compile(r"<[^>]+>",re.S)
  example4 = example2.sub("",st)
  example3=re.compile("&.*?;|")
  final=example3.sub("",example4)

结果

结果截图

解释

使用正则表达式匹配,再将列表转换为字符串,匹配字符串,然后将st中与example2匹配成功的字符替换为空