Python爬虫xpath解析
引言 上篇文章挖了个坑说要解释爬虫的程序,那就找时间填上了,其实Python的爬虫十分的简单,基本上只有要有一个模板,就可以了,这里恬不知耻的推广一下我的模板,我的这个爬虫前面的两个准备文件比较完善,可以直接套用,提高爬虫的安全性。 核心代码url的获取作为爬虫肯定要知道哪一个 ...
豆瓣图书爬虫
引言 因为在小程序的开发过程中用到了python的爬虫就在这里写下来了,以后的爬虫可以把这个作为一个模板。 代码User.py这个文件的存在是为了生成不同的请求头,这个UserAgent就是一个用户代理,每个浏览器都会有的,爬虫如果不加这个UserAgent,会被网页默认为不通 ...
关于并查集的一道题目(Python)
题目概要题目描述给你一个字符串 s,以及该字符串中的一些「索引对」数组 pairs,其中 pairs[i] = [a, b] 表示字符串中的两个索引(编号从 0 开始)。 你可以 任意多次交换 在 pairs 中任意一对索引处的字符。 返回在经过若干次交换后,s 可以变成的按字典序最小的字符串。 输 ...
后缀数组
关于后缀数组的一些说明 本文撰写的目的在于做题时发现经常会有题目出现后缀数组的解法,而普通的暴力解法容易引起超时,所以特意在网上学了后缀数组,但是感觉网站的一些版本都不是特别清晰,所以在自己的博客中打算自己写一个份算法教程。 遇事不决上代码请先欣赏Cpp的代码:#include ...