java也能实现类似python request的爬虫,并且机制也是类似的,这里也以爬取贴吧为例。 首先是ma […]
作者: huaimeng24
python requests爬虫
本篇介绍比较简单的一种爬虫,即使用python中的requests与regex实现一个简易爬虫。我使用的IDE […]
时间序列分析
1.时间序列与时间序列分析 时间序列数据是常见的一种数据类型,可以被定义为: ①按照时间的先后顺序,将某一变量 […]
数据匹配/数据定位
在网络爬虫中,通过模拟请求并得到含有目标数据的响应,此时需要将数据匹配/定位出来,在之前介绍网络爬虫基础中,介 […]
逆波兰式
逆波兰式即后缀表达式,在搜索引擎及学术数据库中常常会使用“高级检索”的功能定义检索表达式,这种高级检索或专家检 […]
独立二值检索模型
独立二值检索模型是经典的概率检索模型之一,这里对其进行一下推导 首先就是我们知道,信息检索的本质就是匹配,在实 […]
网络爬虫基础
本节将介绍网络爬虫的基础知识,数据采集是数据分析与处理的前提,该系列将简略介绍常用网络爬虫与web数据采集技术 […]
朴素贝叶斯
朴素贝叶斯方法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习 […]
信息管理与信息检索的关系
1.什么是信息管理?信息管理的基本任务是什么? 信息管理是个人或社会组织对信息进行搜集、组织、分析和提供利用的 […]