整理一下搜索引擎和推荐系统的评价指标,通常来说,搜索引擎和推荐系统的算法和应用场景是有区别的,但是从最终完成的 […]
月度归档: 2022 年 7 月
java Lucene搜索引擎
之前讲了一个java爬虫,接着java爬虫,可以再用java的lucene库实现一个小型的垂直式搜索引擎,简单 […]
LDA主题模型python gensim实现
前面一篇文章介绍了LDA主题模型大概的一些数学由来,重要的其实是LDA模型如何通过两个Dirichlet分布生 […]
LDA主题模型
LDA主题模型即隐含狄利克雷分布,顾名思义是一种生成文本主题的模型,回忆之前介绍过的朴素贝叶斯算法,可以使用朴 […]
帕累托最优与信息资源市场配置
假设当前有两名同学A与B,他们分别完成了语文与数学考试,成绩结果表示为(语文,数学)。同学A的成绩是(80,9 […]
java爬虫
java也能实现类似python request的爬虫,并且机制也是类似的,这里也以爬取贴吧为例。 首先是ma […]
python requests爬虫
本篇介绍比较简单的一种爬虫,即使用python中的requests与regex实现一个简易爬虫。我使用的IDE […]
时间序列分析
1.时间序列与时间序列分析 时间序列数据是常见的一种数据类型,可以被定义为: ①按照时间的先后顺序,将某一变量 […]
数据匹配/数据定位
在网络爬虫中,通过模拟请求并得到含有目标数据的响应,此时需要将数据匹配/定位出来,在之前介绍网络爬虫基础中,介 […]
逆波兰式
逆波兰式即后缀表达式,在搜索引擎及学术数据库中常常会使用“高级检索”的功能定义检索表达式,这种高级检索或专家检 […]