1、分为四种:全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎。
(资料图片仅供参考)
2、特点如下:全文搜索引擎这种搜索方式方便、简捷,并容易获得所有相关信息;利用爬虫程序抓取互联网上所有相关文章予以索引;但搜索到的信息过于庞杂,因此用户需要逐一浏览并甄别出所需信息。
3、2、元搜索引擎基于多个搜索引擎结果并对之整合处理的二次搜索方式;元搜索引擎适用于广泛、准确地收集信息;有利于各基本搜索引擎间的优势互补;有利于对基本搜索方式进行全局控制,引导全文搜索引擎的持续改善。
4、3、垂直搜索引擎对某一特定行业内数据进行快速检索的一种专业搜索方式;适用于有明确搜索意图情况下进行检索,以准确、迅速获得相关信息。
5、4、目录搜索引擎依赖人工收集处理数据并置于分类目录链接下的搜索方式;对网站内信息整合处理并分目录呈现给用户;目录搜索方式的适应范围非常有限,且需要较高的人工成本来支持维护。
6、扩展资料:搜索引擎的关键技术网络爬虫,根据相应的规则,以某些站点作为起始站点通过各页面上的超链接遍历整个互联网,利用URL弓I用根据广度优先遍历策略从一个html文档爬行到另一个html文档来抓取信息。
7、2、中文分词,在创建索引之前需要将中文内容合理的进行分词。
8、中文分词是文本挖掘基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。
9、3、大数据处理技术,通过运用大数据处理计算框架,对数据进行分布式计算。
10、由于互联网数据量相当庞大,需要利用大数据处理技术来提高数据处理的效率。
11、在搜索引擎中,大数据处理技术主要用来执行对网页重要度进行打分等数据计算。
12、参考资料来源:百度百科-搜索引擎。
本文就为大家分享到这里,希望小伙伴们会喜欢。
标签: