在谷歌搜索,打上自己想要的信息后,到出来搜索结果的流程---------------自己猜的!!

2024-03-25 14:18

本文主要是介绍在谷歌搜索,打上自己想要的信息后,到出来搜索结果的流程---------------自己猜的!!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一直琢磨,譬如:谷歌通过一个外链<a href="">seo</a>进入这个网站,然后抓取网站里面的内容,在这个抓取过程中的流程,和抓取后的结果,谷歌是怎么处理的,怎么分析这个网站,我得到那些数据,谷歌怎么从这些数据信息中析构出那些关键词,这些关键词怎么评的分,评分后怎么处理,在数据库中是怎么一个结构,琢磨的遇到了瓶颈,怎么也过不去,细想了一下,从搜索方面考虑,姑姑大哥的终极理念不就是给搜索用户得到用户想要的信息吗?怎么判断,可以通过自己写一些搜索的内容,看搜索结果的数据,分析这些数据,毕竟可控,可以看到,可以看到一些自己可以分析的数据,这样的话,也是一种逆向的不错的方法,自己就瞎琢磨了这些流程,用来解释我搜索的想象。

1

我搜索的现象:

1.1

不正常的内容太多,谷歌会拒绝查询,譬如:d:/fdf/fdfw/g/h/gh/g//v/cxg/fd/gf/h/fd/g,在谷歌查询,谷歌拒绝查询

1.2

在打入单词,只要每一个单词都是英文正规单词,譬如:

nate strategic Majority Leader  good Increased  the Sales Majority Leader  good Increased  prioritize made that Dick Durbin Niche Retail a Reports   Neglect Majority Leader  good Increased   Crucial Majority Leader  good Increased  Survival Tool move its Majority Leader  good Increased  loyalty to Partner has

无论这个问题多么的杂乱五章,语句多么的不通顺,字母多么的多,总之,只要每一个单词是合法的,就会出结果来

3

有一些搜索中没有我写的关键字,譬如:我搜索magento  wiki   how to  get a featrured  product,出来一个网站没有wiki这个单词,但是排在了第4名,这个站是一个在magento方面很有权威性的站点,关键词匹配不全面,照样出来,

 

看来谷歌在研究这个需要什么样的信息方面,的确,牛逼,不和百度似的,技术达不到这个要求,有时候我就想了,百度的搜索结果不全面,所以推出了一个百度百科,百度知道,然后累计大家经常遇到的问题,然后让大家上谷歌找资料,解答这个问题。百度做的是中国的搜索引擎,所以可行性蛮高的,慢慢的,百度不是一个搜索引擎,而是一个查询库,靠中国人上谷歌搜索资料,进行累积的库,技术不行,也有牛逼的理由,因为,我的方式牛逼!!

 

自己猜的流程:

 

内容查询--->分析内容里面的信息是否合法,如果不合法,查看不合法的比例,然后不合法的信息进行查询,是否有结果,如果没有,则定位不合法信息,如果不合法信息过高,则拒绝继续查询

--->信息满足谷歌的合法分析后,然后对每个单词进行匹配,按照一个匹配比例值,譬如:90%,单词匹配。这样将,带有搜索内容的网站都给查询出来了,然后根据“单体”匹配度评分。

--->在按照语法方面的匹配度,进行评分,譬如:magento  how to get a featured product,如果how to get a featured product,直接在某个网页直接匹配,这样获得的分值会高!

--->该页面的权重评分,权重高的网页相当于专家,分值高

--->在搜索内容中的关键词划分,然后查看划分后的关键词在该网页中的地位,譬如是在内容中,还是在title,keyword,description中,等然后在给一个分值,也有可能该步骤没有,直接权重搞定,猜把。

--->在没有完整匹配的情况下,就要把这个内容拆分成几个关键字,这里应该看该关键字对应的网站的一个综合得分把,包括该关键字的外链情况,也就是这个关键字对应的这个URL网页,谷歌给定的分值,然后换算成该算法中的分值,然后在打分。 

--->也许有条件符合评分,譬如权重高的站,匹配度高,带来的复合条件评分,等,这些应该都是有可能的吧!

然后根据这个分值,然后排列出来

猜的,没权威性!!

这篇关于在谷歌搜索,打上自己想要的信息后,到出来搜索结果的流程---------------自己猜的!!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/845269

相关文章

SQL Server跟踪自动统计信息更新实战指南

《SQLServer跟踪自动统计信息更新实战指南》本文详解SQLServer自动统计信息更新的跟踪方法,推荐使用扩展事件实时捕获更新操作及详细信息,同时结合系统视图快速检查统计信息状态,重点强调修... 目录SQL Server 如何跟踪自动统计信息更新:深入解析与实战指南 核心跟踪方法1️⃣ 利用系统目录

Spring Boot 中的默认异常处理机制及执行流程

《SpringBoot中的默认异常处理机制及执行流程》SpringBoot内置BasicErrorController,自动处理异常并生成HTML/JSON响应,支持自定义错误路径、配置及扩展,如... 目录Spring Boot 异常处理机制详解默认错误页面功能自动异常转换机制错误属性配置选项默认错误处理

Spring Boot从main方法到内嵌Tomcat的全过程(自动化流程)

《SpringBoot从main方法到内嵌Tomcat的全过程(自动化流程)》SpringBoot启动始于main方法,创建SpringApplication实例,初始化上下文,准备环境,刷新容器并... 目录1. 入口:main方法2. SpringApplication初始化2.1 构造阶段3. 运行阶

使用Go实现文件复制的完整流程

《使用Go实现文件复制的完整流程》本案例将实现一个实用的文件操作工具:将一个文件的内容完整复制到另一个文件中,这是文件处理中的常见任务,比如配置文件备份、日志迁移、用户上传文件转存等,文中通过代码示例... 目录案例说明涉及China编程知识点示例代码代码解析示例运行练习扩展小结案例说明我们将通过标准库 os

一文详解如何使用Java获取PDF页面信息

《一文详解如何使用Java获取PDF页面信息》了解PDF页面属性是我们在处理文档、内容提取、打印设置或页面重组等任务时不可或缺的一环,下面我们就来看看如何使用Java语言获取这些信息吧... 目录引言一、安装和引入PDF处理库引入依赖二、获取 PDF 页数三、获取页面尺寸(宽高)四、获取页面旋转角度五、判断

Ubuntu 24.04启用root图形登录的操作流程

《Ubuntu24.04启用root图形登录的操作流程》Ubuntu默认禁用root账户的图形与SSH登录,这是为了安全,但在某些场景你可能需要直接用root登录GNOME桌面,本文以Ubuntu2... 目录一、前言二、准备工作三、设置 root 密码四、启用图形界面 root 登录1. 修改 GDM 配

Java中读取YAML文件配置信息常见问题及解决方法

《Java中读取YAML文件配置信息常见问题及解决方法》:本文主要介绍Java中读取YAML文件配置信息常见问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要... 目录1 使用Spring Boot的@ConfigurationProperties2. 使用@Valu

Spring Security中用户名和密码的验证完整流程

《SpringSecurity中用户名和密码的验证完整流程》本文给大家介绍SpringSecurity中用户名和密码的验证完整流程,本文结合实例代码给大家介绍的非常详细,对大家的学习或工作具有一定... 首先创建了一个UsernamePasswordAuthenticationTChina编程oken对象,这是S

Android ViewBinding使用流程

《AndroidViewBinding使用流程》AndroidViewBinding是Jetpack组件,替代findViewById,提供类型安全、空安全和编译时检查,代码简洁且性能优化,相比Da... 目录一、核心概念二、ViewBinding优点三、使用流程1. 启用 ViewBinding (模块级

SpringBoot整合Flowable实现工作流的详细流程

《SpringBoot整合Flowable实现工作流的详细流程》Flowable是一个使用Java编写的轻量级业务流程引擎,Flowable流程引擎可用于部署BPMN2.0流程定义,创建这些流程定义的... 目录1、流程引擎介绍2、创建项目3、画流程图4、开发接口4.1 Java 类梳理4.2 查看流程图4