Red de conocimiento del abogados - Bufete de abogados - ¿Qué significan los algoritmos HITS, TrustRunk, PageRunk y HillTop? ¿Qué orientación tiene para SEO?

¿Qué significan los algoritmos HITS, TrustRunk, PageRunk y HillTop? ¿Qué orientación tiene para SEO?

Algoritmo HITS El algoritmo HITS fue propuesto por primera vez en 1997 por el Dr. Jon Kleinberg de la Universidad de Cornell como parte de un proyecto de investigación llamado "CLEVER" en el Centro de Investigación Almaden de IBM.

Algoritmo TrustRank El algoritmo TrustRank surgió originalmente de una investigación conjunta entre la Universidad de Stanford y Yahoo en 2004, con el objetivo de detectar sitios web spam, y solicitó una patente en 2006. El inventor del algoritmo TrustRank también publicó un archivo PDF especial para ilustrar la aplicación del algoritmo TrustRank. Los lectores interesados ​​pueden descargar el archivo PDF en el siguiente sitio web:

El algoritmo TrustRank no fue propuesto por Google, pero debido a que Google tiene la mayor participación de mercado, TrustRank también es un factor muy importante en las clasificaciones de Google, por lo que algunos La gente piensa erróneamente que TrustRank fue propuesto por Google. Lo que es aún más confuso es que Google alguna vez solicitó TrustRank como marca comercial, pero TrustRank en la marca comercial TrustRank se refiere al método de Google para detectar sitios web que contienen código malicioso, no al trustrank en el algoritmo de clasificación.

Basándonos en esta suposición, si podemos seleccionar sitios web 100% confiables, estos sitios web tendrán el TrustRank más alto, y los sitios web conectados a estos sitios web con el mayor rango de confianza tendrán un rango de confianza ligeramente más bajo, pero también serán alto. Asimismo, la confianza en los sitios web de tercer nivel vinculados a sitios web confiables de segundo nivel continúa disminuyendo. Por diversas razones, los buenos sitios web inevitablemente recibirán algunos sitios web spam. Sin embargo, cuanto más cerca esté la distancia de clics al sitio web de primer nivel, mayor será el rango de confianza, y cuanto más lejos esté la distancia de clics del sitio web de primer nivel, menor será el rango de confianza. De esta forma, el algoritmo de rango de confianza puede calcular el rango de confianza correspondiente para todos los sitios web. Cuanto más lejos del sitio web de primer nivel, mayor será la posibilidad de convertirse en una red de spam.

PageRankPageRank, o ranking de páginas web, es un algoritmo utilizado por Google para identificar el ranking o la importancia de las páginas web.

Los primeros motores de búsqueda utilizaban el método de clasificación de directorios, es decir, clasificaban manualmente las páginas web y ordenaban los sitios web de alta calidad.

Con el rápido aumento en el número de páginas web, este método es obviamente imposible de lograr. Como resultado, los motores de búsqueda han entrado en la era de la recuperación de texto, que devuelve resultados de búsqueda calculando la correlación entre la consulta del usuario y el contenido de la página web. Por ejemplo, los archivos y términos de búsqueda de entrada se convierten en vectores mediante el modelo de espacio vectorial y la correlación se mide calculando la desviación del ángulo entre los dos vectores (generalmente usando la distancia del coseno). Aunque este método puede manejar una gran cantidad de páginas web, el efecto no es muy bueno. Por ejemplo, existen algunos comportamientos de trampa: algunas páginas web descartan repetidamente ciertas palabras clave para mejorar su clasificación de búsqueda.

Así, los dos fundadores de Google, Larry Page y Sergey Brin, que todavía eran estudiantes de posgrado en la Universidad de Stanford en Estados Unidos, comenzaron a estudiar el ranking de las páginas web. Inspirándose en el método de evaluación de la importancia de los artículos académicos (número de citas), propusieron el algoritmo PageRank.

La idea central de PageRank es en realidad muy simple y se puede resumir de la siguiente manera:

Si una página web está vinculada a muchas otras páginas web, significa que esa página web es muy importante. y su valor de PageRank será mayor en consecuencia.

Si una página con un valor de PageRank alto enlaza con otra página, el valor de PageRank de esa página aumentará en consecuencia.

Algoritmo HillTop HillTop es una patente para la clasificación de resultados de motores de búsqueda, que fue obtenida por el ingeniero de Google Bharat en 2001. Las reglas de clasificación de Google cambian constantemente, pero el mayor cambio es la optimización basada en el algoritmo HillTop.