Algoritmo del pagerank

Como ya se ha mencionado, en su proyecto de investigación universitario, Brin y Page intentaron inventar un sistema para estimar la autoridad de las páginas web. Decidieron construir ese sistema a partir de los enlaces, que servían como votos de confianza otorgados a una página. Según la lógica de ese mecanismo, cuantos más recursos externos enlazan a una página, más información valiosa tiene para los usuarios. Y el PageRank (una puntuación de 0 a 10 calculada en función de la cantidad y calidad de los enlaces entrantes) mostraba la autoridad relativa de una página en Internet.

Veamos cómo funciona el PageRank. Cada enlace de una página (A) a otra (B) emite el llamado voto, cuyo peso depende del peso colectivo de todas las páginas que enlazan con la página A. Y no podemos saber su peso hasta que lo calculamos, por lo que el proceso va por ciclos.

En cuanto a d, d es el llamado factor de amortiguación. Teniendo en cuenta que el PageRank se calcula simulando el comportamiento de un usuario que llega aleatoriamente a una página y hace clic en los enlaces, aplicamos este factor d de amortiguación como la probabilidad de que el usuario se aburra y abandone una página.

Google pagerank

PageRank es un algoritmo de análisis de enlaces y asigna una ponderación numérica a cada elemento de un conjunto de documentos hipervinculados, como la World Wide Web, con el fin de “medir” su importancia relativa dentro del conjunto. El algoritmo puede aplicarse a cualquier colección de entidades con citas y referencias recíprocas. El peso numérico que asigna a cualquier elemento E se denomina PageRank de E y se denota por

El PageRank es el resultado de un algoritmo matemático basado en el webgraph, creado por todas las páginas de la World Wide Web como nodos y los hipervínculos como aristas, teniendo en cuenta centros de autoridad como cnn.com o mayoclinic.org. El valor del rango indica la importancia de una página concreta. Un hipervínculo a una página cuenta como un voto de apoyo. El PageRank de una página se define de forma recursiva y depende del número y la métrica del PageRank de todas las páginas que enlazan con ella (“enlaces entrantes”). Una página a la que enlazan muchas páginas con un PageRank alto recibe un rango alto.

Desde el artículo original de Page y Brin se han publicado numerosos trabajos académicos sobre el PageRank[5] En la práctica, el concepto de PageRank puede ser vulnerable a la manipulación. Se han llevado a cabo investigaciones para identificar clasificaciones de PageRank falsamente influenciadas. El objetivo es encontrar un medio eficaz para ignorar los enlaces de documentos con PageRank falsamente influenciado[6].

Ejemplo de pagerank

Un sitio con un alto PageRank puede transmitir su alto PageRank a los sitios en los que está referenciado a través de un backlink. Sin embargo, el valor de esos enlaces disminuye a medida que hay más enlaces en el sitio. La técnica de PageRank Sculpting trata de transferir el PageRank del sitio web a las subpáginas.

Esta tabla aclara la pregunta: “¿Cuántos enlaces con PR x se necesitan para alcanzar el PR x? Por ejemplo, si se quiere alcanzar un PageRank de 6, se necesitan tres backlinks con PR 7. Si se quiere alcanzar un PR 6 con enlaces de PR 6, se necesitan 18 enlaces. Básicamente, se puede alcanzar un determinado PageRank con un solo enlace desde otro sitio web con un PageRank dos puntos superior. Por ejemplo, puede alcanzar un PR 2 con un enlace PR 4 o un PR 6 con un enlace PR 8. Cuanto más bajo sea el PageRank de las páginas que enlazan, más enlaces se necesitan para alcanzar un determinado PageRank.

Antes de 2016, los webmasters y SEOs podían obtener una primera evaluación de la confiabilidad de un sitio web utilizando PageRanks. La ponderación se hacía en una escala de 0 a 10. Los sitios web con PageRank 0 eran nuevos y aún no habían sido evaluados por PageRank, o bien se presumía que habían bajado de categoría debido al spam web.

El ranking de citas del pagerank: poner orden en la web

PageRank es un algoritmo de análisis de enlaces y asigna una ponderación numérica a cada elemento de un conjunto de documentos hipervinculados, como la World Wide Web, con el fin de “medir” su importancia relativa dentro del conjunto. El algoritmo puede aplicarse a cualquier colección de entidades con citas y referencias recíprocas. El peso numérico que asigna a cualquier elemento E se denomina PageRank de E y se denota por

El PageRank es el resultado de un algoritmo matemático basado en el webgraph, creado por todas las páginas de la World Wide Web como nodos y los hipervínculos como aristas, teniendo en cuenta centros de autoridad como cnn.com o mayoclinic.org. El valor del rango indica la importancia de una página concreta. Un hipervínculo a una página cuenta como un voto de apoyo. El PageRank de una página se define de forma recursiva y depende del número y la métrica del PageRank de todas las páginas que enlazan con ella (“enlaces entrantes”). Una página a la que enlazan muchas páginas con un PageRank alto recibe un rango alto.

Desde el artículo original de Page y Brin se han publicado numerosos trabajos académicos sobre el PageRank[5] En la práctica, el concepto de PageRank puede ser vulnerable a la manipulación. Se han llevado a cabo investigaciones para identificar clasificaciones de PageRank falsamente influenciadas. El objetivo es encontrar un medio eficaz para ignorar los enlaces de documentos con PageRank falsamente influenciado[6].