PageRank

PageRank™ es un algoritmo que utiliza el buscador de Google para clasificar las páginas web en sus resultados de búsqueda. PageRank mide la importancia de una página contando la cantidad y la calidad de los enlaces que apuntan a ella.

No es el único algoritmo que utiliza Google para clasificar las páginas web, pero es el primero que empleó la compañía y el más conocido. Sus características son ampliamente debatidas por expertos en optimización de motores de búsqueda ( SEO ).

El proceso PageRank fue patentado por la Universidad de Stanford en Estados Unidos con el número 6.285.999. Solo el nombre PageRank es una marca registrada de Google . Google posee los derechos exclusivos de licencia de la patente PageRank.

La Universidad de Stanford recibió 1,8 millones de acciones de Google a cambio del uso de la patente. Las acciones se vendieron en 2005 por 336 millones de dólares.

Para construir la métrica PageRank, la web se concibe como una red de citas; cada nodo corresponde a una página y cada enlace a una referencia de una página a otra (hipervínculo). La métrica asigna un valor a cada nodo (página) de la red; un valor más alto corresponde a un nodo más importante.

Desde la perspectiva de la teoría de redes, PageRank es una métrica de centralidad. Esta métrica aprovecha la estructura de los hipervínculos en la web para determinar el valor de cada página en la red. Un hipervínculo a una página se considera un "voto" de apoyo.

El valor de PageRank de una página depende del número de páginas y de la métrica PageRank de esas páginas que enlazan a ella. Una página tiene un valor de PageRank más alto si:

  • Hay muchas páginas que apuntan hacia ti.
  • Varias páginas enlazan a la tuya con una alta métrica PageRank (una página es importante si otras páginas importantes enlazan a ella).

Métrica PageRank

PageRank de 400px

Métrica PageRank para nodos en una red simple, expresada como porcentaje. (Google utiliza una escala logarítmica).

El nodo C tiene un valor PageRank superior al del nodo E; aunque existen pocas conexiones a C, la conexión a C proviene de un nodo importante y, por lo tanto, tiene un valor elevado.

Si un usuario comienza en un nodo aleatorio con una probabilidad del 85% de elegir un enlace aleatorio desde el nodo que está visitando actualmente, y una probabilidad del 15% de saltar a un nodo elegido aleatoriamente de toda la red, ese usuario llegará al nodo E el 8,1% de las veces. (La probabilidad del 15% de saltar a un nodo arbitrario corresponde a un factor de amortiguación del 85%).

Sin almacenamiento en búfer, cualquier usuario terminaría en los nodos A, B o C, y todos los demás tendrían un valor PageRank de cero.

Mediante el uso del factor de amortiguamiento, el nodo A está conectado a todos los nodos de la red, incluso si no tiene conexiones con otros nodos.

Google y PageRank

El sistema PageRank es utilizado por el motor de búsqueda  de Google para determinar la relevancia o importancia de una página . Fue desarrollado por los fundadores de Google, Larry Page y Sergey Brin, mientras eran estudiantes en la Universidad de Stanford en 1998 .

Google mantiene una lista de miles de millones de páginas ordenadas por importancia; es decir, cada página tiene su relevancia en la web en su conjunto. Esta base de datos de páginas almacena desde la página más importante del mundo hasta la menos importante. Esta importancia se determina por el número de votos que recibe una página. Un voto es un enlace a esa página en cualquier parte de la web. Los votos para las páginas más importantes tienen mayor valor que los votos para las menos importantes.

Según varias personas, este criterio de clasificación de páginas es bastante democrático, ya que refleja la opinión de la web sobre un término determinado. Cabe recordar que se tienen en cuenta alrededor de diez mil millones de páginas. La calidad de las páginas más importantes está garantizada, clasificada y elegida por la propia web. Además, todas las páginas tienen las mismas posibilidades de ascender en esta lista, obteniendo votos en toda la red.

Una buena unidad de medida para definir el PageRank de una página puede ser el porcentaje (%) de páginas con respecto a las cuales es más importante. Por ejemplo, si una página tiene un PageRank del 33%, significa que es más importante que un tercio de toda la web. Si su PageRank es del 99%, significa que es superior a casi todas las demás páginas de la web.

Sin embargo, es posible manipular el PageRank asignando enlaces que no guardan relación con el propósito de la página, modificando el orden de los resultados en las búsquedas e induciendo resultados irrelevantes o sesgados. Un ejemplo reciente es la búsqueda de " fracaso" o "fracaso miserable", que devolvió como primer resultado biografía la Casa Blanca presidente estadounidense George W. Bush , seguida de la página de Michael Moore , un declarado enemigo del presidente. Este proceso se conoce como Googlebombing . A pesar de ello, Google ha eliminado algunos resultados derivados del Googlebombing.

La historia de la creación de PageRank.

PageRank fue desarrollado en la Universidad de Stanford por Larry Page (de ahí su nombre) y Sergey Brin en 1996, como parte de un proyecto de investigación sobre un nuevo tipo de motor de búsqueda. Sergey Brin concibió la idea de que la información Terry Winograd fueron sus coautores . El primer artículo sobre el proyecto, que describía la métrica PageRank y el prototipo inicial del motor de búsqueda de Google, se publicó en 1998. Poco después, Page y Brin fundaron Google Inc., la empresa responsable del motor de búsqueda de Google.

La métrica PageRank se inspiró en el análisis , desarrollado por Eugene Garfield en 1950 en la Universidad de Pensilvania, y en el método de "Hyper Search", desarrollado por Massimo Marchiori en la Universidad de Padua. En el mismo año en que se introdujo PageRank (1998), Jon Kleinberg publicó su trabajo sobre HITS. Los fundadores de Google citaron a Marchiori y Kleinberg en su artículo original.

El motor de búsqueda RankDex, de IDD Information Services, diseñado por Robin Li desde 1996, ya exploraba una estrategia para puntuar y clasificar páginas. La tecnología empleada en RankDex se patentó en 1999 y posteriormente se utilizó cuando Li fundó Baidu en China. El trabajo de Li se cita en varias patentes, incluidas las de los métodos de búsqueda de Google y las de Larry Page.

Para obtener más información sobre PageRank, visite la página de Wikipedia .

Publicar comentario

Blog semántico
Resumen de privacidad

Este sitio web utiliza cookies para ofrecerle la mejor experiencia de usuario posible. La información de las cookies se almacena en su navegador y realiza funciones como reconocerle cuando regresa a nuestro sitio web y ayudar a nuestro equipo a comprender qué secciones del sitio web le resultan más interesantes y útiles.