La filtración masiva del código Yandex revela los factores de clasificación del motor de búsqueda ruso

La filtración masiva del código Yandex revela los factores de clasificación del motor de búsqueda ruso
Logotipo de Yandex en la sede de la empresa
Agrandar / El logotipo ruso de Yandex, el motor de búsqueda más grande del país y una empresa de tecnología con muchas divisiones, dentro de la sede de la empresa.

SOPA Imágenes / Getty Images

Casi 45 GB de archivos de código fuente, presuntamente robados por un ex empleado, han revelado los fundamentos de las muchas aplicaciones y servicios del gigante tecnológico ruso Yandex. También reveló factores clave de clasificación para el motor de búsqueda de Yandex, del tipo que casi nunca se revelan en público.

Él “Fuentes Yandex Git” se publicaron como un archivo torrent el 25 de enero y muestran archivos aparentemente tomados en julio de 2022 y que datan de febrero de 2022. El ingeniero de software Arseniy Shestakov afirma

que verificó con empleados actuales y anteriores de Yandex que algunos archivos “seguro que contienen un código fuente moderno para los servicios de la empresa”. Yan dex le dijo al blog de seguridad BleepingComputer
que “Yandex no fue pirateado” y que la filtración provino de un ex empleado. Yandex declaró que no “veía ninguna amenaza para los datos de los usuarios o el rendimiento de la plataforma”.

Los archivos datan en particular de febrero de 2022, cuando Rusia comenzó una invasión a gran escala de Ucrania. Un ex ejecutivo de Yandex le dijo a BleepingComputer que la filtración era “política” y señaló que el ex empleado no había intentado vender el código a los competidores de Yandex. El código antispam tampoco se filtró.

Si bien no está claro si la revelación del código fuente de Yandex tiene implicaciones estructurales o de seguridad, la filtración de 1.922 factores de clasificación en el algoritmo de búsqueda de Yandex sin duda está haciendo olas. Consultor SEO Martin MacDonald describió el hackeo en Twitter como “probablemente lo más interesante que ha sucedido en SEO en años” (como lo señaló Search Engine Land). En un hilo que detalla algunos de los factores más notables, el investigador Alex Buraks sugiere que “también hay mucha información útil para Google SEO”.

Yandex, el cuarto motor de búsqueda clasificado por volumen, supuestamente emplea a varios ex empleados de Google. Yandex rastrea muchos de los factores de clasificación de Google, identificables en su código, y compite fuertemente con Google. La división rusa de Google se declaró en bancarrota recientemente después de perder sus cuentas bancarias y servicios de pago. Buraks señala que el primer factor en la lista de factores de clasificación de Yandex es “PAGE_RANK”, que aparentemente está relacionado con el algoritmo fundamental creado por los cofundadores de Google

.

Como lo detalla Buraks (en dos hilos), el motor de Yandex favorece las páginas que:

  • no son demasiado viejos
  • Tener mucho tráfico orgánico (visitantes únicos) y menos tráfico basado en búsquedas
  • Tener menos números y barras en su URL
  • Tener código optimizado en lugar de “pesimización dura”, con un “PR = 0”
  • Están alojados en servidores confiables
  • Sucede que son páginas de Wikipedia o están enlazadas por Wikipedia
  • Están alojados o vinculados desde páginas de nivel superior en un dominio
  • Tener palabras clave en su URL (hasta tres)

Puede buscar y hacer clic en todos los factores de Rob Ousbey’s herramienta de búsqueda compilada. Es posible que observe que casi 1000 de los factores de clasificación tienen la etiqueta “TG_DEPRECATED” y más de 200 aparecen como “TG_UNUSED”. Debido a que el código es de febrero de 2022 y se obtuvo en julio de 2022, la búsqueda de Yandex ciertamente ha cambiado desde entonces. Pero la filtración proporciona una mirada inusual a cómo se elaboran los rankings de búsqueda en un sitio que presta servicios a uno de los países más grandes del mundo.

Yandex vio cómo el código de su motor de búsqueda salía por la puerta en 2015, cuando un exempleado trató de venderlo en el mercado negro por $28,000 para financiar su propia startup. La cifra sorprendentemente baja del código central del producto principal de Yandex sugirió que desconocía su valor real. Ese empleado fue sentenciado a dos años de prisión suspendida, y el código nunca se vio públicamente.

Leave a Reply

Your email address will not be published. Required fields are marked *