2009-02-20

vlex.com y contenido oculto

Hace unos años recuerdo como se habló bastante en blogs americanos sobre el caso de un periódico americano que ocultaba el contenido de los artículos a sus lectores.

Me explico: cuando buscamos algo en google nos sale en la descripción como que existe el contenido que buscamos pero cuando abrimos la web no aparece casi ningún texto referente a la búsqueda realizada y el periódico nos pedía que pagaramos para leer el artículo.


No había visto casos similares en lengua castellana hasta ahora.

Realizando una búsqueda sobre un conocido estafador madrileño me salía como primer resultado un fichero de vlex.com. Entrando en dicha página no veía lo que si aparecía en la descripción de google.

Era redireccionado hacia tsj.vlex.es/vid y era condicionado a pagar 24 euros por ver el artículo.

Viendo la cookie que me envían veo los siguientes datos:

key_maquina=K2WAW034WMEI;
key_persona=-1;

Me parece que han debido pensar que soy persona y no robot...

No recuerdo como acabó el caso del periódico americano. Pero me suena que google les baneó y tuvieron que modificar su modelo de negocio.

Teniendo en cuenta que bajo la búsqueda site:vlex.com aparecen casi 13 millones de resultados. Me parece bien claro cual va a ser el futuro de esta gente...

Dar un contenido al robot de google y otro distinto al usuario que entra en tu web sólo tiene un nombre: ENGAÑO.

5 comentarios:

angel dijo...

Estimado Carlos,

Creo que te estás llevando a confusión: la cookie key_maquina que usamos en vLex no tiene absolutamente nada que ver con cloaking o nada similar.

En vLex usamos esencialmente dos cookies:

- session_id: el clásico id de sesión usado por nuestra framework (rails) para traquear usuarios logados, idioma elegido (aunque no estés logado), etc.

- key_maquina: está es una cookie "permanente" que usamos para efectos estádisticos: nos permite medir cuantas sesiones distintas se crean desde la misma "máquina" (o sea browser) y también, medir desde cuantos browsers/PCs distintos se está usando el mismo nombre de usuario y password. Esto nos interesa tanto para conocer mejor qué uso le dan a vLex a nuestros usuarios como para detectar posibles abusos.

Para dejarlo claro: no tiene absolutamente nada que ver con idéntificar "bots", crawlers o cualquier cosa. Intenta solo aproximar el número distinto de PCs desde los cuales se conectan nuestros usuarios.

Entiendo que puede haber gente a la que no le guste que en vLex haya contenido de suscripción (también hay contenido gratuito) pero debes respetar nuestra libertad para elegir el modelo de negocio que más nos convenga, sin que esto justifique que nos acuses de engañar a nadie (ni tan solo a googlebot).

Como te digo, tanto googlebot como los otros crawlers de buscadores ven exactamente la misma cantidad de contenido que los usuarios anónimos: el extracto del documento. No hay trampa ni cartón.

Angel Faus
CTO, vLex.com

avanzaweb dijo...

Cuando escribi el articulo lo que había visto googlebot y lo que me dejaba ver vlex no era lo mismo. Me suena que también había algún tipo de redirección.

Es de sabios rectificar.

avanzaweb dijo...

Revisando un poco más el asunto veo que lo que busqué ya no se encuentra en google hacia vuestra página. Es posible que hayáis borrado esa información y que en ese momento todavía se encontraba en los archivos de google. De ahí la redirección.

Si fuera este el caso, obviamente mis deducciones de vlex.com sobre dar una versión para bots y otra para humanos serían totalmente erróneos.

avanzaweb dijo...

Bueno acabo de realizar otra búsqueda y me reafirmo en el contenido del artículo. El snippet de google no aparece en la página después de hacer click.

Forex dijo...

Ja ja, es cierto, es una técnica engañosa para ganar dinero de vlex y a un amigo lo ensuciaron publicando su nombre en un accidente del que fue absuelto y se tuvieron que colar la pagina diciendo que nunca habia existido.
Pero hay dos engaños, uno el contenido para posicionar oculto a los visitantes (malo, malo) y el fraude de ofrecer un texto que responde a la búsqueda pública y no mostrarlo.