En este mundo de datos cada vez más valiosos y cada vez más necesarios, cada día encontramos nuevas modalidades para obtenerlos. Se vuelve cada vez más importante conseguir un “data set”... El punto es el conflicto de los mecanismos empleados con otros derechos, sean derechos de autor, derechos de imagen, privacidad.
En este caso nos referimos a una forma particular de obtener datos: screen scraping, expresión en inglés que significa “rascar la pantalla”. También se conoce como web scrapping, acaso algo más preciso, pero mucho menos efectista. Mediante el screen scrapping se extraen datos de una página web, ya sea de imágenes como de texto. Es una técnica de programación, se aplica software para dar un determinado proceso a la información contenida en los datos obtenidos por estar circulando libres, desde una página web. El proceso que se aplica permite disponer de cierta información significativa que servirá, a su vez, convertida en datos usables, por ejemplo para sistemas o aplicaciones de inteligencia artificial. Es decir: tienen un uso específico, aplicable en un emprendimiento o empresa, para una finalidad distinta a la de quien puso a disposición on line cierta información en su página web, originalmente.
Es evidente que hay un uso ulterior de datos obtenidos en una página web de tercero, hay una transformación de dichos datos. El problema se plantea porque el screen scrapping se realiza sin aviso ni solicitar permiso alguno, naturalmente.
¿Puede aplicarse libremente el software que realiza un screen scrapping? Para responder esta pregunta hay que analizar qué naturaleza tiene la información que se procesa. Hay dos planos para considerar.
Por un lado, la página web se puede considerar una base de datos y, por lo tanto, una obra protegida por derechos de autor. De manera que, todo aprovechamiento ulterior de una obra ajena corresponde sea autorizado por su titular.
Por otro lado, si la naturaleza de la información contenida en los datos utilizados como tales implica también que se trata de una obra protegida, se superpone otra necesidad de autorización. Más allá de la legitimidad o no para la incorporación de dicha obra en la página web de que se trate (problema ajeno al análisis del screen scrapping en esta reflexión), el uso ulterior de una obra solo será lícito si tiene autorización de su titular de derechos de autor vigentes.
Si las obras o información contenida en la página web está en el dominio público, no se presenta problema al respecto. Sin embargo, la naturaleza de obra protegida como base de datos de la página web me parece muy difícil de soslayar.
En resumidas cuentas, con esta tecnología en particular se plantea un tema general: la titularidad de los datos y la posibilidad de su aplicación ulterior.
Corresponde destacar, asimismo, que este tipo de cuestiones se han planteado ya, antes, en el mundo de la información en soportes físicos. ¿Pueden tomarse los datos de una “guía” o base de datos de origen privado (un titular privado) y hacer otra, por más distinta que sea? En definitiva habría en este caso una obra derivada. Para poder hacerla – y por supuesto que para poder explotarla comercialmente – hay que solicitar autorización al autor de la obra originaria.
Como casos antecentes al respecto en este tema, en la jurisprudencia norteamericana, recordamos: EBay vs Bidder's Edge y, mucho antes, Feist Publications v. Rural Telephone Service.
De modo que, mientras no haya alguna excepción o limitación de base legal, para que puedan ser utilizados a efectos del entrenamiento de datos, los obtenidos por screen scrapping o tecnologías análogas, no queda otra respuesta que la negativa en cuanto a su legalidad.
Sin permiso, no será legal...
Alguna información en los siguientes links:
https://www.ennaranja.com/progreso/siete-aplicaciones-cotidianas-entender-funciona-screen-scraping/
https://www.octoparse.es/blog/qu%C3%A9-es-raspado-de-datos
https://protecciondatos-lopd.com/empresas/web-scraping-legal/