Legalità webscraping

Messaggioda raffamaiden » 08/07/2017, 22:10

Salve,

Sapete qualcosa sulla legalità del webscraping?

Parliamo del download automatico di pagine web da un sito e il processare e collezionare in maniera automatica i dati così raccolti.

So che nessuno di noi qui è avvocato. Però magari qualcuno ha qualche esperienza in merito.

Io non mi esprimo. Non voglio condizionarvi :lol:
raffamaiden
 

Re: Legalità webscraping

Messaggioda Intermat » 08/07/2017, 22:29

Se i dati sono disponibili gratuitamente e il download non è a pagamento non vedo perché dovrebbe essere un problema. Esistono dei package di linguaggi come R fatti proprio per fare scraping. Non ci vedo nulla di illegale (di base, ovviamente).
Nihil tam Ardvvm quod non Ingenio Vincas

"Considerate la vostra semenza:
fatti non foste a viver come bruti,
ma per seguir virtute e canoscenza"
Avatar utente
Intermat
Cannot live without
Cannot live without
 
Messaggio: 1452 di 3266
Iscritto il: 30/12/2012, 20:26
Località: Roma

Re: Legalità webscraping

Messaggioda raffamaiden » 08/07/2017, 22:45

Capisco. Aggiungiamo 2 elementi

Immagina che a tali dati si acceda dopo una registrazione gratuita al sito, e nella registrazione accetti le condizioni d'uso che dicono che non devi fare webscraping. In questo caso continuano a non esserci problemi?

Altro elemento: immagina che a un certo punto il sito ti becca e ti blocca, chiedendoti di risolvere un captcha per accedere ai dati. Puoi risolvere manualmente il captcha e riavviare il webscraper? O il blocco va inteso come diffida da parte del proprietario del sito a cessare questa attività? Puoi avere un webscraper ancora più sofisticato che riconosce che il sito ha mandato un captcha, prende l'immagine del captcha, te la manda per email, tu rispondi all'email con la soluzione (anche se sei in metro), lui riceve l'email e inserisce la soluzione. Oppure, se riuscisse a risolvere il captcha senza intervento umano?

Cosa succede se entrambi gli elementi sono combinati?

Altro elemento: ipotizziamo che i dati siano a pagamento. Tu paghi e hai accesso ai dati. Puoi benissimo prendere un foglio di carta e copiarli a mano. Puoi benissimo copiarli in un file Excel. E il proprietario del sito non può impedirti di farlo, non può venire a casa tua e dirti che non devi trascrivere i dati a mano. Ora, al proprietario cosa gli cambia se il file Excel anzichè farlo a mano lo fa un software?
raffamaiden
 

Re: Legalità webscraping

Messaggioda Intermat » 09/07/2017, 11:53

raffamaiden ha scritto:Capisco. Aggiungiamo 2 elementi

Immagina che a tali dati si acceda dopo una registrazione gratuita al sito, e nella registrazione accetti le condizioni d'uso che dicono che non devi fare webscraping. In questo caso continuano a non esserci problemi?

Mi sembra evidente che se nelle condizioni d'uso c'è scritto che non puoi fare scraping allora non lo puoi fare. Alla fine, nessuno ci pensa, ma si sta firmando un contratto e dunque va rispettato.

raffamaiden ha scritto:Altro elemento: immagina che a un certo punto il sito ti becca e ti blocca, chiedendoti di risolvere un captcha per accedere ai dati. Puoi risolvere manualmente il captcha e riavviare il webscraper? O il blocco va inteso come diffida da parte del proprietario del sito a cessare questa attività? Puoi avere un webscraper ancora più sofisticato che riconosce che il sito ha mandato un captcha, prende l'immagine del captcha, te la manda per email, tu rispondi all'email con la soluzione (anche se sei in metro), lui riceve l'email e inserisce la soluzione. Oppure, se riuscisse a risolvere il captcha senza intervento umano?


Direi che qui veramente dovresti sentire il parere di un avvocato. Non ho la più pallida idea di come dovrebbe essere considerato il captcha.

raffamaiden ha scritto:Altro elemento: ipotizziamo che i dati siano a pagamento. Tu paghi e hai accesso ai dati. Puoi benissimo prendere un foglio di carta e copiarli a mano. Puoi benissimo copiarli in un file Excel. E il proprietario del sito non può impedirti di farlo, non può venire a casa tua e dirti che non devi trascrivere i dati a mano. Ora, al proprietario cosa gli cambia se il file Excel anzichè farlo a mano lo fa un software?

Infatti se non è vietato lo scraping (vedi punto 1) e il sito richiede una registrazione (eventualmente a pagamento) per poter scaricare i dati allora non c'è niente di male a fare scraping. Diverso è il caso in cui nelle condizioni di utilizzo c'è scritto che la registrazione (anche a pagamento) permette di consultare i dati ma non di scaricarli (ritorni al punto 1).

Come mai questa curiosità?
Nihil tam Ardvvm quod non Ingenio Vincas

"Considerate la vostra semenza:
fatti non foste a viver come bruti,
ma per seguir virtute e canoscenza"
Avatar utente
Intermat
Cannot live without
Cannot live without
 
Messaggio: 1453 di 3266
Iscritto il: 30/12/2012, 20:26
Località: Roma

Re: Legalità webscraping

Messaggioda raffamaiden » 14/07/2017, 09:55

Stavo pensando di fare il webscraping di un sito che nei suoi termini di utilizzo dice che è vietato fare webscraping

Giacchè il sito non richiede alcuna registrazione per accedere a questi dati, mi chiedevo se si può ritenere che io abbia "firmato" questi termini
raffamaiden
 

Re: Legalità webscraping

Messaggioda axpgn » 14/07/2017, 11:05

Quindi se in un campo c'è un cartello con scritto "Potete entrare liberamente ma non raccogliete i fiori" tu li raccogli lo stesso perché non hai "firmato" niente? :?
axpgn
Cannot live without
Cannot live without
 
Messaggio: 8726 di 40640
Iscritto il: 20/11/2013, 22:03

Re: Legalità webscraping

Messaggioda raffamaiden » 14/07/2017, 11:08

axpgn ha scritto:Quindi se in un campo c'è un cartello con scritto "Potete entrare liberamente ma non raccogliete i fiori" tu li raccogli lo stesso perché non hai "firmato" niente? :?


Esatto

Se invece c'è scritto "potete entrare liberamente purchè paghiate 100 €/h" e tu non vedi il cartello e ci entri che facciamo?
raffamaiden
 

Re: Legalità webscraping

Messaggioda axpgn » 14/07/2017, 11:20

A parte il fatto che "la legge non ammette ignoranza", sei tu che devi dimostrare d non aver visto il cartello (mica è casa tua, sei tu che devi stare attento alle regole che vigono in casa altrui ...) ... inoltre, tu il cartello lo hai visto (per tua stessa ammissione) quindi lo sai che NON puoi ... poi, ovviamente, fai quello che vuoi ... :-D

raffamaiden ha scritto:Se invece c'è scritto "potete entrare liberamente purchè paghiate 100 €/h" e tu non vedi il cartello e ci entri che facciamo?

Paghi, che ci vuoi fare ? :lol: ... tua è la mancanza, tuo lo sbaglio, quindi son cavoli tuoi ... :-D (più seriamente, la realtà è un po' più variegata di così, però in questo caso non mi sembra ci possano essere dubbi ... :wink: )
axpgn
Cannot live without
Cannot live without
 
Messaggio: 8728 di 40640
Iscritto il: 20/11/2013, 22:03

Re: Legalità webscraping

Messaggioda raffamaiden » 14/07/2017, 11:24

axpgn ha scritto:Paghi, che ci vuoi fare ? :lol: ... tua è la mancanza, tuo lo sbaglio, quindi son cavoli tuoi ... :-D (più seriamente, la realtà è un po' più variegata di così, però in questo caso non mi sembra ci possano essere dubbi ... :wink: )


Tu entri in un campo e ci stai un'ora
Arriva il proprietario "Salve, sono 100€"
Tu : "Cosa?"
Propetario: "Il cartello dice che per ogni ora si paga 100€"
Tu: "Ma non c'è nessun cartello"
Proprietario: "Non c'è perchè glielo hai tolto tu quando sei entrato. Ho un sacco di testimoni che dicono che prima il cartello c'era, nonchè una foto che mostra il quotidiano di stamattina e il cartello sullo sfondo"

Mò che facciamo?
raffamaiden
 

Re: Legalità webscraping

Messaggioda raffamaiden » 14/07/2017, 11:30

axpgn ha scritto:A parte il fatto che "la legge non ammette ignoranza", sei tu che devi dimostrare d non aver visto il cartello (mica è casa tua, sei tu che devi stare attento alle regole che vigono in casa altrui ...) ... inoltre, tu il cartello lo hai visto (per tua stessa ammissione) quindi lo sai che NON puoi ... poi, ovviamente, fai quello che vuoi ... :-D


Su un campo senza alcuna recinzione c'è il seguente cartello "Proprietà privata. Regole: non andare oltre 100 metri". Questo perchè dopo 100 metri sono presenti mine anti-uomo (è una proprietà privata)

Un bambino che sa leggere a mala pena sta giocando per strada. Corre, entra nel campo, supera i 100 metri e salta per aria

Mò che facciamo?
raffamaiden
 

Prossimo

Torna a Generale

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite