Semalt Expert, 법원 판결로 웹 데이터 스크래핑이 어떻게 합법화되었는지 알려줍니다

사이트 소유자의 명시적인 허가없이 웹 사이트에서 데이터를 긁는 것은 불법 일 수 있지만 판사는 최근 특정 상황에서 달리 판결을 내 렸습니다. hiQ Labs는 최근 LinkedIn 페이지에서 데이터를 추출하지 못하도록 LinkedIn에 대한 소송을 제기했습니다.

LinkedIn은 스타트 업의 웹 페이지에 무료로 액세스 할 수 있다는 말을들은 사람들에게 큰 충격을주었습니다. hiQ는 LinkedIn 알고리즘을 사용하여 LinkedIn 사용자가 자신의 공개 프로필에 대한 변경 사항을 기반으로 일자리를 찾는시기를 감지했습니다.

알고리즘은 LinkedIn 웹 페이지에서 추출 된 데이터에서 실행됩니다. 예상대로 LinkedIn은 마음에 들지 않았으며 hiQ가 더 이상 데이터를 추출하지 못하도록 대책을 마련했습니다. 제정 된 기술적 장벽과는 별도로 강력한 경고 문구가 발행되었습니다.

신생 기업은 법적으로 문제를 해결할 수밖에 없었습니다. hiQ는 법적 구제책을 찾아야했습니다. 이 회사는 LinkedIn이 기술 장벽을 제거하도록 명령하기를 원했습니다. hiQ는 또한 LinkedIn에서 데이터 추출 프로세스를 합법화하기를 원했습니다.

다행히도 스타트 업의 경우 원하는 것을 얻었습니다. 판결은 hiQ에 유리했다. 링크드 인 (LinkedIn) 웹 페이지 스크랩에서 hiQ를 방해하는 모든 대응책을 제거하고 법률이 완전히 합법적이므로 hiQ에게 자유로운 손길을 주도록 명령했습니다. 판사는 hiQ가 긁어 내고자하는 것은 공개용으로 표시되는 데이터라는 사실에 판결을 내렸다.

판사는 피고에게 hiQ에 대해 시행 된 모든 예방 메커니즘을 제거하도록 명령 할뿐만 아니라, 피고는 향후 그러한 행위를 원치 않도록 명령했다.

공개 웹 데이터 홍보

판결은 여전히 일시적인 금지 명령이지만,이 판결이 확인한대로 법이 공개 웹 데이터를 지원하고 인터넷 정보에 대한 무료 액세스를 지원한다는 사실에 귀를 기울입니다. 최종 결정이 피고에게 유리하게 되더라도이 사실은 이미 확립되었습니다.

판사는 거의 모든 링크드 인의 주장을 종식시켜이 정책을 추진했습니다. LinkedIn은 원고가 개인 정보를 침해하고 있음을 확인하려고했지만, 판사는 피고도 데이터를 판매하고 있다는 사실에 반박했습니다.

이 주장에 물이 들어 가지 않았을 때 피고는 hiQ의 행위가 컴퓨터 사기 및 남용 행위 (CFAA)를 심각하게 위반하고 있다고 밝혔습니다. 다시, 그 주장은 구멍이났다. hiQ가 공개적이고 보호되지 않은 공개 페이지의 컨텐츠 만 스크래핑했다는 이유로 기각되었습니다.

판사는 업무 시간 동안 누군가가 열린 상점에 들어서서 사건을 아날로그 화했습니다. 그러한 사람은 침입한다고 말할 수 없습니다. 따라서 hiQ는 침입하지 않았습니다. 흥미롭게도 판사는 왜 그의 판결이 공익인지에 대해 더 설명했다.

간단히 말해서, 법원은 데이터 크롤링, 추출 및 분석을 허용하는 것이 공공의 이익임을 인정했습니다. 따라서 정보의 자유로운 흐름에 장벽을 배치하는 것은 장려하는 정책이 될 것입니다.

판결에서 배워야 할 것

LinkedIn에서 직접 데이터를 추출 할 이유가 없지만 판결에서 배워야합니다. 모든 웹 사이트의 robots.txt 파일을 읽고 존중하여 안전하게 플레이하는 것이 좋습니다. 판결은 여전히 일시적인 금지 명령입니다. 결국 LinkedIn에 유리할 수 있습니다.

판결은 귀하에게 직접 영향을 미치지 않을 수 있지만, 연방 법원이 웹을 공개적으로 공개하는 정책을지지한다는 것은 기쁩니다. 따라서 정보를 검색하고 잘 활용할 수있는 사람들이 정보를 이용할 수 있어야합니다.

웹 데이터는 모든 사람, 특히 미디어 분석가, 개발자, 데이터 과학자 및 기타 전문가에게 매우 유용합니다. 따라서 판결은 환영받는 발전입니다.