공개된 페이지들을 한 번에 다운로드하는 법

[초간단 따라하기]

  1. 다운로드할 URL 준비
  2. 소스 데이터를 추출한 뒤 그룹 생성
  3. 모든 추출이 완료될 때까지 대기
  4. 엑셀로 다운로드

1. 다운로드할 URL 준비



여러 페이지에 걸쳐 반복되는 데이터를 추출해보겠습니다. 예제는 AliExpress 여성의류 목록입니다. 추출하는 페이지 수는 제한이 없습니다. 수백, 수천, 수만 개로부터 동시 추출가능하며, 빠른 설명을 위해 4개 페이지만 사용합니다.

이 때 URL 목록을 추출하기는 하이퍼링크들을 한 번에 추출하는 법 을 참고하시기 바랍니다. 또한 추출할 페이지들은 리스틀리가 대신 방문하는 방식으로 진행되기 때문에 누구에게나 공개되어 있어야 합니다. 만약 비공개된 페이지라면, 비공개된 페이지들을 한 번에 다운로드하는 법 을 참고해 주세요.

2. 소스 데이터 추출한 뒤 그룹 생성




데이터 추출을 해 본 적 없으시다면, 리스틀리를 시작하기 를 참고하세요.

다운로드할 URL들을 그룹 데이터라고 부르겠습니다. 그룹 데이터를 입력하기 전에 그룹의 소스가 되는 데이터 추출을 해야합니다. 준비한 URL 중 1개를 선택하여 크롬 확장프로그램으로 데이터를 추출합니다.

추출한 데이터를 그룹 데이터의 소스로 만듭니다. 추출할 데이터 탭을 선택하고, + Group 버튼을 누르세요.

선택한 탭이 맞는지 확인하고, 준비해 둔 URL들을 복사하여 붙여넣습니다. 그룹 이름도 원하는대로 수정할 수 있습니다.

3. 모든 데이터가 추출될 때까지 대기




Databoard에서 그룹 데이터의 추출 상태를 한 눈에 확인할 수 있습니다.

데이터가 정상적으로 추출되었는지 직접 확인할 수 있습니다.

  • ‘탭 매칭’ 이란? 그룹 생성할 때 선택했던 탭과 일치하는 데이터가 발견되면 Y로 표시, 그렇지 않으면 N으로 표시됩니다.

4. 엑셀 파일 다운로드



Excel 버튼을 누르면 그룹 데이터가 자동으로 엑셀 파일 하나에 정리되어 나옵니다.