1, 2, 3,... 으로 구성된 웹 페이지 데이터도 추출할 수 있나요?

리스틀리를 이용해 대부분의 1, 2, 3... 형태의 웹 페이지 데이터를 추출하실 수 있습니다.

1, 2, 3... 등 여러 개의 웹 페이지에 콘텐츠를 나누어 저장하고 보여주는 방식을 페이지네이션이라고 합니다. 유료 기능인 그룹추출, 템플릿 기능 등을 통해 사람이 웹 사이트에 접근하는 것과 유사하게 개별 페이지에 접속해 필요한 데이터를 추출하실 수 있어요. 기본적으로 데이터를 추출하고자 하는 웹 페이지들의 URL 주소가 서로 달라 식별 가능하다면, 간단하게 그룹추출이나 템플릿을 이용해 여러 개의 웹 페이지에서 데이터를 추출하실 수 있습니다. 템플릿은 마우스, 키보드 동작을 재현할 수 있는 기능으로, 리스틀리팀이 고객 사례를 통해 대부분의 웹 사이트 페이지네이션에서 동작할 수 있도록 고안했습니다. 템플릿은 주기적으로 업데이트 될 예정이며, 템플릿 페이지에서 가장 문의가 많았던 페이지네이션과 관련해 2023년 8월 31일 기준으로 업데이트된 템플릿 4종을 만나보실 수 있습니다.

템플릿 사용 시,

  1. 연속된 페이지 중 “1 페이지”에서 LISTLY WHOLE을 클릭해 전체 페이지를 추출해주세요.

2. 추출한 데이터의 설정란에서 해당 웹 사이트 페이지네이션에 적용할 수 있는 템플릿을 참고해 데이터 추출 설정값을 변경해주세요.

설정 이동 방법 1 : 결과창 가장 상단 박스의 “브라우저 세팅” 클릭

설정 이동 방법 2 : 데이터보드→ 해당 태스크의 톱니바퀴 설정 아이콘

3. 데이터보드에서 해당 태스크의 재추출 아이콘을 클릭해 데이터 추출을 다시 진행합니다.

하지만 아래 이미지처럼 1 페이지에서 2 페이지로 이동해도 URL 주소가 변하지 않는다면, 액션스크립트를 이용해 데이터를 추출하고자 하는 개별 페이지의 URL 추출 후, 필요한 데이터를 수집하실 수 있습니다.

아쉽게도 액션스크립트 서비스가 엔터프라이즈(기업용) 전용 옵션 상품으로 개편됨에 따라 현재 1인 라이선스인 비즈니스 플랜에서는 액션스크립트 작성 서비스가 중단되었습니다. 하지만, 개발팀의 스크립트 작성 서비스를 중단하는 것일 뿐, 액션스크립트 설정란은 그대로 유지되므로 기존에 전달 받은 코드가 정상적으로 작동하고 있거나, 직접 코드를 작성하여 사용 중이시라면 계속 사용하시면 됩니다. 하지만 대상 웹사이트의 구조 변경에 따라 이전에 리스틀리 팀에서 전달드린 액션스크립트가 더 이상 동작하지 않을 경우 액션스크립트의 재요청이 불가하며, 이에 불편함을 겪으실 고객님들을 위해 템플릿 서비스를 제공하고 있다는 점 양해 부탁드립니다.