룰루레몬 고객 리뷰 리스틀리로 간편하게 크롤링하기
웹 스크래핑이 아직 생소하신가요? 웹 크롤링이라고도 흔히 알려진 웹 스크래핑은 상품 정보, 고객 리뷰 등 웹 페이지를 방문해 자료를 수집하는 과정이라고 이야기할 수 있어요. 리스틀리와 같은 웹 스크래핑 툴을 이용하면 손쉽게 상품 정보나 고객 리뷰 데이터를 수집할 수 있습니다.
오늘은 스포츠웨어 브랜드인 룰루레몬 (Lululemon) 웹 사이트 리뷰 페이지에서 고객 리뷰 데이터를 추출하는 방법에 대해 알려드릴게요. 해당 웹 사이트는 사용자가 더 보기 (Load More) 버튼을 클릭할 때마다 더 많은 리뷰를 확인할 수 있도록 디자인되어 있습니다. 어떤 웹 사이트이든 더 보기 버튼을 활용해 데이터를 추출해야 한다면, 이번 튜토리얼에서 다룰 자동클릭 (Auto Click) 기능을 주의깊게 살펴봐주세요!
룰루레몬 페이지에 접속해 특정 상품의 리뷰 페이지로 이동해주세요.
대부분의 웹사이트는 한 번에 보여주어야 할 정보가 많을 경우, 여러 개의 웹 페이지에 정보를 나누어 보여주고 있어요. 룰루레몬의 리뷰 페이지같은 경우, 더 보기 (LOAD MORE REVIEWS) 버튼을 클릭할 때마다 더 많은 리뷰 정보를 보여주고 있습니다. 리스틀리에서는 이와 같은 버튼 클릭 동작을 자동화해 한 번에 수 많은 데이터를 추출할 수 있도록 도와드리고 있어요.
먼저, 리스틀리 전체 (LISTLY WHOLE) 버튼을 클릭해 데이터를 추출해보세요. 리뷰 데이터 중 일부 데이터가 추출되었죠?
다시 리뷰 페이지로 돌아가 더 보기 버튼 위에서 우클릭 후, 검사하기 (Inspect) 버튼을 눌러주세요. 다시 한번 오른쪽 버튼을 클릭해 복사하기 (Copy) > 셀렉터 복사하기 (Copy Selector) 버튼을 클릭해주세요.
이제, 더 보기 버튼 클릭 동작을 자동화해 줄 차례입니다. 리스틀리 데이터보드에서 설정 (ADD SETTING) 아이콘을 클릭해주세요.
페이지 하단의 더 많은 데이터 로딩을 위해 자동클릭 (AUTO CLICK TO LOAD MORE DATA) 영역에 복사한 내용을 붙여넣어주세요. 자동클릭 액션 반복 횟수도 5번 정도로 늘려주면, 리스틀리가 더 보기 버튼을 다섯 번 자동 클릭해 더 많은 데이터를 추출할 거예요. 설정값 변경 후, 저장하기 (SAVE) 버튼을 눌러주세요.
마지막으로 재추출 (REFRESH) 버튼을 클릭해 데이터를 재추출해볼게요. 데이터 재추출이 완료되면, 오른쪽 최신 (LATEST) 버튼을 클릭해주세요.
엑셀 (EXCEL) 버튼을 클릭하면 추출한 데이터를 하나의 엑셀 스프레드시트로 다운받을 수 있습니다.
리스틀리의 자동클릭 기능을 활용하면 간편하게 리뷰 데이터를 수집할 수 있어요. 리스틀리와 함께 고객 리뷰뿐만 아니라 경쟁업체의 상품 정보, 연구 데이터 등 세상의 모든 웹 데이터를 수집해보세요!