야후 파이낸스 (Yahoo Finance) 암호화폐 데이터 웹 스크래핑
일반적으로 웹 사이트에서 특정 데이터를 추출하는 행위를 웹 스크래핑이라고 하는데요, 경쟁사 분석, 부동산 시세 모니터링, 리서치 데이터 수집 등 다양한 곳에서 활용되고 있습니다. 이외에도 금융 데이터를 수집해 투자 보조 지표를 만들어 볼 수도 있죠.
오늘은 야후 파이낸스 (Yahoo Finance) 웹 사이트에서 암호화폐 데이터를 수집해 보겠습니다. 리스틀리는 웹 데이터 추출을 위한 구글 크롬 확장 프로그램이기 때문에 설치 후 리스틀리 전체 (LISTLY WHOLE) 또는 리스틀리 부분 (LISTLY PART) 버튼만 클릭하면 데이터를 추출할 수 있어요.
리스틀리 부분 (LISTLY PART) 버튼을 클릭해 암호화폐 영역을 설정하면, 아래의 이미지처럼 25 가지의 암호화폐 정보가 수집될 거예요.
야후 파이낸스 웹 사이트는 한 번에 25개의 암호화폐 정보만을 보여주기 때문에 해당 정보가 여러 페이지에 나누어 걸쳐 저장되어 있다는 사실을 확인해볼 수 있어요.
수집하고자 하는 데이터가 여러 웹 페이지에 나누어 저장되어 있어도 걱정마세요. 추출한 데이터를 한 번에 모아서 단 하나의 엑셀 파일로 정리할 수 있으니까요! 1 페이지 데이터 추출이 완료되었으면 + 그룹 (+ GROUP) 버튼을 클릭해주세요.
페이지 하단을 살펴보면 URL 추가 (ADD URL) 영역이 있을 거예요. 이곳에 추출하고자 하는 페이지 1, 2, 3 ... 주소를 입력해주세요.
아래 이미지처럼 URL 정보를 입력한 뒤, 저장하기 (Submit) 버튼을 클릭해주세요.
데이터보드의 상태 (Status) 정보가 진행 중 (DOING)이라면 데이터가 수집되고 있다는 뜻입니다.
모든 데이터 추출이 완료되면, 완료 (SUCCESS) 영역을 클릭해 추출된 데이터를 확인해보세요.
이제 추출한 데이터를 엑셀 파일로 다운받을 시간입니다! 상단의 그룹 엑셀 (GROUP EXCEL) 버튼을 눌러 모든 데이터를 하나의 파일로 받아볼게요. 리스틀리 클릭 한 번이면 금융 데이터도 손쉽게 다운받을 수 있겠죠? 추출한 데이터를 이용해 의미있는 정보를 찾아보세요!
리스틀리(Listly)는 크롬/웨일/엣지에서 확장 프로그램으로 간단하게 설치가 가능합니다. 지금 바로 설치하고 데이터 수집의 고통에서 벗어나세요!