1. 데이터 수집 (구글 스프레드 시트) - 축구협회(KFA)의 데이터
- 웹 페이지에서 특정한 영역에 있는 데이터를 xpath를 활용해서 스크래핑
* xpath?
ML Path Language로 XML 문서에서 특정 위치에 있는 값을 찾을 때(경로 지정) 사용하는 언어
- 축구협회 홈페이지에 들어가 기록실의 개인 최다 득점 순위 테이블을 확인한다.
- 개발자 도구를 이용해 크롤링할 부분을 확인한다.

- 셀에 함수를 입력해 시트를 완성한다.
=importxml("https://www.kfa.or.kr/archive/etc_record.php","//tr[14]/td/table/tbody/tr[*]")

2. 시각화
💡 완성 대시보드

TWBX Day13 - 역대 남자축구 A매치 득점 순위
TWBX Day13 - 역대 남자축구 A매치 득점 순위
public.tableau.com
💡 생성 시트

- 시트 배경 깨끗하게 만들기
: 라인서식-시트-모두 없음 / 테두리서식-행,열구분선 없음
- [순위] 필드를 이용해 역대 득점 순위 Top10 필터링
- 막대 & 축구공 합치기 (이중축)
: 행선반에 있는 [득점] 복제 후 하나는 막대, 하나는 모양(축구공)으로 설정
- 현역 손흥민 선수 강조하기 위해 [손흥민_TF] 필드 생성

→ 색상&모양 마크에 놓기
※ 데이터 수집 참고 사이트 (강승일님 제작)
[스포츠 데이터] 역대 축구 A매치 득점 데이터 수집 및 시각화 - 테크42
2021년 축구 국가대표 A매치 경기가 모두 마무리 되었습니다. 2021년까지 역대 남자 축구 국가대표 A팀의 데이터를 수집 및 시각화 해보겠습니다. 웹 페이지에서 특정한 영역에 있는 데이터를 xpath
www.tech42.co.kr
'데이터 시각화 > 태블로 TWBX' 카테고리의 다른 글
| 11일차 | 디지털 트랜스포메이션과 데이터 리터러시 (0) | 2022.01.19 |
|---|---|
| 9일차 | 태블로 매출 데이터를 활용한 랭킹 대시보드 (0) | 2022.01.14 |
| 8일차 | 잉글리시 프리미어리그 순위 대시보드 만들기 (0) | 2022.01.13 |
| 7일차 | 2022년 캘린더 차트 만들기 (0) | 2022.01.12 |
| 6일차 | 전 세계 코로나19 확진자 데이터 (0) | 2022.01.10 |