Steam의 데이터를 수집하는 전략과 방법에 대해 서술한다. 추가적이 진행이 필요한 부분은 checkbox로 나타내었다.
MVP 전략에 따라 빠르게 데이터셋을 구축하고 추천 알고리즘을 적용시키기 위해 문서의 내용 중 다음 요소들을 사용하기로 한다.
- KNN 알고리즘
- steamworks web api(main) + beautifulsoup4(sub)
- 평가(게임 데이터)
TODO
- [x] steamworks web api 공부
- [x] 빅데이터 관련 공부, 어느 정도의 데이터 크기가 필요한가?
- [x] selenium client 사용법 공부
- [x] 소규모 데이터 수집
- [x] steam 측에 OAuth 관련 문의 보내기
- [ ] python 비동기 요청(asyncio) 공부
- [ ] 대규모 데이터 수집
추천 알고리즘
- 컨텐츠 기반 필터링(content based filtering)
특정 아이템과 비슷한 컨텐츠를 추천해주는 방식
- 협업 필터링(collaborative filtering)