연구 과제를 진행하기 위해 참고한 추천시스템을 활용한 콘텐츠 캐싱 논문을 요약 정리한 글이다.
- 일반적으로는 global content request probability 사용
- 셀이 작아지면서 사용자의 수는 보통 10명 미만으로 매우 적음. 문화 성별 나이 직업 등에서 사용자의 다양성이 개인적인 선호도가 매우 다양하다는 결과를 낳음.
- 네트워크 모델 – 전송 파워, 기지국-사용자의 공간 분포도, 대역폭
- 실제 추천시스템에서는 factor가 뭘 나타내는지 정확하게는 모르는 걸로 알고 있음.
- 연구할 때는 콘텐츠가 비평가가 특성을 가지고 있다고 가정함. 행렬 분해 추천시스템을 간단히 구현한 거라고 말하면 안될 것 같음.
- 추천시스템을 활용해서 사용자의 선호도를 파악하여 콘텐츠를 캐싱하다는 큰 틀은 비슷한 거 같음
- i = user, f = contents
- 기계학습인가? 아니다
- ICRP로 그냥 콘텐츠를 캐싱하면 확률적으로 콘텐츠를 캐싱할 뿐 최대 캐싱 이득을 얻을 수 없음
- DLA 의 목표는 가능한 행동 중에서 최적의 행동을 결정하는 것.
- 여기서 최적의 행동은 보상받을 확률을 최대화하는 행동 입력으로 사용자의 정보가 들어가지 않는다.
- 사용자의 콘텐츠 요청 확률을 정확하게 구했다면 이걸로 캐싱하면 되는 거 아닌가? 굳이 강화학습을 쓸 필요가 있나?
- m=user ER -> 베타 -> d(t) -> g(t) ICRP -> User request -> Update action probability
- 결국 ICRP로 학습 되는 거 아닌가?
- 캐시 사이즈가 커지면 당연히 성능이 더 좋아지는 거 아닌가? 성능을 비교할 필요가 있는 건가?
- Ex) 비평가1은 로맨스 장르 영화 순위, 비평가2는 공포 장르 영화 순위