규도자 개발 블로그

[프로그래머스/Level2/파이썬3(python3)] [1차] 캐시 (2018 KAKAO BLIND RECRUITMENT) 본문

알고리즘/풀이

[프로그래머스/Level2/파이썬3(python3)] [1차] 캐시 (2018 KAKAO BLIND RECRUITMENT)

규도자 (gyudoza) 2019. 8. 26. 03:14

[프로그래머스/Level2/파이썬3(python3)] [1차] 캐시 (2018 KAKAO BLIND RECRUITMENT)

문제

지도개발팀에서 근무하는 제이지는 지도에서 도시 이름을 검색하면 해당 도시와 관련된 맛집 게시물들을 데이터베이스에서 읽어 보여주는 서비스를 개발하고 있다. 이 프로그램의 테스팅 업무를 담당하고 있는 어피치는 서비스를 오픈하기 전 각 로직에 대한 성능 측정을 수행하였는데, 제이지가 작성한 부분 중 데이터베이스에서 게시물을 가져오는 부분의 실행시간이 너무 오래 걸린다는 것을 알게 되었다. 어피치는 제이지에게 해당 로직을 개선하라고 닦달하기 시작하였고, 제이지는 DB 캐시를 적용하여 성능 개선을 시도하고 있지만 캐시 크기를 얼마로 해야 효율적인지 몰라 난감한 상황이다.

어피치에게 시달리는 제이지를 도와, DB 캐시를 적용할 때 캐시 크기에 따른 실행시간 측정 프로그램을 작성하시오.

입력 형식

  • 캐시 크기(cacheSize)와 도시이름 배열(cities)을 입력받는다.
  • cacheSize는 정수이며, 범위는 0 ≦ cacheSize ≦ 30 이다.
  • cities는 도시 이름으로 이뤄진 문자열 배열로, 최대 도시 수는 100,000개이다.
  • 각 도시 이름은 공백, 숫자, 특수문자 등이 없는 영문자로 구성되며, 대소문자 구분을 하지 않는다. 도시 이름은 최대 20자로 이루어져 있다.

출력 형식

  • 입력된 도시이름 배열을 순서대로 처리할 때, 총 실행시간을 출력한다.

조건

  • 캐시 교체 알고리즘은 LRU(Least Recently Used)를 사용한다.
  • cache hit일 경우 실행시간은 1이다.
  • cache miss일 경우 실행시간은 5이다.

입출력 예제

캐시크기(cacheSize)도시이름(cities)실행시간
3['Jeju', 'Pangyo', 'Seoul', 'NewYork', 'LA', 'Jeju', 'Pangyo', 'Seoul', 'NewYork', 'LA']50
3['Jeju', 'Pangyo', 'Seoul', 'Jeju', 'Pangyo', 'Seoul', 'Jeju', 'Pangyo', 'Seoul']21
2['Jeju', 'Pangyo', 'Seoul', 'NewYork', 'LA', 'SanFrancisco', 'Seoul', 'Rome', 'Paris', 'Jeju', 'NewYork', 'Rome']60
5['Jeju', 'Pangyo', 'Seoul', 'NewYork', 'LA', 'SanFrancisco', 'Seoul', 'Rome', 'Paris', 'Jeju', 'NewYork', 'Rome']52
2['Jeju', 'Pangyo', 'NewYork', 'newyork']16
0['Jeju', 'Pangyo', 'Seoul', 'NewYork', 'LA']25

풀이

def solution(cache_size, cities):
    time = 0
    cache_array = [' '] * cache_size

    for city in cities:
        city_lowered = city.lower()
        if city_lowered in cache_array:
            time = time + 1
            cache_array.remove(city_lowered)
            cache_array.append(city_lowered)
        else:
            time += 5
            cache_array.append(city_lowered)
            cache_array.pop(0)
    return time

설명

조건에 있다시피 캐시알고리즘을 LRU(Least Recently Used)로 구현하는 문제이다. LRU알고리즘의 어려운 점은 "가장 최근 사용된 캐시값은 교체 우선순위에서 하향되는 점"을 구현하는 부분인데 각 캐시 공간마다 데이터 외에도 최근 사용된 횟수를 카운트하여 교체 및 우선순위 변경 등을 하는 방법도 있지만 그렇게 하면 너무 복잡하고 거대한 코드가 돼버리기 때문에 remove와 append를 통해 우선순위 변경을 적용하였다. remove와 append를 수행하면 해당 값이 없어진 뒤에 다시 뒤에 붙기 때문에 우선순위에 대한 적용이 가능해진다. 배열의 인덱스값을 교체 우선순위라고 생각하면 쉽게 이해가 될 것이다.

Comments