[프로그래머스/Level2] 순위 검색 (2021 카카오 블라인드)
문제 설명
[본 문제는 정확성과 효율성 테스트 각각 점수가 있는 문제입니다.]
카카오는 하반기 경력 개발자 공개채용을 진행 중에 있으며 현재 지원서 접수와 코딩 테스트가 종료되었습니다. 이번 채용에서 지원자는 지원서 작성 시 아래와 같이 4가지 항목을 반드시 선택하도록 하였습니다.
- 코딩 테스트 참여 개발언어 항목에 cpp, java, python 중 하나를 선택해야 합니다.
- 지원 직군 항목에 backend와 frontend 중 하나를 선택해야 합니다.
- 지원 경력 구분 항목에 junior와 senior 중 하나를 선택해야 합니다.
- 선호하는 소울푸드로 chicken과 pizza 중 하나를 선택해야 합니다.
인재영입팀에 근무하고 있는 니니즈는 코딩 테스트 결과를 분석하여 채용에 참여한 개발팀들에 제공하기 위해 지원자들의 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인 지 쉽게 알 수 있는 도구를 만들고 있습니다.
예를 들어, 개발팀에서 궁금해하는 문의사항은 다음과 같은 형태가 될 수 있습니다.
코딩 테스트에 java로 참여했으며, backend 직군을 선택했고, junior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩 테스트 점수를 50점 이상 받은 지원자는 몇 명인가?
물론 이 외에도 각 개발팀의 상황에 따라 아래와 같이 다양한 형태의 문의가 있을 수 있습니다.
- 코딩 테스트에 python으로 참여했으며, frontend 직군을 선택했고, senior 경력이면서, 소울푸드로 chicken을 선택한 사람 중 코딩 테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
- 코딩 테스트에 cpp로 참여했으며, senior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩 테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
- backend 직군을 선택했고, senior 경력이면서 코딩 테스트 점수를 200점 이상 받은 사람은 모두 몇 명인가?
- 소울푸드로 chicken을 선택한 사람 중 코딩 테스트 점수를 250점 이상 받은 사람은 모두 몇 명인가?
- 코딩 테스트 점수를 150점 이상 받은 사람은 모두 몇 명인가?
즉, 개발팀에서 궁금해하는 내용은 다음과 같은 형태를 갖습니다.
* [조건]을 만족하는 사람 중 코딩 테스트 점수를 X점 이상 받은 사람은 모두 몇 명인가?
[문제]
지원자가 지원서에 입력한 4가지의 정보와 획득한 코딩 테스트 점수를 하나의 문자열로 구성한 값의 배열 info, 개발팀이 궁금해하는 문의 조건이 문자열 형태로 담긴 배열 query가 매개변수로 주어질 때,
각 문의 조건에 해당하는 사람들의 숫자를 순서대로 배열에 담아 return 하도록 solution 함수를 완성해 주세요.
문제 설명 더 보려면 더보기 클릭
[제한사항]
- info 배열의 크기는 1 이상 50,000 이하입니다.
- info 배열 각 원소의 값은 지원자가 지원서에 입력한 4가지 값과 코딩 테스트 점수를 합친 "개발언어 직군 경력 소울푸드 점수" 형식입니다.
- 개발언어는 cpp, java, python 중 하나입니다.
- 직군은 backend, frontend 중 하나입니다.
- 경력은 junior, senior 중 하나입니다.
- 소울푸드는 chicken, pizza 중 하나입니다.
- 점수는 코딩 테스트 점수를 의미하며, 1 이상 100,000 이하인 자연수입니다.
- 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
- query 배열의 크기는 1 이상 100,000 이하입니다.
- query의 각 문자열은 "[조건] X" 형식입니다.
- [조건]은 "개발언어 and 직군 and 경력 and 소울푸드" 형식의 문자열입니다.
- 언어는 cpp, java, python, - 중 하나입니다.
- 직군은 backend, frontend, - 중 하나입니다.
- 경력은 junior, senior, - 중 하나입니다.
- 소울푸드는 chicken, pizza, - 중 하나입니다.
- '-' 표시는 해당 조건을 고려하지 않겠다는 의미입니다.
- X는 코딩 테스트 점수를 의미하며 조건을 만족하는 사람 중 X점 이상 받은 사람은 모두 몇 명인 지를 의미합니다.
- 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
- 예를 들면, "cpp and - and senior and pizza 500"은 "cpp로 코딩 테스트를 봤으며, 경력은 senior 이면서 소울푸드로 pizza를 선택한 지원자 중 코딩 테스트 점수를 500점 이상 받은 사람은 모두 몇 명인가?"를 의미합니다.
[입출력 예]
info | query | result |
["java backend junior pizza 150","python frontend senior chicken 210","python frontend senior chicken 150","cpp backend senior pizza 260","java backend junior chicken 80","python backend senior chicken 50"] | ["java and backend and junior and pizza 100","python and frontend and senior and chicken 200","cpp and - and senior and pizza 250","- and backend and senior and - 150","- and - and - and chicken 100","- and - and - and - 150"] | [1,1,1,1,2,4] |
입출력 예에 대한 설명
지원자 정보를 표로 나타내면 다음과 같습니다.
언어직군 | 경력 | 소울 | 푸드 | 점수 |
java | backend | junior | pizza | 150 |
python | frontend | senior | chicken | 210 |
python | frontend | senior | chicken | 150 |
cpp | backend | senior | pizza | 260 |
java | backend | junior | chicken | 80 |
python | backend | senior | chicken | 50 |
- "java and backend and junior and pizza 100" : java로 코딩 테스트를 봤으며, backend 직군을 선택했고 junior 경력이면서 소울푸드로 pizza를 선택한 지원자 중 코딩 테스트 점수를 100점 이상 받은 지원자는 1명 입니다.
- "python and frontend and senior and chicken 200" : python으로 코딩 테스트를 봤으며, frontend 직군을 선택했고, senior 경력이면서 소울 푸드로 chicken을 선택한 지원자 중 코딩 테스트 점수를 200점 이상 받은 지원자는 1명 입니다.
- "cpp and - and senior and pizza 250" : cpp로 코딩 테스트를 봤으며, senior 경력이면서 소울푸드로 pizza를 선택한 지원자 중 코딩 테스트 점수를 250점 이상 받은 지원자는 1명 입니다.
- "- and backend and senior and - 150" : backend 직군을 선택했고, senior 경력인 지원자 중 코딩 테스트 점수를 150점 이상 받은 지원자는 1명 입니다.
- "- and - and - and chicken 100" : 소울푸드로 chicken을 선택한 지원자 중 코딩 테스트 점수를 100점 이상을 받은 지원자는 2명 입니다.
- "- and - and - and - 150" : 코딩 테스트 점수를 150점 이상 받은 지원자는 4명 입니다.
나의 풀이
[Python(파이썬)]
from itertools import combinations as cb
from collections import defaultdict #딕셔너리 만드는 dict클래스의 서브클래스
def solution(info, query):
info_dict = defaultdict(list)
answer = []
for i in info: # 지원자 정보 파싱
temp = i.split()
score_info = int(temp[-1]) # 점수만 찾아내 infopoint에 저장
key_info = temp[:-1] # 조건들만 infotemp에 저장
for j in range(5):
for c in cb(key_info, j): #한 지원자의 경우의 수 16개를 만들기
one_info_key = ''.join(c)
info_dict[one_info_key].append(score_info)
# 한 지원자의 info 조건 조합을 key, 점수를 value로 딕셔너리 저장
for infopoint in info_dict.keys():
info_dict[infopoint].sort() # value(점수)들을 오름차순 정렬, binary search 위함
for i in query:
temp = i.split()
temp = [k for k in temp if k != 'and'] # and 제거
scorer_query = int(temp[-1]) # 점수만 찾아내 querypoint 리스트에 저장
querytemp = temp[:-1] # 조건들만 querytemp 리스트에 저장
querytemp = ''.join([k for k in querytemp if k != '-']) # '-' 제거
# score_query보다 큰 점수 개수 구하기
if querytemp in info_dict:
score = info_dict[querytemp]
if len(score) > 0:
l, r = 0, len(score)
while l < r:
m = (l + r) // 2
if score[m] >= scorer_query:
r = m
else:
l = m + 1
answer.append(len(score)-l)
else:
answer.append(0)
return answer
학습한 내용
※ 체크할 내용
- 지원자가 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인지 알 수 있는 도구 만들기
- 정확성과 효율성 테스트 각각 점수가 있는 문제
- query의 각 문자열은 "[조건] X" 형식
- '-' 표시는 해당 조건을 고려하지 않겠다는 의미
- X는 코딩 테스트 점수를 의미하며 조건을 만족하는 사람 중 X점 이상 받은 사람은 모두 몇 명인 지를 의미
- 각 단어는 공백 문자(스페이스 바) 하나로 구분
문제에도 [본 문제는 정확성과 효율성 테스트 각각 점수가 있는 문제입니다.]라고 명시되어 있기 때문에 이 문제를 풀 때는 처음부터 정확성과 효율성을 함께 생각해야 했다.
정확성만 생각한다면 info, query를 각각 파싱 하여 info에서 [조건], 점수를 따로 저장하고 query에서 [조건], 점수를 따로 저장하여 단순히 매 조건마다 조건에 해당하는 지원자를 찾으면서 점수 이상을 받을 사람을 구한다면 가능(2중 for문사용) 할 것이다.
하지만 전부 파싱을 해놓고 어떻게 점수를 비교하고, '-' 표시를 비교할 것인가 생각을 했는데 아무리 생각해도 그 방법들은 모두 효율성에서 떨어질 것 같았다.
그래서 힌트를 얻고자 검색을 하다가 카카오 코딩 테스트 해설 페이지에서의 풀이 방법과 다른 여러 사람들의 블로그를 찾아보면서 다양한 풀이 방법들을 보았다.
카카오 코딩 테스트 해설 : tech.kakao.com/2021/01/25/2021-kakao-recruitment-round-1/
카카오에서 설명해준 풀이 방법을 보니 효율성 테스트를 통과하기 위해서는 지원자들을 그룹별로 적절하게 미리 분류해두어 매 문의 조건마다 지원자들을 info 배열에서 찾지 않아도 된다고 되어 있었다.
= info의 지원자들을 '-'를 포함한 조건들의 모든 경우에 대해 데이터를 저장하여 데이터베이스를 구축한 다음 query에서 주어진 점수보다 높은 점수를 가진 데이터의 개수를 찾는다.
풀이 과정
1. info, query 파싱
2. '-' 표시를 어떻게 해결할 것인가?
3. 점수 비교를 어떻게 할 것인가?
1. info, query 파싱
1-1. 전부 다 파싱을 다 시켜놓는 방법(이차원 리스트) -> X
처음에는 info와 query를 파싱 하여 한 줄로 된 문자열을 조건과 점수로 나눠 각 각 저장해줬다.
infotemp, infopoint, querytemp, querypoint, temp = [], [], [], [], []
for i in info: #지원자 정보 파싱
temp = i.split()
infopoint.append(temp.pop(-1)) # 점수만 찾아내 infopoint 리스트에 저장
infotemp.append(temp) # 조건들만 infotemp 리스트에 저장
for i in query:
temp = i.split()
temp = [k for k in temp if k != 'and'] # and는 제거
querypoint.append(temp.pop(-1)) # 점수만 찾아내 querypoint 리스트에 저장
querytemp.append(temp) # 조건들만 querytemp 리스트에 저장
이렇게 파싱을 전부 한 다음 각 각 이차원 리스트와 일차원 리스트로 만들어서 저장한 후 딕셔너리를 만들어주게 되면 또 for문을 사용해서 다시 한 줄 한 줄 읽어가며 딕셔너리로 만들어야 하기 때문에 시간과 공간을 모두 비효율적으로 사용하기 때문에 1-2 방법으로 사용했다.
1-2. 한 줄씩 파싱을 하면서 바로 딕셔너리를 만들어 주는 방법
for i in info: # 지원자 정보 파싱
temp = i.split()
infopoint = int(temp[-1]) # 점수만 찾아내 infopoint에 저장
infotemp = temp[:-1] # 조건들만 infotemp에 저장
이러한 식으로 infopoint(1차원), infotemp(2차원) 등의 리스트를 만들지 않고 지원자 한 명 파싱 할 때 infopoint 점수는 int형, infotemp조건들은 일차원 배열을 사용해서 즉시 바로바로 딕셔너리를 만들어줬다.
딕셔너리를 만드는 법은 2번에서 계속
2. '-' 표시를 어떻게 해결할 것인가?
우선 info의 지원자들을 '-'를 포함한 조건들의 모든 경우에 대해 데이터를 저장하여 데이터베이스를 구축한다.
ex) “java backend junior pizza 150” 지원자는 아래와 같은 경우의 수가 나올 수 있다.(16가지)
java | backend | junior | pizza | 150 |
– | backend | junior | pizza | 150 |
java | – | junior | pizza | 150 |
java | backend | – | pizza | 150 |
java | backend | junior | – | 150 |
– | – | junior | pizza | 150 |
– | backend | – | pizza | 150 |
… (생략) | ||||
java | – | – | – | 150 |
– | – | – | – | 150 |
지원자들의 데이터베이스를 구축할 때 모든 경우의 수에 대해 info의 조건을 key값 점수를 value로 하여 딕셔너리에 저장했다.
* '-' 문자는 따로 넣지 않았음 (query에서도 '-'와 'and'를 제거해서 비교하기 때문)
3. 점수 비교를 어떻게 할 것인가?
점수 비교는 2번에서 만든 지원자 데이터 베이스를 sort해준 다음 binary search로 탐색
# score_query보다 큰 점수 개수 구하기
if querytemp in info_dict:
score = info_dict[querytemp]
if len(score) > 0:
l, r = 0, len(score)
while l < r:
m = (l + r) // 2
if score[m] >= scorer_query:
r = m
else:
l = m + 1
answer.append(len(score)-l)
else:
answer.append(0)
문제 출처
1. 프로그래머스
코딩테스트 연습 - 순위 검색
["java backend junior pizza 150","python frontend senior chicken 210","python frontend senior chicken 150","cpp backend senior pizza 260","java backend junior chicken 80","python backend senior chicken 50"] ["java and backend and junior and pizza 100","pyt
programmers.co.kr
2. 카카오 문제 해설 사이트
2021 카카오 신입공채 1차 온라인 코딩 테스트 for Tech developers 문제해설
지난 2020년 9월 12일 토요일 오후 2시부터 7시까지 5시간 동안 2021 카카오 신입 개발자 공채 1차 코딩 테스트가 진행되었습니다. 테스트에는 총 7개의 문제가 출제되었으며, 개발 언어는 C++, Java, Jav
tech.kakao.com