본문 바로가기

Dot Algo∙ DS/PS

[프로그래머스] 2021 카카오 / 순위 검색 (Java)

    #3 순위 검색

    2021 카카오 블라인드

    난이도 : LEVEL 2

    유형 : 조합, Map, 이진탐색 

     

    코딩테스트 연습 - 순위 검색

    ["java backend junior pizza 150","python frontend senior chicken 210","python frontend senior chicken 150","cpp backend senior pizza 260","java backend junior chicken 80","python backend senior chicken 50"] ["java and backend and junior and pizza 100","pyt

    programmers.co.kr

    [문제]

    카카오는 하반기 경력 개발자 공개채용을 진행 중에 있으며 현재 지원서 접수와 코딩테스트가 종료되었습니다. 이번 채용에서 지원자는 지원서 작성 시 아래와 같이 4가지 항목을 반드시 선택하도록 하였습니다.

    • 코딩테스트 참여 개발언어 항목에 cpp, java, python 중 하나를 선택해야 합니다.
    • 지원 직군 항목에 backend와 frontend 중 하나를 선택해야 합니다.
    • 지원 경력구분 항목에 junior와 senior 중 하나를 선택해야 합니다.
    • 선호하는 소울푸드로 chicken과 pizza 중 하나를 선택해야 합니다.

    인재영입팀에 근무하고 있는 니니즈는 코딩테스트 결과를 분석하여 채용에 참여한 개발팀들에 제공하기 위해 지원자들의 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인 지 쉽게 알 수 있는 도구를 만들고 있습니다.
    예를 들어, 개발팀에서 궁금해하는 문의사항은 다음과 같은 형태가 될 수 있습니다.
    코딩테스트에 java로 참여했으며, backend 직군을 선택했고, junior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 50점 이상 받은 지원자는 몇 명인가?

     

    물론 이 외에도 각 개발팀의 상황에 따라 아래와 같이 다양한 형태의 문의가 있을 수 있습니다.

    • 코딩테스트에 python으로 참여했으며, frontend 직군을 선택했고, senior 경력이면서, 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
    • 코딩테스트에 cpp로 참여했으며, senior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
    • backend 직군을 선택했고, senior 경력이면서 코딩테스트 점수를 200점 이상 받은 사람은 모두 몇 명인가?
    • 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 250점 이상 받은 사람은 모두 몇 명인가?
    • 코딩테스트 점수를 150점 이상 받은 사람은 모두 몇 명인가?

    즉, 개발팀에서 궁금해하는 내용은 다음과 같은 형태를 갖습니다.

    * [조건]을 만족하는 사람 중 코딩테스트 점수를 X점 이상 받은 사람은 모두 몇 명인가?

     

    지원자가 지원서에 입력한 4가지의 정보와 획득한 코딩테스트 점수를 하나의 문자열로 구성한 값의 배열 info, 개발팀이 궁금해하는 문의조건이 문자열 형태로 담긴 배열 query가 매개변수로 주어질 때,
    각 문의조건에 해당하는 사람들의 숫자를 순서대로 배열에 담아 return 하도록 solution 함수를 완성해 주세요.

    [제한사항]

    • info 배열의 크기는 1 이상 50,000 이하입니다.
    • info 배열 각 원소의 값은 지원자가 지원서에 입력한 4가지 값과 코딩테스트 점수를 합친 "개발언어 직군 경력 소울푸드 점수" 형식입니다.
      • 개발언어는 cpp, java, python 중 하나입니다.
      • 직군은 backend, frontend 중 하나입니다.
      • 경력은 junior, senior 중 하나입니다.
      • 소울푸드는 chicken, pizza 중 하나입니다.
      • 점수는 코딩테스트 점수를 의미하며, 1 이상 100,000 이하인 자연수입니다.
      • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
    • query 배열의 크기는 1 이상 100,000 이하입니다.
    • query의 각 문자열은 "[조건] X" 형식입니다.
      • [조건]은 "개발언어 and 직군 and 경력 and 소울푸드" 형식의 문자열입니다.
      • 언어는 cpp, java, python, - 중 하나입니다.
      • 직군은 backend, frontend, - 중 하나입니다.
      • 경력은 junior, senior, - 중 하나입니다.
      • 소울푸드는 chicken, pizza, - 중 하나입니다.
      • '-' 표시는 해당 조건을 고려하지 않겠다는 의미입니다.
      • X는 코딩테스트 점수를 의미하며 조건을 만족하는 사람 중 X점 이상 받은 사람은 모두 몇 명인 지를 의미합니다.
      • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
      • 예를 들면, "cpp and - and senior and pizza 500"은 "cpp로 코딩테스트를 봤으며, 경력은 senior 이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 500점 이상 받은 사람은 모두 몇 명인가?"를 의미합니다.

     

     

     

    문제 풀이 

    그냥 String배열을 정리해서 비교연산을 해주면 되는 쉬운문제인줄 알았지만 각 배열의 최대크기가 5만, 10만이었다. 5만과 10만을 각각 비교해주는데 최악의 경우에는 50억 정도의 연산이 발생한다. 그래서 비교 연산을 줄여주는 탐색을 위해 이진탐색을 사용하였다.

     

    구상

    1. info로 주어지는 데이터들을 공백을 포함한 query에 뽑힐 수 있는 모든 경우의 수를 만들자. - 조합
    2. 이진탐색은 정렬된 데이터에서만 가능한 알고리즘이기 때문에 정렬된 데이터가 필요하다. 점수를 기준으로 정렬하자. - 자료구조, 정렬
    3. 정렬된 점수 데이터를 통해 이진탐색을 하여 query[]에 해당하는 인원 수를 찾으면 된다. - 이진 탐색

     

    설계

    1번 로직

    쿼리로는 공백도 존재하므로 각 항목에 공백에 대한 경우의 수도 넣어줘야 한다. 그리고 정렬된 점수의 데이터가 필요하므로 해당 경우의 수에 점수를 List 데이터로 저장해줘야 한다.

     

    ex) [java, backend, junior, pizza, 150] 의 모든 경우의 수

    더보기

    ----

    ---pizza

    --junior-

    --juniorpizza

    -backend--

    -backend-pizza

    -backendjunior-

    -backendjuniorpizza

    java---

    java--pizza

    java-junior-

    java-juniorpizza

    javabackend--

    javabackend-pizza

    javabackendjunior-

    javabackendjuniorpizza

     

    총 2^4 = 16가지

    2번 로직

    Map의 Value에 점수가 List형태로 저장되어 있다. 이 List데이터를 key값을 이용해서 하나씩 꺼내어 얕은복사를 한 다음 정렬해주면 된다. 그러면 3번 로직에서 알아서 이진탐색을 해줄 것이다. 

    3번 로직

    query배열에 담긴 데이터를 통해 해당 조건에 속하는 데이터를 점수 List를 이진탐색하여 출력해주면 된다.

     

     

    구현

    1번 로직 코드

    Map Value에 List데이터를 저장해주는 부분만 유의해주면 된다. 새로운 값이 들어갈 때만 새롭게 List를 정의해줬다.

    // 1. info 모든 경우의 수 map에 저장 
    for(int i=0; i<info.length; i++) {
    	dfs("",0, info[i].split(" "));
    }
    
    static void dfs(String pos, int depth, String[] info) {
    	if(depth == 4) {
    		if(!allInfo.containsKey(pos)) {
    			in = new ArrayList<>();
    			in.add(Integer.parseInt(info[4]));
    			allInfo.put(pos, in);
    		}else {
    			allInfo.get(pos).add(Integer.parseInt(info[4]));
    		}
    		return;
    	}
    	
    	dfs(pos+"-", depth+1, info);
    	dfs(pos+info[depth], depth+1, info);
    }

     

    2번 로직 코드

    key데이터를 통해 모든 value(점수 list)를 꺼냈다. 그 다음 해당 list를 얕은 복사를 하여 간접적으로 데이터를 정렬해줬다.

    // 2. map에 저장된 점수 list 오름차순으로 정렬 	
    List<String> list = new ArrayList<>(allInfo.keySet());
    for(int i=0; i<list.size(); i++) {
    	List<Integer> scoreList = allInfo.get(list.get(i));
    	Collections.sort(scoreList);
    }

     

    3번 로직 코드

    2번 로직의 오름차순 정렬은 이진(이분) 탐색을 위한 것이다. query에서 찾는 데이터를 점수를 뽑아 이진탐색으로 찾아주면 된다. 오름차순으로 정렬해줬으므로 그 이상의 점수 데이터는 size - start를 해주면 된다.

    // 3. 이분 탐색
    for(int i=0; i<query.length; i++) {
    	query[i] = query[i].replaceAll(" and ", "");
    	String[] str = query[i].split(" ");
    	int score = Integer.parseInt(str[1]);
    	
    	answer[i] = search(str[0], score);
    }
    
    // 이분 탐색 
    static int search(String str, int score) {
    	if(!allInfo.containsKey(str)) return 0;
    	
    	List<Integer> scoreList = allInfo.get(str); 
    	int start= 0, end = scoreList.size()-1;
    	while(start<=end) {
    
    		int mid =(start+end)/2;
    		if(scoreList.get(mid) <score) {
    			start = mid+1;	
    		}else {
    			end = mid-1;
    		}
    	}
    		
    	return scoreList.size()-start;
    }

     

     

    풀이 코드

    import java.util.*;
    
    class Solution {
        static Map<String, ArrayList<Integer>> allInfo;
        static ArrayList<Integer> in;
        public int[] solution(String[] info, String[] query) {
           
            int[] answer = new int[query.length];
            allInfo = new HashMap<>();
            
            // 1. info 모든 경우의 수 map에 저장 
            for(int i=0; i<info.length; i++) {
            	dfs("",0, info[i].split(" "));
            }
            
            // 2. map에 저장된 점수 list 오름차순으로 정렬 	
            List<String> list = new ArrayList<>(allInfo.keySet());
            for(int i=0; i<list.size(); i++) {
            	List<Integer> scoreList = allInfo.get(list.get(i));
            	Collections.sort(scoreList);
            }
            
            for(int i=0; i<query.length; i++) {
            	query[i] = query[i].replaceAll(" and ", "");
            	String[] str = query[i].split(" ");
            	int score = Integer.parseInt(str[1]);
    
            	answer[i] = search(str[0], score);
            }
            return answer;
        }
    	
    	
    	static void dfs(String pos, int depth, String[] info) {
    		
    		if(depth == 4) {
    			if(!allInfo.containsKey(pos)) {
    				in = new ArrayList<>();
    				in.add(Integer.parseInt(info[4]));
    				allInfo.put(pos, in);
    			}else {
    				allInfo.get(pos).add(Integer.parseInt(info[4]));
    			}
    			return;
    		}
    		dfs(pos+"-", depth+1, info);
    		dfs(pos+info[depth], depth+1, info);
    		
    	}
    	
    	// 이분 탐색 
    	static int search(String str, int score) {
    		if(!allInfo.containsKey(str)) return 0;
    		List<Integer> scoreList = allInfo.get(str); 
    		int start= 0, end = scoreList.size()-1;
    		while(start<=end) {
        
    			int mid =(start+end)/2;
    			if(scoreList.get(mid) <score) {
    				start = mid+1;	
    			}else {
    				end = mid-1;
    			}
    		}
    		return scoreList.size()-start;
    	}
    }

     

    자료구조와 이진탐색에 대한 개념이 부족하면 풀이를 할 수 없을 것 같다. 카카오는 뭔가 새로운 알고리즘이 아닌 기본적인 개념을 가지고 어떻게 최대한의 효율과 응용을 할 수 있냐를 테스트하는 것 같다.