728x90

문제) 총 N개의 문자열로 이루어진 집합 S가 주어진다. 입력으로 주어지는 M개의 문자열 중에서 집합 S에 포함되어 있는 것이 총 몇 개인지 구하는 프로그램을 작성하시오.

 

입력) 첫째 줄에 문자열의 개수 N과 M (1 ≤ N ≤ 10,000, 1 ≤ M ≤ 10,000)이 주어진다. 다음 N개의 줄에는 집합 S에 포함되어 있는 문자열들이 주어진다. 다음 M개의 줄에는 검사해야 하는 문자열들이 주어진다. 입력으로 주어지는 문자열은 알파벳 소문자로만 이루어져 있으며, 길이는 500을 넘지 않는다. 집합 S에 같은 문자열이 여러 번 주어지는 경우는 없다.

 

출력) 첫째 줄에 M개의 문자열 중에 총 몇 개가 집합 S에 포함되어 있는지 출력한다.

#코드 1
import sys
N, M = map(int, input().split())
S_dic = {}
for _ in range(N):
    S_dic[sys.stdin.readline()] = 1
result = 0
for _ in range(M):
    try:
        result += S_dic[sys.stdin.readline()]
    except:
        continue
print(result)

풀이 : 우선 N번 동안 집합 S에 포함되어있는 문자열들을 입력받는데 이때 입력받는 문자열을 key값으로 하고 value를 1로 가지는 딕셔너리 S_dic를 만들어준다. 그 후에 M번동안 검사할 문자열을 입력받는데 만약 문자열이 S_dic에 포함되어있다면 그 값인 1을 불러와서 결과값에 더해주고 포함되어있지 않다면 넘어간다. 그 후에 결과값을 출력해준다.

 

추가.

#코드 2
N, M = map(int, input().split())
S_lst = []
for _ in range(N):
    S_lst.append(input())
result = 0
for _ in range(M):
    if input() in S_lst: result += 1
print(result)

결과는 같지만 코드의 수와 해결까지의 소요시간이 차이나는 코드이다.

코드별 걸리는 시간

 맨 윗줄 결과(제출번호 44520151)는 [코드 1]에 대한 결과이다. 맨 아랫줄은(제출번호 44520006)은 [코드 2]에 대한 결과이다. 이번 문제를 해결하면서 느낀점은 코드가 짧다고 다 좋은 코드는 아니라는 것이다. [코드 2]가 [코드 1]에 비해 상대적으로 더 짧고 간결하지만, 소요되는 시간은 약 30배 정도 차이가 난다. 코드를 작성할 때는 짧고 간결하게 알아보기 쉽게 짜는 것도 중요하지만 실제 문제상황에 적용시키기 위해서는 사용언어의 특성을 이해하여 소요되는 시간을 줄이는 것도 중요하다는 것을 배웠다.

 두번째 제출결과(제출번호 44520129)는 코드 1과 약간 차이나는 코드인데 값을 입력받을 때 sys.stdin.readline()을 사용하지 않고 input()을 사용했을 때의 결과이다.

+ Recent posts