문제 설명
카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.
다음은 카카오 아이디의 규칙입니다.
- 아이디의 길이는 3자 이상 15자 이하여야 합니다.
- 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
- 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.
"네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id 라고 한다면,
1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다.
2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.
3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.
4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.
5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.
6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다. 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.
예를 들어, new_id 값이 "...!@BaT#*..y.abcdefghijklm" 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.
1단계 대문자 'B'와 'T'가 소문자 'b'와 't'로 바뀌었습니다.
"...!@BaT#*..y.abcdefghijklm" → "...!@bat#*..y.abcdefghijklm"
2단계 '!', '@', '#', '*' 문자가 제거되었습니다.
"...!@bat#*..y.abcdefghijklm" → "...bat..y.abcdefghijklm"
3단계 '...'와 '..' 가 '.'로 바뀌었습니다.
"...bat..y.abcdefghijklm" → ".bat.y.abcdefghijklm"
4단계 아이디의 처음에 위치한 '.'가 제거되었습니다.
".bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"
5단계 아이디가 빈 문자열이 아니므로 변화가 없습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"
6단계 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghi"
7단계 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다.
"bat.y.abcdefghi" → "bat.y.abcdefghi"
따라서 신규 유저가 입력한 new_id가 "...!@BaT#*..y.abcdefghijklm"일 때, 네오의 프로그램이 추천하는 새로운 아이디는 "bat.y.abcdefghi" 입니다.
[문제]
신규 유저가 입력한 아이디를 나타내는 new_id가 매개변수로 주어질 때, "네오"가 설계한 7단계의 처리 과정을 거친 후의 추천 아이디를 return 하도록 solution 함수를 완성해 주세요.
[제한사항]
new_id는 길이 1 이상 1,000 이하인 문자열입니다.
new_id는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
new_id에 나타날 수 있는 특수문자는 -_.~!@#$%^&*()=+[{]}:?,<>/ 로 한정됩니다.
[입출력 예]
nonew_idresult
| 예1 | "...!@BaT#*..y.abcdefghijklm" | "bat.y.abcdefghi" |
| 예2 | "z-+.^." | "z--" |
| 예3 | "=.=" | "aaa" |
| 예4 | "123_.def" | "123_.def" |
| 예5 | "abcdefghijklmn.p" | "abcdefghijklmn" |
입출력 예에 대한 설명
입출력 예 #1
문제의 예시와 같습니다.
입출력 예 #2
7단계를 거치는 동안 new_id가 변화하는 과정은 아래와 같습니다.
1단계 변화 없습니다.
2단계 "z-+.^." → "z-.."
3단계 "z-.." → "z-."
4단계 "z-." → "z-"
5단계 변화 없습니다.
6단계 변화 없습니다.
7단계 "z-" → "z--"
입출력 예 #3
7단계를 거치는 동안 new_id가 변화하는 과정은 아래와 같습니다.
1단계 변화 없습니다.
2단계 "=.=" → "."
3단계 변화 없습니다.
4단계 "." → "" (new_id가 빈 문자열이 되었습니다.)
5단계 "" → "a"
6단계 변화 없습니다.
7단계 "a" → "aaa"
입출력 예 #4
1단계에서 7단계까지 거치는 동안 new_id("123_.def")는 변하지 않습니다. 즉, new_id가 처음부터 카카오의 아이디 규칙에 맞습니다.
입출력 예 #5
1단계 변화 없습니다.
2단계 변화 없습니다.
3단계 변화 없습니다.
4단계 변화 없습니다.
5단계 변화 없습니다.
6단계 "abcdefghijklmn.p" → "abcdefghijklmn." → "abcdefghijklmn"
7단계 변화 없습니다.
풀이
class Solution {
public static String solution(String new_id) {
String answer = "";
//1단계
answer = new_id.toLowerCase();
//2단계
answer = answer.replaceAll("[^0-9a-z-_.]", "");
//3단계
answer = answer.replaceAll("[.]{2,}", ".");
//4단계
answer = answer.replaceAll("^[.]", "");
answer = answer.replaceAll("[.]$", "");
//5단계
if (answer.length() == 0) {
answer += "a";
}
//6단계
if (answer.length() >= 16) {
answer = answer.substring(0, 15);
answer = answer.replaceAll("^[.]", "");
answer = answer.replaceAll("[.]$", "");
}
//7단계
if (answer.length() <= 2) {
while (answer.length() < 3) {
answer += answer.charAt(answer.length()-1);
}
}
return answer;
}
}
1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다.
- .toLowerCase() 를 사용하여 모든 문자를 소문자로 바꿉니다.
2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.
- .replaceAll("[^0-9a-z-_.]", "") 을 이용하여 0-9,a-z,-, _ , . (정규표현식)을 제외한 모든 문자들은 제거합니다.
what?
정규표현식 : 특정한 규칙을 가진 문자열의 집합을 표현하기 위해 쓰이는 형식언어이다.
0-9 : 0~9사이에 속하는 숫자들
a-z : a~z사이에 속하는 소문자 알파벳들
-/_/. : 기타 그외 속하는 문자들
맨앞에 ^는 문자열의 시작을 나타냅니다.
[] 괄호는 안에 있는 모든것들은 하나의 문자를 가리킵니다.
3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.
- answer.replaceAll("[.]{2,}", ".") 에서는 위에서 설명한 정규 표현식을 사용하여서 [.]이라는 문자가 {}(문자의 개수)에 들어 있는 {2}개 만큼 으로 표현됩니다.
그리고 뒤에 .은 2개이상 나왔을 경우에 .한개로 바꾼다 라는 의미입니다.
▶하지만 여기서 {2,} 라는 문자의 , 가 뒤에 들어가 있을경우에는 {n,} 기호 바로 앞의 문자가 n번이상 나왔을 경우로
표현됩니다.
▶반대로 {,2}라는 문자의 경우에는 {,n} 즉 기호 바로 앞의 문자가 n번 이하가 나올 경우이다.
4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.
1) answer = answer.replaceAll("^[.]", "");
2) answer = answer.replaceAll("[.]$", "");
위 두개의 코드도 정규표현식을 사용한다.
1번 같은경우에는 ^첫 시작부분을 의미한다, 즉 첫 시작 부분이 .일 경우에는 뒷 부분에 빈칸만이 적혀있기 때문에 조건에 맞는 문자가 삭제됩니다.
2번 같은경우에는 반대로 뒷부분에 $가 있는데 이 의미는 문자열이 .으로 끝날경우라는 의미입니다.
즉, 1번과 2번의 코드들은 앞과 뒤에 .으로 끝날경우 .을 삭제하는 코드입니다.
5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.
if (answer.length() == 0) { // answer의 길이가 0 일경우에
answer += "a"; //answer에 a를 대입합니다.
}
위와 같은 코드를 사용하여 간단하게 풀 수 있습니다.
6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다. 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
if (answer.length() >= 16) { // 조건처럼 answer의 길이가 16개보다 크거나 같을경우
answer = answer.substring(0, 15);
//substring메서드를 이용하여 0번 문자부터 15번쨰 문자까지 잘라내서 answer에 저장합니다.
answer = answer.replaceAll("^[.]", "");
answer = answer.replaceAll("[.]$", "");
// 위 코드들은 4번에서 하였던 것처럼 잘라낸 뒤 끝과 처음이 .일경우를 다시한번 확인해서 지워주는 코드로 한번더 사용합니다.
}
7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.
if (answer.length() <= 2) { //위 조건대로 answer의 길이가 2보다 작거나 같을경우
while (answer.length() < 3) { //answer의 길이가 3보다 작을경우에는 반복합니다.
answer += answer.charAt(answer.length()-1);
// answer에 charAt메서드를 활용하여 answer의 길이-1을 추가시켜줍니다.}
}
그 후 출력 결과를 리턴해주면 완료됩니다.
배운점:
이번 문제를 해결하면서 정규식에 대해서 잘 사용하지 못하였기 떄문에 하드코딩을 하여 하나하나
split을 이용하여 자른 문자들을 배열에 담아 반복문을 사용하여 해결하려고 했지만, 정규표현식을 배우게 됨으로써
훨씬 쉽게 문제를 풀 수 있었던것 같습니다.
'알고리즘' 카테고리의 다른 글
| [프로그래머스 알고리즘문제] 모의고사 - JAVA (0) | 2021.08.05 |
|---|---|
| [프로그래머스 알고리즘문제] 부족한 금액 계산하기 - JAVA (0) | 2021.08.05 |
| [프로그래머스 알고리즘문제] 로또의 최고 순위와 최저 순위 - JAVA (0) | 2021.08.05 |
| [프로그래머스 알고리즘문제] 숫자 문자열과 영단어 - JAVA (0) | 2021.08.05 |
| 1. 자료구조와 알고리즘? (0) | 2021.07.27 |
댓글