독학/[책] 알고리즘 코딩 테스트 (c++)

[알고리즘/코딩테스트👩‍💻] Do it! 알고리즘 코딩테스트 C++ 4장 정렬

최연재 2024. 1. 11. 23:44

교재 : Do it! 알고리즘 코딩테스트 c++ (김종관, 이지스퍼블리싱)
공부 깃허브 : https://github.com/yeonjae02/algorithmStudy_cpp

GitHub - yeonjae02/algorithmStudy_cpp: Do it! 알고리즘 코딩테스트 C++ 을 공부하며 작성한 코드 저장소

Do it! 알고리즘 코딩테스트 C++ 을 공부하며 작성한 코드 저장소. Contribute to yeonjae02/algorithmStudy_cpp development by creating an account on GitHub.

github.com

 


 

4.1 버블 정렬

- 정의 : 데이터의 인접 요소끼리 비교하고, swap 연산을 수행하며 정렬하는 형식
- 특징

  • 간단하게 구현할 수 있지만 시간 복잡도는 O(n2)으로 다른 정렬 알고리즘보다 느리다.
  • 특정한 루프의 전체 영역에서 swap이 한 번도 발생하지 않았다면  그 영역 뒤에 있는 데이터가 모두 정렬됐다는 뜻이므로 프로세스를 종료해도 된다.

- 정렬 과정

  1. 비교 연산이 필요한 루프 범위를 설정한다.
  2. 인접한 데이터 값을 비교한다.
  3. swap 조건에 부합하면 swap 연산을 수행한다.
  4. 루프 범위가 끝날 때까지 2~3을 반복한다.
  5. 정렬된 영역을 설정한다. 다음 루프를 실행할 때에는 이 영역을 제외한다.
  6. 비교 대상이 없을 때까지 1~5를 반복한다.

- 안쪽 for문이 몇 번 수행되었는지 구하는 아이디어 (BOJ 1377)

안쪽 루프는 1에서 n - j까지, 즉 왼쪽에서 오른쪽으로 이동하면서 swap을 수행한다. 
->
데이터의 정렬 전후 index를 비교해서 왼쪽으로 가장 많이 이동한 값을 찾으면 된다. (swap이 일어나지 않는 반복문이 한 번 더 실행되므로 +1 )

 
 

4.2 선택 정렬

- 정의 : 대상에서 가장 크거나 작은 데이터를 찾아가 선택을 반복하면서 정렬하는 방식

- 특징 : 구현 방법이 복잡하고, 시간 복잡도도 O(n2)으로 효율적이지 않아 코딩테스트에서는 많이 사용되지 않는다.

- 정렬 과정

  1. 남은 정렬 부분에서 최솟값 또는 최댓값을 찾는다.
  2. 남은 정렬 부분에서 가장 앞에 있는 데이터와 선택된 데이터를 swap한다.
  3. 가장 앞에 있는 데이터의 위치를 변경해(index++) 남은 정렬 부분의 범위를 축소한다.
  4. 전체 데이터의 크기만큼 index가 커질 때까지, 즉 남은 정렬 부분이 없을 때까지 반복한다.

 
 

4.3 삽입 정렬

- 정의 : 대상을 선택해 정렬된 영역에서 선택 데이터의 적절한 위치를 찾아 삽입하면서 정렬하는 방식
- 특징

  • 시간 복잡도는 O(n2)로 느린 편이지만 구현하기 쉽다.
  • 적절한 삽입 위치를 탐색하는 부분에서 이진 탐색 등과 같은 탐색 알고리즘을 사용해 시간 복잡도를 줄일 수 있다.

- 정렬 과정

  1. 현재 index에 있는 데이터 값을 선택한다.
  2. 현재 선택한 데이터가 정렬된 데이터 범위에 삽입될 위치를 탐색한다.
  3. 삽입 위치부터 index에 있는 위치까지 shift 연산을 수행한다.
  4. 삽입 위치에 현재 선택된 데이터를 삽입하고 index++ 연산을수행한다.
  5. 전체 데이터의 크기만큼 index가 커질 때까지, 즉 선택할 데이터가 없을 때까지 반복한다. 

 
 

4.4 퀵 정렬

- 정의 : pivot 값을 선정해 해당 값을 기준으로 정렬하는 방식
- 특징

  • 기준값이 어떻게 선정되는지에 따라 시간 복잡도에 많은 영향을 미친다.
  • 평균 시간복잡도는 O(nlogn) 이며 최악의 경우에는 O(n2)이다.
  • pivot을 중심으로 데이터를 계속 2개의 집합으로 나누며 정렬한다.

 - 정렬 과정

  1. 데이터를 분할하는 pivot을 설정한다.
  2. pivot을 기준으로 다음 과정(2.1. ~ 2.5.)을 거쳐 데이터를 2개의 집합으로 분리한다.
    1. start가 가리키는 데이터가 pivot이 가리키는 데이터보다 작으면 start를 오른쪽으로 1칸 이동한다.
    2. end가 가리키는 데이터가 pivot이 가리키는 데이터보다 크면 end를 왼쪽으로 1칸 이동한다.
    3. start가 가리키는 데이터가 pivot이 가리키는 데이터보다 크고, end가 가리키는 데이터가 pivot이 가리키는 데이터보다 작으면 start, end가 가리키는데이터를 swap하고 start는 오른쪽, end는 왼쪽으로 1칸씩 이동한다.
    4. start와 end가 만날 때까지 2.1~2.3을 반복한다.
    5. start와 end가 만나면 만난 지점에서 가리키는데이터와 pivot이가리키는 데이터를 비교하여 pivot이 가리키는 데이터가 크면 만난 지점의 오른쪽에서, 작으면 만난 지점의 왼쪽에 pivot이 가리키는 데이터를 삽입한다.
  3. 분리 집합에서 각각 다시 pivot을 선정한다.
  4. 분리 집합이 1개 이하가 될 때까지 1~3을 반복한다.

- 코드로 구현 (BOJ 11004)

void quickSort(vector<int>& v, int s, int e, int k)
{
	int pivot = partition(v, s, e);
	if (pivot == k) return;
	else if (k < pivot) quickSort(v, s, pivot - 1, k);
	else quickSort(v, pivot+1, e, k);
}

int partition(vector<int>& v, int s, int e)
{
	if (s + 1 == e) {
		if (v[s] > v[e]) swap(v, s, e);
		return e;
	}
	
	int m = (s + e) / 2;
	swap(v, s, m);
	int pivot = v[s];
	int i = s + 1, j = e;

	while (i <= j) {
		while (pivot < v[j] && j > 0)j--;
		while (pivot > v[i] && i < v.size() - 1) i++;
		if (i <= j) swap(v, i++, j--);
	}

	v[s] = v[j];
	v[j] = pivot;
	return j;
}

void swap(vector<int>& v, int i, int j)
{
	int tmp = v[i];
	v[i] = v[j];
	v[j] = tmp;
}

 
 

4.5 병합 정렬

- 정의 : 이미 정렬된 부분 집합들을 효율적으로 병합해 전체를 정렬하는 방식
- 특징

  • 분할 정복 방식을 사용해 데이터를 분할하고 분할한 집합을 정렬하며 합치는 알고리즘
  • 시간 복잡도 : O(nlogn)

- 2개의 그룹을 병합하는 과정

  • 투 포인터 개념을 사용하여 왼쪽, 오른쪽 그룹을 병합한다.
  • 왼쪽 포인터와오른쪽 포인터의값을 비교하여 작은 값을 결과 배열에 추가하고 포인터를 오른쪽으로 한 칸 이동시킨다.

- 코드로 구현

void merge_sort(int s, int e) {
	if (e - s < 1) return;

	int m = s + (e - s) / 2;
	merge_sort(s, m);
	merge_sort(m + 1, e);

	for (int i = s; i <= e; i++) tmp[i] = v[i];

	int k = s;
	int idx1 = s;
	int idx2 = m + 1;
	
	while (idx1 <= m && idx2 <= e) {
		if (tmp[idx1] > tmp[idx2]) {
			v[k] = tmp[idx2];
			k++;
			idx2++;
		}
		else {
			v[k] = tmp[idx1];
			k++;
			idx1++;
		}
	}

	while (idx1 <= m) {
		v[k] = tmp[idx1];
		k++;
		idx1++;
	}

	while (idx2 <= e) {
		v[k] = tmp[idx2];
		k++;
		idx2++;
	}
}

 
 

4.6 기수 정렬

- 정의 : 데이터의 자릿수를 바탕으로 비교해 데이터를 정렬하는 방식
- 특징

  • 값을 비교하지 않는 정렬
  • 값을 놓고 비교할 자릿수를 정한 다음 해당 자릿수만 비교
  • 시간 복잡도 : O(kn) , k는 데이터의 자릿수