2021의 게시물 표시

[C++] bool을 담은 vector가 foreach에서 동작하지 않는 이유

이미지
vector<bool>를 foreach에서 사용하려다가 컴파일 오류가 발생했다. 다른 primitive type, object type 에서는 발생하지 않아서 신기함을 느끼고 찾아보게 되었다. bool은 바이트 단위로 표현하면 1byte라고 볼 수 있지만, 내부적으로는 1bit만 사용하게 되므로 나머지 공간을 사용하지 않아서 메모리 관점에서 비효율이 발생한다. (char는 1byte를 제대로 사용하는 것과 비교된다.) 'vector<bool>는 내부적으로 1byte에 여러 개의 bool 값을 저장한다. (dynamic bitset)' 라 는 답변이 가장 와닿았고, 이를 바탕으로 더 찾아보게 되었다. 메모리 공간 최적화로 인해서, 표준 컨테이너의 기능과 인터페이스를 다소 잃게 된다. vector<bool>에서 operator[]는 bit를 조작할 수 있는 프록시 객체를 반환하게 되는데, 프록시 객체는 bool &이 아니기 때문에, bool *에 주소를 할당할 수 없다는 것이다. 예) bool * b = & v[0];    //Compile Error  이와 대조적으로, deque는 이러한 특수화가 이루어지지 않으므로 bool은 1byte를 취하고, operator[]에서 반환된 값의 주소를 가져올 수 있다. (의도한 방향) Proxy Class는 다른 클래스에 원하는 인터페이스 사용 을 위해서 사용하는 대리자 역할을 한다. 위에 operator[]처럼 1bit(0과 1)만 사용하기를 원하는 경우, 이를 표현하게 해준다. https://stackoverflow.com/questions/994488/what-is-proxy-class-in-c (1) vector<bool>의 내부적 구현 => Proxy Object로 반환(rvalue) => 반복자(iterator)는 lvalue만 참조가능 => Compile Error! (2) vector<char>의 내부...

[Algorithm] 동적 프로그래밍 익히기 - 1

동적 프로그래밍을 설계하는 데 있어서, 가장 먼저 고려해야 할 것은 변수 간의 규칙성 이다. 규칙을 찾아 점화식 을 작성할 수 있게 되면, 가장 간단한 코드 작성으로도 답은 구할 수 있는 상황이 된다. 여기에서 추가적인 최적화 (불필요한 연산 제거)를 통해서 시간을 단축할 수 있다. 즉, 메모이제이션(Memoization) 을 통해서 연산이 중복되는 것을 방지해야 한다. 1. 점화식 2. 메모이제이션 3. 더 최적화할 방법 찾기 1번을 만족시키게 되면, 완전 탐색(Brute-force) 으로 볼 수 있고, 1번과 2번을 모두 만족시켜야 동적 프로그래밍(Dynamic Programming) 이라고 볼 수 있다. 추가로 어려운 문제의 경우, 3번까지 활용해야 제한 시간 내에 해결할 수 있다. https://www.acmicpc.net/problem/14501 DP(Dynamic Programming) 를 연습할 수 있는 문제이다. 위의 문제를 풀다가, 재귀 로 푸는 방법은 쉽게 떠올랐으나 반복 문으로 푸는 방법이 바로 떠오르지 않아서 여러 코드를 분석해보았다. 여러 가지 방법이 있겠지만, 시간복잡도와 이해하기 쉬운 코드를 기준으로 선별하였다. 풀이 방법에 따라 어떤 변수를 고려하고, 어떻게 접근해야 하는지 생각해볼 수 있겠다. 0. 점화식 i번을 선택하지 않을 경우 : f(i + 1) i번을 선택하는 경우 : f(i + t(i)) + p(i) f(i) = max(f(i + 1), f(i + t(i)) + p(i))    (i <= n) f(i) = 0    (i > n)  1. 재귀적인 방법 int n, d[ 16 ], t[ 16 ], p[ 16 ]; int f( int index) { if (index == n) return 0 ; if (index > n) return INT_MIN; if (d[index] != - 1 ) return d[...

Hash Table의 의미와 중요성

우리가 코딩하면서, 가장 많이 사용하는 자료구조 개념은 무엇일까 생각해보았다. 또, 그 중 중요하면서 유용한 것이 무엇일까 생각해보았다. 배열(array) , 해시 개념을 사용한 맵(map) , 집합(set) 같은 자료구조가 아닐까 생각이 들었고, (트리를 이용한 map, set도 있기 때문에 '해시 개념을 사용한'이라고 하였다) 검색과 생각 끝에 공통적인 개념이 사용됨을 알았다. 해시 테이블의 개념을 살펴보면, key - value 를 이용하여 원하는 자료구조를 순차 탐색할 필요 없이 바로 찾아가는 것에 있다. 그리고 이를 흔히 말하는 상수 시간 O(1) 로 볼 수 있다. 먼저, 배열을 살펴보자. 배열은 정수(0, 1, 2, ... )를 이용해서 해당 위치에 있는 자료를 바로 불러올 수 있다. 이것은 key - value로 나타내면, int형을 갖는 key와 각기 다른 타입을 갖는 value로 볼 수 있다. 즉, 배열은 key가 정수인 해시 테이블 이라고 볼 수 있다. 그러면 배열을 선언하면, 내부적으로는 어떤 일이 일어날 것인지 추측해볼 수 있다. 일단, 배열의 원하는 원소에 바로 접근하려면, 기본 주소가 필요하다. 즉, 배열의 기본주소 Base Address를 저장할 변수가 필요하다. 다음으로는 value에 해당하는 자료형의 크기를 저장할 변수가 필요할 것이다. 왜냐하면, int 32형의 경우 4byte를, int 64형의 경우 8byte가 배열 한 칸을 움직이는 최솟값이 되기 때문이다. (배열의 해당 원소의 주소 = base address + offset, offset = sizeof(자료형) * index) 그럼 좀 더 확장하여, 해시 테이블에서 사용되는 모든 타입의 key 에 대해선 어떻게 계산할까? key가 string이라고 가정하면, 문자열 abc와 문자열 bca는 위의 인덱스 개념처럼 서로 다른 위치를 가르치게 해야 한다. 그러면, 이 문자열들을 각기 다른 key를 갖게 해야 하는데, 컴퓨터 내부적으로는 숫자 이진수 0과 1로 ...

[C/C++] 운영체제에 따른 포인터 크기의 변화?

우리는 인텔의 x86-IA32를 줄여서 32bit 운영체제라고 부르고, x86-64(또는 x64)를 줄여서 64bit 운영체제라고 부른다. 이전에 AMD에서 32bit가 호환가능한 64bit OS를 선보이고, 인텔도 x64 이후 x86-64를 출시하면서 이제는 어떤 것이든 호환가능한게 당연한 상식이 되었다고 알고 있다. 따라서 호환가능함을 당연한 전제를 깔고 시작한다. 32bit 로 표현 가능한 메모리의 크기는 대략적으로 4GB(2^32)가 된다. 포인터는 변수의 메모리 주소를 가르키기 때문에, 우리가 사용하려는 주소값을 모두 가르킬 수 있는 크기가 필요하다. 따라서 위의 32bit 의 경우에는 어떤 변수 타입의 포인터라도 4byte 크기면 충분 하다. 64bit 의 경우에 포인터의 크기가 8byte 인 것도 위와 같은 논리를 따른다. 그런데, Visual Studio를 비롯한 컴파일러에서 x86, x64를 선택하여 컴파일하는 기능이 있다. 이를 이용하면, 사용가능한 메모리의 크기가 정해지므로 이에 따라서 포인터의 크기가 정해지게 되는 것이다. 결론적으로 운영체제의 표현 비트에 따라서 포인터의 크기가 변하는 것이 아니라, 컴파일 설정 에 따라서 변하게 된다. [참고] https://stackoverflow.com/questions/16823752/why-size-of-void-pointer-is-4-on-windows-64-bit-platform

[PS] BOJ 10610번 30

https://www.acmicpc.net/problem/10610 Silver 5 라는 난이도 보다는 체감상 어려웠던 문제이다. 이 문제를 풀면서, 30의 배수를 어떻게 빠른 시간내에 판단할 수 있을까를 고민했다. 30의 배수는 3의 배수이면서 10의 배수인지를 판단하면 되는데,  10의 배수를 판단하는 방법은 0이 하나라도 있는지 보면 알 수 있어서 간단했다. 3의 배수가 관건이었는데, 3의 배수는 각 자릿수의 합을 다 더해도 3의 배수 꼴로 나타난다. 이렇게 주어진 수가 30의 배수임을 알게 되면, 내림차순으로 정렬해도 30의 배수가 된다. 추가적으로 이 문제를 풀면서, 각 자릿수의 합이 어떤 규칙을 갖는지 알아보았다. 3 6 9 12 15 18 21 24 27 30... 3 6 9 3 6 9 3 6 9... (각 자리수의 합이 3의 배수꼴로 나타남) 9 18 27 36 45 54 63 72 81 90... 162...  6147 9 9 9 9 9 9 9 9 9... (각 자리수의 합이 9의 배수꼴로 나타남) 3, 9 가 이러한 문제로 응용될 수 있겠다. 생각해보면, 90의 배수는 9의 배수와 10의 배수를 만족시켜야 한다. 그런데 9의 배수는 3의 배수이므로 저 문제에서 주어진 30이라는 수를 구했던 방법처럼 구할 수 있다. 이 방법 외에도 시간 내에 풀 수 있는 방법이 있는지 궁금하다.  :)

[C/C++] memset을 올바르게 사용하기

memset 함수를 사용하게 되면, 일반적인 for문을 이용하여 초기화할 때보다 속도상의 이점이 있기 때문에 배열을 초기화할 때 자주 사용하게 된다. 그런데, memset을 사용할 때 초기화할 값을 넣을 때는 조심해야한다. void   * memset (   void   * dest,  int  ch,  size_t  count  ) ; 값에 대한 타입이 int 형이지만, 기본적으로 내부에서 1byte 에 해당하는 단위로 초기화를 진행한다. 예를 들어서,  int n;  memset(&n, 1, sizeof(int)); cout << n; 위와 같이 사용한 경우, 출력 값이 16843009가 나온다. cout << (short)n; 위의 출력 값은 257이 나온다. 이 출력 값들을 이진수로 변환하여 분석해보자. 16843009 => 1000000010000000100000001 257 => 100000001 위를 최하위 비트부터 8개씩 끊으면, 1byte가 된다. 1    00000001    00000001    00000001 1    00000001 즉, 내부적으로 1byte에 해당하는 단위로 초기화를 진행하는 것을 볼 수 있다. 우리가 원했던 것은 int 형의 변수 n에 1이라는 정수형 값으로 초기화하는 것이다. 그런데 int 형은 4byte이므로, 4byte가 하나의 단위로 보고 최하위 비트에 1을 쓰고, 나머지 비트 31개를 0으로 초기화해야 하는데, memset 함수는 그러지 않고 1byte를 하나의 단위로 보고 초기화를 진행했던 것이다. 이러한 이유로 검색을 해보면, memset에 초기화할 때는 0을 쓰라고 권유 한다. 0의 경우에는 어떠한 단위로 진행해도, 모든 비트에 숫자가 0이기 때문에 올바른 결과가 나오기 때문이다. 그러나 0 이외에...

[PS] BOJ 20543번 폭탄 던지는 태영이

https://www.acmicpc.net/problem/20543 (혹시나 풀어보실 분들은 알고리즘 분류를 보지 않고 풀어보길 권장합니다.) 이 문제를 처음 보고, 간만에 신선하다는 느낌을 받았다. 어떤 알고리즘이나 자료구조를 알고 있으면,  흔히 많이 나오는 유형에 속하는 문제가 있는가 하면, 그렇지 않은 문제도 있다. 이 문제를 풀면서 규칙을 찾고 시간을 단축시켜 나가는 과정이 재미있었고, 예전에 수학에 매력을 느꼈을 때의 느낌과 비슷했다. 물론, 영문까지 포함한 많은 문제를 풀어본 건 아니지만 부족한 내가 느끼기에는 그랬다. 어려운 자료구조를 쓰지 않아도 (기본적인 재료로도)  충분히 난이도를 높여 갈 수 있는 (까다로우며 맛있는 요리?) 그런 문제들의 초입에 해당하지 않나 싶다. 아래는 풀이를 생각한 순서이다. 1. 출력은 맞지만 시간초과 풀이 2. 정답 풀이 먼저, 제한도 까다롭지 않고 시간도 2초나 주어졌기 때문에 풀어보는 것이 중요하다고 생각했다. N이 2,000일 때, 2차원 배열의 데이터 개수는 2,000 x 2,000 = 4,000,000 이다. O(n)에 해당하는 과정은 시간초과를 발생시키지 않으나, 폭탄을 찾기 위해서 자기 자신의 위치(arr[i][j])에서 가능한 모든 경우의 수를 찾으려고 하면 시간초과가 뜰 것이다. 여기까지 생각하고, 규칙을 생각해보았다. 예제 입력과 예제 출력들을 보면서, 가장 외곽에 위치한 배열의 원소들부터 채워가면 될 것이라고 생각했다. 먼저, (0, 0)부터 시작한다고 하면, 시계방향으로 테두리를 돌면서 1칸씩 안쪽으로 진행해볼 수 있다. 그러나 가장 첫 줄을 시물레이션 해보면,  우리가 이중 for문을 통해 배열을 탐색하는 일반적인 과정으로도 채워나갈 수 있다는 것을 알게 되었다. 왜냐하면, 폭탄이 있을 수 없는 구역이 존재하기 때문이다. (m = 1의 경우는 예외) m이 1인 경우에는 그대로 절댓값으로 바꿔서 출력하면 되고, m이 3이상의 홀수인 경우에 생각해보면, 외곽 테두리에 ...