본문 바로가기
카테고리 없음

컴퓨터 비전 (Computer vision) 정의, 구성, 결론

by 여행지기59 2023. 12. 23.

컴퓨터 비전(Computer vision) 이미지
컴퓨터 비전(Computer vision) 이미지

 

1. 컴퓨터 비전(Computer vision) 정의

컴퓨터 비전은 컴퓨터가 우리 주변 세계의 시각 정보를 해석하고 이해할 수 있도록 하는 알고리즘과 기술을 개발하는 학제 간 분야입니다. 컴퓨터 비전은 컴퓨터 과학, 수학, 공학을 아우르는 연구 분야로, 기술의 급속한 발전과 대규모 데이터 세트의 가용성 증가로 인해 최근 몇 년 동안 더욱 주목받고 있습니다. 컴퓨터 비전은 물체 인식, 장면 재구성, 이미지 분할, 동작 추정 등 다양한 문제를 해결하는 데 사용할 수 있습니다. 컴퓨터 비전의 응용 분야는 다양하며 의료, 교통, 보안, 엔터테인먼트 등 여러 도메인에 걸쳐 있습니다.

2. 컴퓨터 비전 구성

1) 역사

컴퓨터 비전의 역사는 연구자들이 이미지 처리 및 패턴 인식을 위한 알고리즘을 개발하기 시작한 1960년대 초로 거슬러 올라갑니다. 컴퓨터 비전의 초기 사례 중 하나는 1958년 프랭크 로젠블랫이 퍼셉트론 알고리즘을 개발한 것입니다. 퍼셉트론은 이미지의 패턴을 인식하는 방법을 학습할 수 있는 인공 신경망의 일종이었습니다. 이후 연구자들은 이미지 처리 및 패턴 인식을 위한 알고리즘을 지속적으로 개발했습니다. 가장 중요한 돌파구 중 하나는 1970년 데이비드 마가 이미지에서 가장자리와 모서리 등 낮은 수준의 특징을 추출할 수 있는 '원시 스케치'라는 개념을 제안했을 때였습니다. 1980년대에는 이미지에서 선과 원을 감지하는 Hough 변환과 동영상에서 움직이는 물체를 추적하는 칼만 필터 등 컴퓨터 비전을 위한 보다 정교한 알고리즘이 개발되었습니다. 1990년대에는 연구자들이 신경망과 의사 결정 트리와 같은 컴퓨터 비전을 위한 머신 러닝 알고리즘 개발에 더욱 집중하기 시작했습니다. 이러한 알고리즘을 통해 컴퓨터는 대규모 데이터 세트를 학습하고 시각 정보에 대해 보다 정확한 예측을 할 수 있게 되었습니다. 2000년대 이후에도 컴퓨터 비전 분야는 사물 인식, 장면 이해, 이미지 분할과 같은 작업을 위한 새로운 알고리즘과 기법이 개발되면서 계속 성장하고 있습니다. 대규모 데이터 세트의 가용성 증가와 더욱 강력한 컴퓨팅 하드웨어의 개발도 컴퓨터 비전의 발전에 중요한 역할을 했습니다.

 

2) 이미지 처리

이미지 처리는 다양한 알고리즘과 기술을 사용하여 디지털 이미지를 조작하는 것입니다. 여기에는 이미지 필터링, 이미지 향상 및 이미지 분할과 같은 작업이 포함될 수 있습니다. 이미지 필터링에는 이미지의 픽셀을 수정하여 노이즈를 제거하거나 특정 기능을 향상시키는 작업이 포함됩니다. 일반적인 이미지 필터 유형에는 노이즈를 줄이는 데 사용되는 스무딩 필터와 이미지의 가장자리를 강조하는 데 사용되는 가장자리 감지 필터가 있습니다. 이미지 향상에는 밝기, 대비 및 색상 균형을 조정하여 이미지의 시각적 품질을 개선하는 것이 포함됩니다. 이미지에서 특정 기능의 가시성을 개선하거나 이미지를 미적으로 더 보기 좋게 만드는 데 유용할 수 있습니다. 이미지 분할은 이미지의 특성에 따라 이미지를 영역 또는 세그먼트로 나누는 작업입니다. 이미지에서 물체를 식별하거나 전경과 배경을 분리하는 데 유용할 수 있습니다.

 

3) 특징

추출 특징 추출은 이미지에서 추가 분석이나 분류에 사용할 수 있는 중요한 특징을 식별하고 추출하는 작업입니다. 여기에는 가장자리와 모서리와 같은 낮은 수준의 특징뿐만 아니라 모양과 텍스처와 같은 높은 수준의 특징도 포함될 수 있습니다.

 

4) 머신 러닝

머신 러닝은 데이터로부터 학습할 수 있는 알고리즘을 개발하는 인공 지능의 하위 분야입니다. 컴퓨터 비전의 맥락에서 머신 러닝 알고리즘은 이미지의 패턴을 인식하고 시각 정보를 예측하는 데 사용됩니다.

 

5) 딥 러닝

딥 러닝은 여러 계층으로 구성된 인공 신경망을 개발하는 머신 러닝의 하위 분야입니다. 딥러닝은 최근 몇 년 동안 컴퓨터 비전에 혁명을 일으켜 컴퓨터가 방대한 데이터 세트로부터 학습하고 광범위한 시각 인식 작업에서 최첨단 성능을 달성할 수 있게 해줍니다.

 

6) 컨볼루션 신경망(CNN)

컨볼루션 신경망(CNN)은 이미지 처리 작업에 특히 적합한 딥러닝 모델의 일종입니다. CNN은 인간의 시각 시스템 구조에서 영감을 얻었으며 여러 계층의 컨볼루션 및 풀링 연산으로 구성됩니다. 컨볼루션 레이어는 입력 이미지 위에 필터를 슬라이딩하고 각 위치에서 도트 곱을 계산하는 컨볼루션이라는 수학적 연산을 수행합니다. 컨볼루션 레이어의 출력은 입력 이미지의 다양한 측면을 강조하는 특징 맵 세트입니다. 풀링 레이어는 각 로컬 영역 내에서 최대값 또는 평균값을 취하여 특징 맵을 다운샘플링합니다. 이렇게 하면 피처 맵의 공간 해상도가 낮아지고 입력의 작은 변화에도 네트워크를 더욱 강력하게 만들 수 있습니다.

 

7) 완전 연결 레이어

완전 연결 레이어는 합성곱 레이어의 출력을 네트워크의 출력 레이어에 연결하여 최종 예측을 생성하는 데 사용됩니다. 이러한 레이어는 일반적으로 소프트맥스 활성화 함수를 사용하여 가능한 클래스에 대한 확률 분포를 생성합니다. CNN을 훈련하려면 예측된 출력과 실제 출력의 차이를 측정하는 손실 함수를 최소화하기 위해 네트워크의 가중치를 최적화해야 합니다. 이는 일반적으로 확률적 경사 하강과 같은 최적화 알고리즘을 사용하여 수행됩니다.

 

8) 물체 감지

객체 감지는 이미지 또는 비디오에서 객체를 식별하고 위치를 파악하는 작업입니다. 이 작업은 일반적으로 선택적 검색 또는 Faster R-CNN과 같은 영역 제안 알고리즘을 사용하여 이미지에서 후보 영역 집합을 먼저 생성하여 수행됩니다. 그런 다음 이러한 후보 영역은 CNN을 통과하여 각 영역에 대한 특징 벡터 집합을 생성합니다. 그런 다음 이러한 특징 벡터를 사용하여 각 영역에 물체가 포함되어 있는지 여부를 분류하고 물체의 경계 상자 좌표를 예측합니다. 물체 감지는 물체의 모양, 포즈, 스케일의 가변성과 폐색 및 혼란의 존재로 인해 까다로운 작업입니다.

 

9) 이미지 분할

이미지 분할은 이미지를 의미 있는 영역 또는 세그먼트로 나누는 작업입니다. 임계값, 에지 감지, 클러스터링 등 다양한 기술을 사용하여 이 작업을 수행할 수 있습니다. 이미지 분할에 가장 널리 사용되는 접근 방식 중 하나는 컨볼루션 신경망을 사용하는 것입니다. 특히 의미론적 세분화에는 이미지의 각 픽셀에 레이블을 할당하는 고밀도 레이블 맵을 예측하는 것이 포함되며, 인스턴스 세분화에는 이미지의 개별 개체를 식별하고 세분화하는 것이 포함됩니다.

 

10) 생성 모델

생성 모델은 주어진 데이터 세트와 유사한 새로운 샘플을 생성할 수 있는 머신 러닝 모델 클래스입니다. 컴퓨터 비전의 맥락에서 제너레이티브 모델은 이미지 합성, 이미지 인페인팅, 이미지 간 번역과 같은 작업에 사용할 수 있습니다. 가장 널리 사용되는 생성 모델 유형 중 하나는 새로운 샘플을 생성하는 생성기 네트워크와 실제 샘플과 가짜 샘플을 구별하는 판별자 네트워크로 구성된 생성적 적대 신경망(GAN)입니다.

 

11) 애플리케이션

컴퓨터 비전은 다양한 영역에서 수많은 응용 분야를 가지고 있습니다. 가장 눈에 띄는 응용 분야는 다음과 같습니다

- 자율 주행 차량 :  컴퓨터 비전은 자율주행 차량의 핵심 기술로, 자율주행 차량이 실시간으로 장애물을 탐색하고 피할 수 있게 해줍니다. 여기에는 물체 감지, 차선 감지, 보행자 추적과 같은 작업이 포함됩니다. 

- 의료 영상 : 컴퓨터 비전은 종양 감지, 이미지 분할, 질병 진단과 같은 작업을 위해 의료 영상에 사용됩니다. 이는 의료 진단 및 치료의 정확성과 효율성을 개선하는 데 도움이 될 수 있습니다.

- 감시 및 보안 : 컴퓨터 비전은 얼굴 인식, 물체 추적, 활동 인식과 같은 감시 및 보안 애플리케이션에 사용됩니다. 이는 공공 안전을 개선하고 범죄 활동을 예방하는 데 도움이 될 수 있습니다.

- 엔터테인먼트 :  컴퓨터 비전은 엔터테인먼트 산업에서 특수 효과, 애니메이션, 가상 현실과 같은 작업에 사용됩니다. 이는 시청자에게 더욱 몰입감 있고 매력적인 경험을 제공하는 데 도움이 될 수 있습니다.

3. 결론

결론적으로 컴퓨터 비전은 빠르게 성장하고 있는 분야로, 많은 산업과 일상 생활에 혁신을 일으킬 잠재력을 가지고 있습니다. 딥러닝의 발전과 대규모 데이터 세트의 가용성으로 인해 컴퓨터 비전 모델은 점점 더 정확해지고 다용도로 활용되고 있습니다. 기술이 계속 발전함에 따라 의료, 농업, 제조 등의 분야에서 컴퓨터 비전이 더 많이 활용될 것으로 예상됩니다. 그러나 모든 기술이 그렇듯이 윤리적 및 개인정보 보호와 관련된 잠재적인 문제도 해결해야 합니다. 전반적으로 컴퓨터 비전은 사회에 큰 혜택을 줄 수 있는 잠재력을 가지고 있으며, 앞으로 어떤 새로운 개발과 애플리케이션이 등장할지 지켜보는 것은 흥미로울 것입니다.