패턴 인식 이론의 결정적인 규칙. 패턴 인식 문제의 예

→

3장: 패턴 인식 및 의사결정 방법의 분석적 검토

패턴 인식 이론 및 제어 자동화

적응형 패턴 인식의 주요 작업

인식은 입력과 출력이 있는 일부 정보 변환기(지능형 정보 채널, 인식 시스템)에 의해 구현되는 정보 프로세스입니다. 시스템의 입력은 제시된 객체가 어떤 특성을 가지고 있는지에 대한 정보입니다. 시스템 출력에는 인식된 개체가 어떤 클래스(일반화된 이미지)에 속하는지에 대한 정보가 표시됩니다.

자동화된 패턴 인식 시스템을 만들고 운영할 때 여러 가지 문제가 해결됩니다. 이러한 작업을 간단하고 간단하게 고려해 보겠습니다. 다른 저자는 이러한 문제에 대해 동일한 공식을 가지고 있으며 세트 자체는 어느 정도 특정 수학적 모델에 따라 달라지기 때문에 일치하지 않습니다. 또한 특정 인식 모델의 일부 문제에는 해결책이 없으므로 제기되지 않습니다.

주제 영역을 공식화하는 작업

본질적으로 이 작업은 코딩 작업입니다. 객체의 특정 구현이 속할 수 있는 일반화된 클래스 목록과 이러한 객체가 원칙적으로 가질 수 있는 특성 목록이 컴파일됩니다.

훈련 샘플을 구성하는 작업

트레이닝 세트는 기능 언어로 된 특정 객체 구현에 대한 설명을 포함하고 이러한 객체가 특정 인식 클래스에 속하는지에 대한 정보가 보충된 데이터베이스입니다.

인식시스템 훈련과제

훈련 샘플은 이 클래스와 다른 클래스에 속하는 훈련 샘플의 객체가 어떤 특징을 가지고 있는지에 대한 정보의 일반화를 기반으로 인식 클래스의 일반화된 이미지를 형성하는 데 사용됩니다.

특징 공간의 차원을 줄이는 문제

인식 시스템을 훈련한 후(클래스별 특성의 빈도 분포에 대한 통계 획득) 인식 문제를 해결하기 위한 각 특성의 값을 결정하는 것이 가능해집니다. 그 후에는 가장 가치가 낮은 기능을 기능 시스템에서 제거할 수 있습니다. 그런 다음 일부 기능을 제거한 결과 클래스별 나머지 기능 분포 통계가 변경되므로 인식 시스템을 다시 훈련해야 합니다. 이 프로세스는 반복될 수 있습니다. 반복적이어야 합니다.

인식 작업

인식된 샘플의 개체가 인식되며, 특히 하나의 개체로 구성될 수 있습니다. 인식 샘플은 훈련 샘플과 유사하게 형성되지만 개체가 클래스에 속하는지에 대한 정보는 포함하지 않습니다. 이는 인식 프로세스 중에 정확하게 결정되기 때문입니다. 각 객체를 인식한 결과는 인식된 객체와 유사한 정도의 내림차순으로 모든 인식 클래스를 분포 또는 목록으로 나타냅니다.

인식 품질 관리 문제

인식 후에는 그 타당성이 확립될 수 있습니다. 훈련 샘플의 객체에 대해서는 자신이 속한 클래스를 간단히 알 수 있으므로 즉시 수행할 수 있습니다. 다른 개체의 경우 이 정보는 나중에 얻을 수 있습니다. 어떤 경우든 모든 인식 클래스에 대한 실제 평균 오류 확률이 결정될 수 있을 뿐만 아니라 인식된 객체를 특정 클래스에 할당할 때 오류가 발생할 확률도 결정될 수 있습니다.

인식 결과는 인식 품질에 관해 이용 가능한 정보를 고려하여 해석되어야 합니다.

적응 문제

품질 관리 절차의 결과 만족스럽지 못한 것으로 판단되면 잘못 인식된 개체에 대한 설명을 인식 샘플에서 훈련 샘플로 복사하고 적절한 분류 정보를 추가하여 결정 규칙을 다시 형식화하는 데 사용할 수 있습니다. , 즉. 고려. 또한 이러한 객체가 기존 인식 클래스에 속하지 않아 잘못된 인식이 발생할 수 있는 경우 이 목록을 확장할 수 있습니다. 결과적으로 인식 시스템은 이러한 객체에 적응하고 적절하게 분류하기 시작합니다.

역인식 문제

인식 작업은 주어진 객체에 대해 알려진 특성을 기반으로 시스템이 이전에 알려지지 않은 클래스에 속하는지 확인하는 것입니다. 반대로 역 인식 문제에서는 주어진 인식 클래스에 대해 시스템이 이 클래스의 객체에 가장 특징적인 특징과 그렇지 않은 특징(또는 훈련 샘플의 어떤 객체가 이 클래스에 속하는지)을 설정합니다.

클러스터 및 구성 분석의 문제점

클러스터는 각 클러스터 내에서 가능한 한 유사하고 서로 다른 클러스터 간에는 가능한 한 다른 개체, 클래스 또는 기능의 그룹입니다.

구성(이 섹션에서 논의된 맥락에서)은 반대 클러스터의 시스템입니다. 따라서 어떤 의미에서 구성은 클러스터의 클러스터 분석 결과입니다.

군집분석에서는 객체(클래스, 특징) 간의 유사성과 차이점 정도를 정량적으로 측정하고, 이 정보를 분류에 활용합니다. 군집 분석의 결과는 객체를 군집으로 분류하는 것입니다. 이 분류는 의미 네트워크의 형태로 표현될 수 있습니다.

인지분석 과제

인지 분석에서는 클래스 또는 특성 간의 유사점과 차이점에 대한 정보가 연구자의 관심을 끄는 것이지 군집 및 구성 분석에서와 같이 분류에 사용하기 위한 것이 아닙니다.

동일한 기능이 두 인식 클래스의 특징이라면 이는 이 두 클래스의 유사성에 기여합니다. 클래스 중 하나에 대해 이 기능이 특징적이지 않으면 이것이 차이의 원인이 됩니다.

두 특성이 서로 상관관계가 있으면 어떤 의미에서는 하나의 특성으로 간주될 수 있고, 상관관계가 반대이면 다른 특성으로 간주될 수 있습니다. 이러한 상황을 고려하면, 서로 다른 클래스에 서로 다른 특성이 존재하는 것도 유사성과 차이점에 어느 정도 기여합니다.

인지분석의 결과는 인지도표의 형태로 표현될 수 있다.

패턴 인식 방법 및 특징

패턴 인식 방법의 분류 원리

패턴 인식은 현실 세계나 이상 세계에서 객체의 수치적 또는 상징적 표현에 대한 형식적 연산을 구성하고 적용하는 문제를 말하며, 그 결과는 이러한 객체 간의 등가 관계를 반영합니다. 동등 관계는 평가된 객체가 독립적인 의미 단위로 간주되는 모든 클래스에 속하는 것을 표현합니다.

인식 알고리즘을 구축할 때, 자신의 의미 있는 아이디어를 사용하거나 해결 중인 문제의 맥락에서 객체의 유사점과 차이점에 대한 외부 추가 정보를 사용하는 연구자가 등가 클래스를 지정할 수 있습니다. 그런 다음 그들은 "선생님과의 인정"에 대해 이야기합니다. 그렇지 않으면, 즉 자동화된 시스템이 외부 훈련 정보를 사용하지 않고 분류 문제를 해결하는 경우 자동 분류 또는 "비지도 인식"을 말합니다. 대부분의 패턴 인식 알고리즘에는 고성능 컴퓨터 기술을 통해서만 제공할 수 있는 매우 중요한 컴퓨팅 성능이 필요합니다.

다양한 저자(Yu.L. Barabash, V.I. Vasiliev, A.L. Gorelik, V.A. Skripkin, R. Duda, P. Hart, L.T. Kuzin, F.I. Peregudov, F.P. Tarasenko, F.E. Temnikov, J. Tu, R. Gonzalez, P. Winston, K. Fu, Ya.Z. Tsypkin 등)은 패턴 인식 방법의 다른 유형을 제공합니다. 일부 저자는 모수적 방법, 비모수적 방법, 경험적 방법을 구별하고 다른 저자는 역사적으로 확립된 학파와 이 분야의 경향을 기반으로 방법 그룹을 식별합니다. 예를 들어, 인식 방법에 대한 학문적 개요를 제공하는 작업에서는 다음과 같은 패턴 인식 방법 유형이 사용됩니다.

분리 원리에 기초한 방법;
통계적 방법;
"잠재적 기능"을 기반으로 구축된 방법;
등급 계산 방법(투표)
명제 계산법, 특히 논리 대수학 장치에 기초한 방법.

이 분류는 패턴 인식의 형식적 방법의 차이에 기초하므로 전문가 시스템에서 완전하고 적절하게 개발된 인식에 대한 경험적 접근 방식을 고려하지 않습니다. 휴리스틱 접근법은 연구자의 형식화하기 어려운 지식과 직관을 기반으로 합니다. 이 경우, 연구자는 필요한 인식 효과를 달성하기 위해 시스템이 어떤 정보를 어떻게 사용해야 하는지 스스로 결정합니다.

다양한 세부 수준을 지닌 유사한 인식 방법 유형이 인식에 관한 많은 연구에서 발견됩니다. 동시에 알려진 유형학은 공식적인 패턴 인식 알고리즘을 사용하여 주제 영역에 대한 지식을 표현하는 방식의 특수성을 반영하는 매우 중요한 특성 하나를 고려하지 않습니다.

D.A. Pospelov(1990)는 지식을 표현하는 두 가지 주요 방법을 식별합니다.

의도적인, 속성(특징) 간의 연결 다이어그램 형태입니다.
특정 사실(객체, 예)의 도움으로 확장됩니다.

의도적 표현은 데이터의 구조를 설명하는 패턴과 연결을 포착합니다. 진단 작업과 관련하여 이러한 고정은 필요한 진단 결과를 가져오는 개체의 속성(특징)에 대한 작업을 정의하는 것으로 구성됩니다. 의도적 표현은 속성 값에 대한 연산을 통해 구현되며 특정 정보 사실(객체)에 대한 연산을 암시하지 않습니다.

결과적으로, 지식의 확장적 표현은 주제 영역의 특정 객체에 대한 설명 및 고정과 연관되며 작업에서 구현되며 그 요소는 통합 시스템으로서의 객체입니다.

지식의 의도적 표현과 외연적 표현, 그리고 인간 두뇌의 좌반구와 우반구의 활동을 뒷받침하는 메커니즘 사이에 유사점이 그려질 수 있습니다. 우반구가 주변 세계에 대한 전체적인 원형 표현을 특징으로 한다면, 좌반구는 이 세계의 속성 간의 연결을 반영하는 패턴으로 작동합니다.

위에서 설명한 지식을 표현하는 두 가지 기본 방법을 통해 패턴 인식 방법의 다음 분류를 제안할 수 있습니다.

기능을 사용한 작업을 기반으로 하는 의도적인 방법입니다.
객체 작업을 기반으로 하는 확장 메서드.

특히 이 두 가지(단지 두 가지) 인식 방법 그룹, 즉 기호를 사용하는 그룹과 대상을 사용하는 그룹의 존재는 매우 자연스럽다는 점을 특히 강조해야 합니다. 이러한 관점에서 볼 때, 이러한 방법 중 어느 것도 다른 방법과 별도로 취하면 주제 영역을 적절하게 반영할 수 없습니다. 저자에 따르면 N. Bohr의 의미에서 이러한 방법 사이에는 보완 관계가 있으므로 유망한 인식 시스템은 둘 중 어느 하나가 아닌 두 가지 방법의 구현을 제공해야 합니다.

따라서 D. A. Pospelov가 제안한 인식 방법의 분류는 일반적으로 인간의 인지 방식의 기본 패턴을 기반으로 하며, 이는 다른 분류에 비해 완전히 특별한(특권) 위치에 위치하며, 이러한 배경에 비해 더 가볍고 인공의.

의도적인 방법

인텐셔널 방법의 특징은 패턴 인식 알고리즘을 구성하고 적용할 때 특징의 다양한 특성과 그 연결을 작업 요소로 사용한다는 것입니다. 이러한 요소는 작업이 수행되는 개별 값 또는 특성 값의 간격, 평균값 및 분산, 특성 관계 행렬 등이 될 수 있으며 분석적 또는 구성적 형식으로 표현됩니다. 동시에 이러한 방법의 개체는 통합 정보 단위로 간주되지 않지만 해당 속성의 상호 작용 및 동작을 평가하기 위한 지표 역할을 합니다.

패턴 인식을 위한 의도적 방법 그룹은 광범위하며 하위 클래스로의 구분은 어느 정도 조건부입니다.

특성값의 분포 밀도 추정을 기반으로 하는 방법

이러한 패턴 인식 방법은 연구 대상이 일부 법칙에 따라 특징 공간에 분포된 다차원 확률 변수의 구현으로 간주되는 고전적인 통계 결정 이론에서 차용되었습니다. 이는 특정 인식 클래스에 속하는 개체의 사전 확률과 특징 벡터 값의 조건부 분포 밀도에 호소하는 베이지안 의사 결정 체계를 기반으로 합니다. 이러한 방법은 다차원 특징 공간의 다양한 영역에서 우도 비율을 결정하는 것으로 요약됩니다.

특징값의 분포 밀도를 추정하는 방법 그룹은 판별 분석 방법과 직접적인 관련이 있습니다. 의사 결정에 대한 베이지안 접근 방식은 현대 통계에서 가장 발전된 소위 모수적 방법 중 하나이며, 분포 법칙(이 경우 정규 법칙)의 분석적 표현은 알려진 것으로 간주되며 소수의 매개 변수( 평균값과 공분산 행렬의 벡터)를 추정해야 합니다.

이러한 방법을 사용할 때 가장 어려운 점은 지역 확률 분포 밀도의 추정치를 계산하기 위해 전체 훈련 표본을 기억해야 한다는 점과 훈련 표본의 비대표성에 대한 높은 민감도입니다.

의사결정 기능 클래스에 대한 가정을 기반으로 한 방법

이 방법 그룹에서는 결정 기능의 일반적인 형태가 알려진 것으로 간주되며 해당 품질의 기능이 지정됩니다. 이 기능을 기반으로 훈련 시퀀스를 사용하여 결정 기능의 최상의 근사치를 찾습니다. 가장 일반적인 것은 선형 및 일반화된 비선형 다항식 형태의 의사결정 함수 표현입니다. 결정 규칙 품질 기능은 일반적으로 분류 오류와 관련이 있습니다.

결정 함수 클래스에 대한 가정을 기반으로 한 방법의 주요 장점은 극값 검색 문제로서 인식 문제의 수학적 공식이 명확하다는 것입니다. 이 그룹의 다양한 방법은 광범위한 의사결정 규칙 품질 기능과 사용된 극한 검색 알고리즘으로 설명됩니다. 특히 뉴턴 알고리즘, 퍼셉트론 유형 알고리즘 등을 포함하여 고려 중인 알고리즘의 일반화는 확률론적 근사 방법입니다.

특히 선형 결정 규칙 그룹에서 경사 극값 검색 알고리즘의 기능은 상당히 잘 연구되었습니다. 이러한 알고리즘의 수렴은 인식된 객체 클래스가 컴팩트한 기하학적 구조로 특징 공간에 표시되는 경우에만 입증되었습니다.

전역 극값에 대한 해의 수렴에 대한 엄격한 수학적 증명이 없는 알고리즘을 사용하면 충분히 높은 품질의 결정 규칙을 얻을 수 있습니다. 이러한 알고리즘에는 진화 모델링의 방향을 나타내는 대규모 경험적 프로그래밍 절차 그룹이 포함됩니다. 진화 모델링은 자연에서 빌린 생체 공학적 방법입니다. 이는 복잡한 대상의 의미 있는 모델링 프로세스를 진화의 현상학적 모델링으로 대체하기 위해 알려진 진화 메커니즘의 사용을 기반으로 합니다. 패턴 인식에서 진화 모델링의 잘 알려진 대표적인 방법은 MGUA(Group Accounting of Argument) 방법입니다. GMDH의 기본은 자기 조직화의 원리이며, GMDH 알고리즘은 대량 선택 방식을 재현합니다.

그러나 이 경우 실제 목표 달성에는 인식되는 대상의 성격에 대한 새로운 지식의 추출이 수반되지 않습니다. 이러한 지식, 특히 속성(특징)의 상호작용 메커니즘에 대한 지식을 추출할 가능성은 여기서 근본적으로 결정 기능의 선택된 형태로 고정된 해당 상호작용의 주어진 구조에 의해 제한됩니다.

부울 메서드

패턴 인식의 논리적 방법은 논리 대수학 장치를 기반으로 하며 개별 기능뿐만 아니라 기능 값의 조합에도 포함된 정보를 사용하여 작동할 수 있습니다. 이러한 방법에서는 모든 속성의 값이 기본 이벤트로 간주됩니다.

가장 일반적인 형태에서 논리적 방법은 논리적 패턴의 훈련 샘플을 통한 검색 유형과 특정 논리적 결정 규칙 시스템의 형성(예: 기본 이벤트의 접속사 형태)으로 특징지어질 수 있습니다. 그 자체의 무게가 있습니다. 논리적 방법 그룹은 다양하며 분석의 복잡성과 깊이가 다양한 방법을 포함합니다. 이분형(부울) 특성의 경우 소위 트리형 분류기, 막다른 테스트 방법, "Bark" 알고리즘 등이 널리 사용됩니다.

패턴 인식의 다른 논리적 방법과 마찬가지로 "Kora" 알고리즘은 접속사를 선택할 때 완전한 검색이 필요하기 때문에 계산 집약적입니다. 따라서 논리적 방법을 사용할 때 계산 프로세스의 효율적인 구성에 대한 요구가 높으며 이러한 방법은 상대적으로 작은 크기의 특징 공간 및 강력한 컴퓨터에서만 잘 작동합니다.

언어적(구조적) 방법

패턴 인식의 언어적 방법은 인식된 개체의 속성 집합을 설명하는 데 사용할 수 있는 언어를 생성하는 특수 문법의 사용을 기반으로 합니다.

다양한 객체 클래스에 대해 파생되지 않은(원자) 요소(하위 이미지, 속성) 및 이들 간의 가능한 관계가 식별됩니다. 문법은 파생되지 않은 요소로부터 객체를 구성하는 규칙을 나타냅니다.

따라서 각 개체는 어떤 방식으로든, 즉 일부 “언어”의 “문장”으로 서로 “연결된” 비파생 요소의 모음입니다. 나는 특히 이 사상의 매우 중요한 이념적 가치를 강조하고 싶습니다.

"문장"을 구문론적으로 분석함으로써 구문론적 "정확성"을 결정하거나, 동등하게 클래스를 설명하는 일부 고정 문법이 객체의 기존 설명을 생성할 수 있는지 여부를 결정합니다.

그러나 특정 언어를 생성하는 특정 명령문 집합(문장-객체 설명)에서 문법을 재구성(정의)하는 작업은 형식화하기 어렵습니다.

확장 방법

이 그룹의 방법에서는 의도적인 방향과 달리 연구된 각 대상에 어느 정도 독립적인 진단적 중요성이 부여됩니다. 기본적으로 이러한 방법은 사람들을 하나의 지표 또는 다른 지표로 순위가 매겨진 개체 체인이 아니라 각각 개인적이고 특별한 진단 가치를 갖는 통합 시스템으로 간주하는 임상 접근 방식에 가깝습니다. 연구 대상에 대한 이러한 신중한 태도는 객체를 속성의 행동 패턴을 탐지하고 기록하는 목적으로만 사용하는 의도적 방향 방법을 사용할 때 발생하는 각 객체에 대한 정보를 배제하거나 손실하는 것을 허용하지 않습니다.

논의된 방법을 사용한 패턴 인식의 주요 작업은 객체의 유사점과 차이점을 결정하는 작업입니다. 지정된 메소드 그룹의 개체는 진단 선례의 역할을 합니다. 또한 특정 작업의 조건에 따라 개별 선례의 역할은 주요 및 결정 프로세스에서 인식 프로세스의 매우 간접적인 참여에 이르기까지 가장 넓은 범위 내에서 달라질 수 있습니다. 결과적으로, 문제의 조건은 성공적인 솔루션을 위해 다양한 수의 진단 선례의 참여를 요구할 수 있습니다. 즉, 인식된 각 클래스에서 하나부터 전체 표본 크기까지, 그리고 객체의 유사성과 차이에 대한 측정을 계산하는 다양한 방법까지 다양합니다. . 이러한 요구 사항은 확장 메서드를 하위 클래스로 추가로 나누는 방법을 설명합니다.

프로토타입과의 비교방법

이는 가장 간단한 확장 인식 방법입니다. 예를 들어, 인식된 클래스가 컴팩트한 기하학적 그룹화로 특징 공간에 표시되는 경우에 사용됩니다. 이 경우 일반적으로 클래스의 기하학적 그룹화 중심(또는 중심에 가장 가까운 객체)이 프로토타입 지점으로 선택됩니다.

알려지지 않은 객체를 분류하기 위해서는 가장 가까운 프로토타입을 찾고, 해당 객체는 이 프로토타입과 동일한 클래스에 속합니다. 분명히 이 방법에서는 일반화된 클래스 이미지가 생성되지 않습니다.

근접성을 측정하는 방법으로 다양한 유형의 거리를 사용할 수 있습니다. 종종 이분법적 특징의 경우 해밍 거리(Hamming distance)가 사용되며, 이 경우 유클리드 거리의 제곱과 같습니다. 이 경우 객체 분류를 위한 결정 규칙은 선형 결정 함수와 동일합니다.

이 사실은 특히 주목되어야 한다. 이는 데이터 구조에 대한 정보의 프로토타입과 속성 표현 간의 연결을 명확하게 보여줍니다. 위의 표현을 사용하면 예를 들어 이분형 특성 값의 선형 함수인 기존 측정 척도를 가상 진단 프로토타입으로 고려할 수 있습니다. 결과적으로 인식된 클래스의 공간 구조 분석을 통해 기하학적 컴팩트성에 대한 결론을 도출할 수 있다면 이러한 각 클래스를 실제로 선형 진단 모델과 동일한 하나의 프로토타입으로 대체하는 것으로 충분합니다.

물론 실제로 상황은 설명된 이상적인 예와 다른 경우가 많습니다. 프로토타입 진단 클래스와의 비교를 기반으로 한 인식 방법을 적용하려는 연구자는 어려운 문제에 직면합니다.

첫째, 이는 객체 분포의 공간 구성을 크게 변경할 수 있는 근접성 측정(미터법)의 선택입니다. 둘째, 독립적인 문제는 실험 데이터의 다차원 구조를 분석하는 것입니다. 이 두 가지 문제는 실제 문제의 특징인 특징 공간의 고차원성 조건에서 연구자에게 특히 심각합니다.

k 최근접이웃 방법

판별 분석 문제를 해결하기 위한 k-최근접 이웃 방법은 1952년에 처음 제안되었습니다. 다음과 같습니다.

알려지지 않은 객체를 분류할 때, 인식된 클래스에 이미 알려진 멤버십을 가진 다른 객체(가장 가까운 이웃)의 특징 공간에서 기하학적으로 가장 가까운 주어진 수(k)를 찾습니다. 알 수 없는 개체를 특정 진단 클래스에 할당하는 결정은 간단한 투표 수를 사용하여 가장 가까운 이웃의 알려진 소속에 대한 정보를 분석하여 이루어집니다.

처음에는 우도비를 추정하기 위한 비모수적 방법으로 k-최근접 이웃 방법을 고려했습니다. 이 방법의 경우 최적의 베이지안 분류기와 비교하여 효율성에 대한 이론적 추정치를 얻었습니다. k-최근접 이웃 방법의 점근적 오류 확률은 베이즈 규칙의 오류를 두 배 이상 초과하지 않는 것으로 입증되었습니다.

패턴 인식을 위해 k-최근접 이웃 방법을 사용할 때 연구자는 진단된 객체의 근접성을 결정하기 위한 메트릭을 선택하는 어려운 문제를 해결해야 합니다. 특징 공간의 차원이 높은 조건에서 이러한 문제는 이 방법의 복잡성으로 인해 극도로 악화되며 이는 고성능 컴퓨터에서도 중요해집니다. 따라서 여기에는 프로토타입과의 비교 방법과 마찬가지로 실험 데이터의 다차원 구조를 분석하여 진단 클래스를 나타내는 객체의 수를 최소화하는 창의적인 문제를 해결하는 것이 필요하다.

훈련 표본(진단 선례)의 객체 수를 줄여야 한다는 점은 훈련 표본의 대표성을 감소시키기 때문에 이 방법의 단점입니다.

등급 계산 알고리즘(“투표”)

평가 계산 알고리즘(ABO)의 작동 원리는 주어진 기능 세트의 하위 집합 시스템인 기능 앙상블 시스템에 따라 인식된 개체와 참조 개체의 "근접성"을 특성화하는 우선 순위(유사성 점수)를 계산하는 것입니다. .

이전에 논의된 모든 방법과 달리 견적 계산 알고리즘은 근본적으로 새로운 방식으로 개체 설명과 함께 작동합니다. 이러한 알고리즘의 경우 객체는 특징 공간의 매우 다른 하위 공간에 동시에 존재합니다. ABO 클래스는 기능을 사용하여 논리적인 결론을 내립니다. 어떤 기능 조합이 가장 유익한지 항상 알 수 없기 때문에 ABO에서는 가능한 모든 또는 특정 조합을 비교하여 개체의 유사도를 계산합니다. 개체 설명에 포함된 기능입니다.

저자는 사용된 기능 조합(하위 공간)을 지원 세트 또는 객체의 부분 설명 세트라고 부릅니다. 인식된 객체와 참조 객체라고 불리는 훈련 샘플의 객체(알려진 분류 포함) 사이의 일반화된 근접성 개념이 도입되었습니다. 이 근접성은 부분 설명 세트에서 계산된 인식된 객체와 참조 객체의 근접성의 조합으로 표현됩니다. 따라서 ABO는 k-최근접 이웃 방법의 확장으로, 객체의 근접성은 주어진 하나의 특징 공간에서만 고려됩니다.

ABO의 또 다른 확장은 이러한 알고리즘에서 객체의 유사성과 차이점을 결정하는 작업이 파라메트릭으로 공식화되고 훈련 세트를 기반으로 ABO를 설정하는 단계가 강조된다는 것입니다. 매개변수가 선택되었습니다. 품질 기준은 인식 오류이며 문자 그대로 모든 것이 매개변수화됩니다.

개별 특성을 기반으로 객체의 근접성을 계산하는 규칙;
특징 부분 공간에서 객체의 근접성을 계산하기 위한 규칙;
진단 선례로서 특정 참고 대상의 중요성 정도;
인식된 개체와 진단 클래스의 유사성에 대한 최종 평가에 대한 각 참조 기능 세트의 기여도의 중요성.

ABO 매개변수는 임계값 및(또는) 지정된 구성 요소의 가중치 형식으로 지정됩니다.

AVO의 도움으로 연구 대상 개체에 대해 가능한 모든 작업을 구현할 수 있기 때문에 AVO의 이론적 기능은 다른 패턴 인식 알고리즘의 이론적 기능보다 낮지 않습니다.

그러나 일반적으로 그렇듯이 잠재적인 기능을 확장하는 것은 실제 구현, 특히 이러한 유형의 알고리즘을 구성(조정)하는 단계에서 큰 어려움에 직면합니다.

ABO의 잘린 버전으로 해석될 수 있는 k-최근접 이웃 방법을 논의할 때 앞서 몇 가지 어려움이 지적되었습니다. 또한 파라메트릭 형태로 고려될 수 있으며 선택한 유형의 가중치 메트릭을 찾는 문제를 줄일 수 있습니다. 동시에 이미 고차원 문제의 경우 효과적인 계산 과정의 구성과 관련된 복잡한 이론적 질문과 문제가 발생합니다.

AVO의 경우 이러한 알고리즘의 기능을 최대한 활용하려고 하면 이러한 어려움이 몇 배로 증가합니다.

언급된 문제는 실제로 고차원 문제를 해결하기 위해 ABO를 사용할 때 일부 경험적 제한 사항 및 가정이 도입된다는 사실을 설명합니다. 특히 정신진단에서 ABO를 활용한 사례가 잘 알려져 있는데, ABO의 한 유형을 테스트한 사례인데, 이는 실제로 k-최근접 이웃법과 동일하다.

결정 규칙 집단

패턴 인식 방법에 대한 검토를 완료하기 위해 한 가지 접근 방식을 더 살펴보겠습니다. 이것이 소위 의사결정규칙집단(DRG)이다.

서로 다른 인식 알고리즘은 동일한 개체 샘플에서 다르게 나타나므로 이러한 알고리즘의 장점을 적응적으로 사용하는 합성 결정 규칙에 대한 의문이 자연스럽게 발생합니다. 종합 결정 규칙은 2단계 인식 체계를 사용합니다. 첫 번째 수준에서는 개인 인식 알고리즘이 작동하며 그 결과는 합성 블록의 두 번째 수준에서 결합됩니다. 이러한 통합의 가장 일반적인 방법은 특정 알고리즘의 역량 영역을 식별하는 것을 기반으로 합니다. 역량 영역을 찾는 가장 간단한 방법은 특정 과학의 전문적 고려 사항을 기반으로 속성 공간을 선험적으로 분할하는 것입니다(예: 특정 속성에 따라 표본을 계층화하는 것). 그런 다음 선택한 각 영역에 대해 자체 인식 알고리즘이 구축됩니다. 또 다른 방법은 특정 인식 알고리즘의 성공이 입증된 인식된 개체의 이웃으로 특징 공간의 로컬 영역을 결정하기 위한 형식 분석의 사용을 기반으로 합니다.

합성 블록을 구성하는 가장 일반적인 접근 방식은 특정 알고리즘의 결과 지표를 새로운 일반화된 결정 규칙을 구성하기 위한 초기 특성으로 간주합니다. 이 경우, 패턴인식에서 위의 인장방향과 확장방향의 방법을 모두 사용할 수 있다. 의사결정 규칙 그룹을 생성하는 문제를 해결하는 데 효과적인 것은 "Kora" 유형의 논리적 알고리즘과 추정 계산을 위한 알고리즘(ABO)입니다. 이는 소위 대수적 접근 방식의 기초를 형성하며 다음과 같은 연구와 건설적인 설명을 제공합니다. 기존의 모든 유형의 알고리즘이 적합한 프레임워크 내에서 인식 알고리즘.

패턴 인식 방법의 비교 분석

위에서 설명한 패턴 인식 방법을 비교하고 복잡한 시스템의 적응형 자동 제어 시스템에 대한 SDA 모델에 대해 섹션 3.3.3에 공식화된 요구 사항에 대한 적합성의 정도를 평가해 보겠습니다.

의도적 방향의 방법 그룹에서 실제 문제를 해결하려면 매개변수적 방법과 의사결정 기능의 형태에 대한 제안을 기반으로 하는 방법이 실용적인 가치가 있습니다. 모수적 방법은 지표 구성을 위한 전통적인 방법론의 기초를 형성합니다. 실제 문제에 이러한 방법을 적용하는 것은 데이터 구조에 대한 강력한 제한을 부과하는 것과 관련되어 있으며, 이는 해당 매개변수를 매우 대략적으로 추정하는 선형 진단 모델로 이어집니다. 의사결정 함수의 형태에 대한 가정을 기반으로 한 방법을 사용할 때 연구자는 선형 모델을 사용해야 합니다. 이는 실제 문제의 특징인 특징 공간의 높은 차원성 때문입니다. 이는 다항식 결정 함수의 정도를 높이면 구성원 수가 크게 증가하고 이에 따라 인식 품질도 향상됩니다. 따라서 의도적 인식 방법의 잠재적 적용 영역을 실제 문제에 투영함으로써 우리는 선형 진단 모델의 잘 발달된 전통적인 방법론에 해당하는 그림을 얻습니다.

진단 지표가 초기 특성의 가중 합으로 표현되는 선형 진단 모델의 특성은 잘 연구되었습니다. 이러한 모델의 결과(적절한 정규화 포함)는 연구 중인 개체에서 특징 공간의 일부 초평면까지의 거리로 해석되거나, 동등하게 이 공간의 일부 직선에 대한 개체의 투영으로 해석됩니다. 따라서 선형 모델은 서로 다른 진단 클래스의 객체가 매핑되는 특징 공간 영역의 단순한 기하학적 구성에만 적합합니다. 분포가 더 복잡할수록 이러한 모델은 기본적으로 실험 데이터 구조의 많은 기능을 반영할 수 없습니다. 동시에 이러한 기능은 귀중한 진단 정보를 제공할 수 있습니다.

동시에, 단순한 다차원 구조(특히 다차원 정규 분포)의 실제 문제에 나타나는 현상은 규칙이 아닌 예외로 간주되어야 합니다. 진단 클래스는 복잡한 외부 기준을 기반으로 형성되는 경우가 많으며, 이는 기능 공간에서 이러한 클래스의 기하학적 이질성을 자동으로 수반합니다. 이는 실제로 가장 자주 접하게 되는 "필수" 기준의 경우 특히 그렇습니다. 이러한 조건에서 선형 모델을 사용하면 실험 정보의 가장 "거친" 패턴만 포착할 수 있습니다.

확장 방법의 사용은 인식된 클래스 내에 다소 유사한 개체로 구성된 하나 이상의 그룹이 있어야 하고 서로 다른 클래스의 개체가 서로 다소 달라야 한다는 점을 제외하고는 실험 정보의 구조에 대한 어떤 가정과도 관련이 없습니다. 분명히, 훈련 샘플의 유한한 크기에 대해(다른 어떤 것도 될 수 없음), 이 요구 사항은 단순히 개체 간에 무작위 차이가 있기 때문에 항상 충족됩니다. 유사성 측정으로는 특징 공간 내 객체의 근접성(거리)에 대한 다양한 측정이 사용됩니다. 따라서 패턴 인식의 확장 방법을 효과적으로 사용하는 것은 지정된 근접성 측정값이 얼마나 잘 결정되는지와 훈련 샘플의 어떤 개체(알려진 분류가 있는 개체)가 진단 선례로 사용되는지에 따라 달라집니다. 이러한 문제를 성공적으로 해결하면 이론적으로 달성 가능한 인식 효율성 한계에 접근하는 결과를 얻을 수 있습니다.

패턴 인식의 확장 방법의 장점은 무엇보다도 실제 구현의 높은 기술적 복잡성으로 인해 상쇄됩니다. 고차원 특징 공간의 경우 가장 가까운 점 쌍을 찾는 단순해 보이는 작업이 심각한 문제가 됩니다. 또한 많은 저자들은 인식된 클래스를 나타내는 충분히 많은 수의 객체를 기억해야 한다는 점을 문제로 지적합니다.

이는 그 자체로는 문제가 되지 않지만, 각 객체를 인식할 때 훈련 세트에 있는 모든 객체에 대한 완전한 검색이 발생한다는 이유로 문제(예를 들어 k-최근접 이웃 방법)로 인식됩니다.

따라서 인식 클래스의 일반화된 이미지를 생성할 때 한 번만 수행되므로 인식 중에 훈련 샘플의 객체를 완전히 열거하는 문제를 제거하는 인식 시스템 모델을 적용하는 것이 좋습니다. 인식 자체 중에 식별된 객체는 인식 클래스의 일반화된 이미지와만 비교되며, 그 수는 고정되어 있고 훈련 샘플의 크기와 완전히 독립적입니다. 이 접근 방식을 사용하면 필요한 높은 품질의 일반화된 이미지가 달성될 때까지 훈련 샘플의 크기를 늘릴 수 있습니다. 이로 인해 인식 시간이 허용할 수 없을 정도로 증가할 수 있다는 우려 없이(이 모델의 인식 시간은 이미지에 의존하지 않기 때문입니다) 훈련 샘플의 크기).샘플).

확장적 인식 방법을 사용하는 데 따른 이론적 문제는 정보가 있는 특징 그룹을 검색하는 문제, 객체의 유사점과 차이점을 측정하기 위한 최적의 메트릭을 찾는 문제, 실험 정보의 구조를 분석하는 문제와 관련됩니다. 동시에 이러한 문제를 성공적으로 해결하면 효과적인 인식 알고리즘을 구축할 수 있을 뿐만 아니라 경험적 사실에 대한 확장적 지식에서 구조 패턴에 대한 내포적 지식으로 전환할 수 있습니다.

확장적 지식에서 내재적 지식으로의 전환은 형식적 인식 알고리즘이 이미 구축되고 그 효과가 입증된 단계에서 발생합니다. 그런 다음 결과적인 효율성을 달성하는 메커니즘을 연구합니다. 예를 들어 데이터의 기하학적 구조 분석과 관련된 이러한 연구는 특정 진단 클래스를 나타내는 개체를 하나의 일반적인 대표자(프로토타입)로 대체하는 것으로 충분하다는 결론에 도달할 수 있습니다. 이는 위에서 언급한 바와 같이 전통적인 선형 진단 척도를 지정하는 것과 동일합니다. 각 진단 클래스를 일부 하위 클래스의 전형적인 대표자로 개념화되는 여러 개체로 대체하는 것만으로도 충분할 수도 있습니다. 이는 선형 규모의 팬을 구성하는 것과 같습니다. 아래에서 설명할 다른 옵션도 있습니다.

따라서 인식 방법을 검토하면 현재 이론적으로 다양한 패턴 인식 방법이 개발되었음을 알 수 있습니다. 문헌에서는 이에 대한 자세한 분류를 제공합니다. 그러나 이러한 방법의 대부분에는 소프트웨어 구현이 없으며 이는 매우 자연스러운 현상입니다. 인식 방법 자체의 특성에 따라 "미리 결정"되었다고 말할 수도 있습니다. 이는 이러한 시스템이 전문 문헌 및 기타 정보 소스에서 거의 언급되지 않는다는 사실로 판단할 수 있습니다.

결과적으로, 실제(즉, 매우 중요한) 데이터 차원과 실제 현대 컴퓨터에서 실제 문제를 해결하기 위한 특정 이론적 인식 방법의 실제 적용 가능성에 대한 문제는 아직 충분히 개발되지 않았습니다.

위에서 언급한 상황은 수학적 모델의 복잡성이 시스템의 소프트웨어 구현 복잡성을 기하급수적으로 증가시키고 동일한 정도로 이 시스템이 실제로 작동할 가능성을 감소시킨다는 점을 기억하면 이해될 수 있습니다. 이는 실제로 상당히 단순하고 "투명한" 수학적 모델을 기반으로 하는 소프트웨어 시스템만이 시장에서 구현될 수 있음을 의미합니다. 따라서 자신의 소프트웨어 제품 복제에 관심이 있는 개발자는 순전히 과학적인 관점이 아닌 실용주의자로서 소프트웨어 구현 가능성을 고려하여 수학적 모델을 선택하는 문제에 접근합니다. 그는 모델이 가능한 한 단순해야 한다고 믿습니다. 즉, 더 낮은 비용과 더 나은 품질로 구현되어야 하며 작동해야 합니다(실질적으로 효과적이어야 함).

이와 관련하여, 동일한 클래스에 속하는 객체의 설명을 일반화하기 위한 메커니즘을 인식 시스템에서 구현하는 작업은 특히 관련성이 있는 것 같습니다. 컴팩트한 일반 이미지를 형성하는 메커니즘. 분명히 이러한 일반화 메커니즘을 사용하면 모든 차원의 훈련 샘플을 차원별로 미리 알려진 일반화된 이미지 데이터베이스로 "압축"할 수 있습니다. 이를 통해 프로토타입 비교 방법, k-최근접 이웃 방법, ABO 등 인식 방법으로는 공식화할 수 없는 여러 가지 문제를 제기하고 해결할 수도 있습니다.

작업은 다음과 같습니다.

일반화된 이미지의 정보 초상화에 대한 특징의 정보 기여를 결정하는 단계;
일반화된 이미지의 클러스터 구성 분석;
특징의 의미론적 부하 결정;
특징의 의미적 클러스터 구성 분석;
클래스 간의 일반화된 이미지와 특성 간의 의미 있는 비교(Merlin 다이어그램을 포함한 인지 다이어그램)

이러한 문제에 대한 해결책을 달성할 수 있게 만든 방법은 컴파일러가 해석기와 다른 것처럼 이를 기반으로 하는 유망 시스템을 다른 시스템과 구별합니다. 왜냐하면 이 유망 시스템에서 일반화된 이미지의 형성 덕분에 인식 시간의 독립성이 있기 때문입니다. 훈련 샘플의 크기가 달성됩니다. 충분한 통계에 대해 이야기할 수 있을 때 훈련 샘플의 이러한 차원에서 k-최근접 이웃 방법, ABO 및 KRP와 같은 방법에서 인식을 위한 컴퓨터 시간의 실질적으로 허용할 수 없는 비용을 초래하는 것은 이러한 의존성의 존재로 알려져 있습니다. .

인식 방법에 대한 간략한 개요를 마무리하기 위해 다음 매개변수에 따른 다양한 패턴 인식 방법에 대한 간략한 설명이 포함된 요약표(표 3.1)에 위 내용의 본질을 제시하겠습니다.

인식 방법 분류;
인식 방법의 적용 분야;
인식 방법의 한계 분류.

인식방법의 분류		적용분야	제한사항(단점)
집중 인식 방법	특징값의 분포 밀도(또는 객체의 유사점과 차이점) 추정을 기반으로 하는 방법	알려진 분포 문제(일반적으로 정상)에는 대규모 통계 수집이 필요합니다.	인식 중에 전체 훈련 샘플을 열거해야 할 필요성, 훈련 샘플 및 아티팩트의 비대표성에 대한 높은 민감도
	의사결정 기능 클래스에 대한 가정을 기반으로 한 방법	클래스는 잘 분리 가능해야 하며 특성 시스템은 정규 직교여야 합니다.	의사결정 함수의 유형을 미리 알고 있어야 합니다. 특성 간의 상관관계에 대한 새로운 지식을 고려할 수 없음
	부울 메서드		논리적 결정 규칙(접속사)을 선택할 때는 전체 검색이 필요합니다. 높은 계산 복잡성
	언어적(구조적) 방법	작은 차원의 특징 공간 문제	특정 문장 집합(객체 설명)에서 문법을 재구성(정의)하는 작업은 형식화하기 어렵습니다. 해결되지 않은 이론적 문제
확장 인식 방법	프로토타입과의 비교방법	작은 차원의 특징 공간 문제	거리 측정(미터법)에 대한 분류 결과의 의존도가 높습니다. 알 수 없는 최적 측정항목
	k 최근접이웃 방법		거리 측정(미터법)에 대한 분류 결과의 의존도가 높습니다. 인식하는 동안 훈련 샘플을 완전히 열거해야 합니다. 계산 노력
	AVO의 등급(투표) 계산 알고리즘	클래스 수 및 기능 수 측면에서 작은 차원의 문제	거리 측정(미터법)에 대한 분류 결과의 종속성입니다. 인식하는 동안 훈련 샘플을 완전히 열거해야 합니다. 방법의 높은 기술적 복잡성
	결정 규칙 집단(DRC)	클래스 수 및 기능 수 측면에서 작은 차원의 문제	개인 방법의 역량 영역과 개인 방법 자체를 결정하는 데 있어 방법의 매우 높은 기술적 복잡성, 해결되지 않은 이론적 문제의 수

표 3.1 - 인식 방법 분류 요약표, 적용 영역 비교 및 제한 사항

복잡한 시스템 제어 자동화에서 패턴 인식의 역할과 위치

자동화 제어 시스템은 제어 개체와 제어 시스템이라는 두 가지 주요 부분으로 구성됩니다.

제어 시스템은 다음 기능을 수행합니다.

제어 객체의 상태 식별;
제어 개체의 상태와 환경을 고려하여 관리 목표를 기반으로 한 제어 조치 개발
컨트롤 개체에 컨트롤 영향을 제공합니다.

패턴 인식은 어떤 물체의 상태를 식별하는 것 이상입니다.

결과적으로 제어 객체의 상태를 식별하는 단계에서 패턴 인식 시스템을 사용할 가능성은 매우 당연하고 자연스러워 보입니다. 그러나 이는 필요하지 않을 수도 있습니다. 따라서 자동 제어 시스템에서 인식 시스템을 사용하는 것이 바람직한 경우와 그렇지 않은 경우에 대한 의문이 제기됩니다.

문헌에 따르면 제어 개체의 상태를 식별하고 제어 작업을 개발하기 위한 하위 시스템의 이전에 개발된 최신 자동 제어 시스템 중 상당수는 제어로 무엇을 해야 할지 명확하고 매우 간단하게 결정하는 "직접 계산"의 결정론적 수학적 모델을 사용합니다. 특정 외부 매개변수가 있는 경우 개체입니다.

동시에 이러한 매개변수가 제어 개체의 특정 상태와 어떻게 관련되는지에 대한 질문은 제기되거나 해결되지 않습니다. 이 입장은 "기본적으로" 일대일 관계가 허용된다는 관점에 해당합니다. 따라서 "컨트롤 개체의 매개변수"와 "컨트롤 개체의 상태"라는 용어는 동의어로 간주되며, "컨트롤 개체의 상태"라는 개념은 전혀 명시적으로 도입되지 않습니다. 그러나 일반적인 경우 제어 개체의 관찰 가능한 매개 변수와 해당 상태 간의 관계는 본질적으로 동적이며 확률적이라는 것이 분명합니다.

따라서 전통적인 자동화 제어 시스템은 본질적으로 파라메트릭 제어 시스템입니다. 제어 개체의 상태가 아니라 관찰 가능한 매개변수만 관리하는 시스템입니다. 제어 조치에 대한 결정은 "맹목적으로"와 같은 시스템에서 이루어집니다. 현재 상태의 제어 개체와 환경에 대한 전체적인 이미지를 형성하지 않고 환경의 발전과 특정 제어 영향에 대한 제어 개체의 반응을 예측하지 않고 예측된 환경 영향과 동시에 작용합니다. .

본 연구에서 발전된 관점에서 현대적 의미의 "의사결정"이라는 용어는 전통적인 자동화 제어 시스템에 완전히 적용되기 어렵습니다. 사실 "의사 결정"은 최소한 현재 상태뿐만 아니라 역학 및 서로 및 제어 시스템과의 상호 작용을 통해 환경에 있는 개체에 대한 전체적인 비전을 전제로 합니다. 전체 시스템 개발을 위한 다양한 대안 옵션을 고려하고 특정 목표 기준에 따라 이러한 대안의 다양성을 축소(감소)합니다. 분명히 이 중 어느 것도 전통적인 자동화 제어 시스템에서는 발견되지 않거나 존재하지만 단순화된 형태입니다.

물론, 제어 대상이 실제로 안정적이고 엄격하게 결정된 시스템이고 이에 대한 환경의 영향을 무시할 수 있는 경우에는 전통적인 방법이 적절하고 그 사용이 매우 정확하고 정당합니다.

그러나 다른 경우에는 이 방법이 효과적이지 않습니다.

제어 개체가 동적이면 입력 매개변수와 출력 매개변수 간의 관계는 물론 필수 매개변수 세트 자체도 변경되기 때문에 제어 알고리즘의 기본 모델이 빠르게 부적절해집니다. 본질적으로 이는 전통적인 자동 제어 시스템이 약한 제어 조치를 통해 평형점 근처에서만 제어 개체의 상태를 제어할 수 있음을 의미합니다. 작은 섭동의 방법으로. 균형 상태와는 거리가 먼, 전통적인 관점에서 볼 때 제어 개체의 동작은 예측할 수 없고 제어할 수 없는 것처럼 보입니다.

제어 개체의 입력 매개변수와 출력 매개변수 사이에 명확한 연결이 없는 경우(즉, 입력 매개변수와 개체의 상태 사이), 즉 이 연결이 확연한 확률적 성격을 갖는 경우 결정론적 모델은 다음과 같습니다. 특정 매개변수를 측정한 결과가 단순히 숫자라고 가정하면 초기에는 적용할 수 없습니다. 또한 이 연결의 유형을 단순히 알 수 없을 수도 있으므로 가장 일반적인 가정, 즉 확률적이거나 전혀 결정되지 않은 가정에서 진행해야 합니다.

전통적인 원리를 바탕으로 구축된 자동화 제어 시스템은 연결 패턴이 이미 알려져 있고 연구되어 수학적 모델에 반영된 매개변수를 기반으로만 작동할 수 있습니다. 본 연구에서는 자동화 설계를 위한 이러한 방법을 개발하는 것이 과제입니다. 가장 중요한 매개변수를 식별할 수 있는 시스템을 생성하고 매개변수와 제어 개체의 상태 사이의 연결 특성을 결정할 수 있는 제어 시스템입니다.

이 경우 실제 상황에 적합한 보다 발전된 측정 방법을 사용할 필요가 있습니다.

이미지 분류 또는 인식(훈련 세트 기반 학습, 인식 알고리즘의 적응성, 연구 중인 클래스 및 매개변수 세트의 적응성, 가장 중요한 매개변수 선택 및 주어진 중복성을 유지하면서 설명 차원의 축소 등)
통계 측정, 특정 매개변수를 측정한 결과가 별도의 숫자가 아닌 확률 분포인 경우: 통계 변수의 변화는 그 값 자체의 변화를 의미하는 것이 아니라 확률 분포 특성의 변화를 의미합니다. 그 가치.

결과적으로, 전통적인 결정론적 접근 방식을 기반으로 하는 자동화된 제어 시스템은 실제로 " 과도기”, 계층적 엘리트 및 인종 집단, 사회 및 유권자, 인간 생리학과 정신, 자연 및 인공 생태계 등을 다루고 있습니다.

80년대 중반에 I. 프리고진(I. Prigogine) 학파가 모든 시스템(인간 포함)의 개발이 시스템이 "대부분 결정적"이거나 "대부분 무작위"로 동작하는 기간을 번갈아 사용하는 접근 방식을 개발했다는 점은 매우 중요합니다. 당연히 실제 제어 시스템은 기록의 "결정론적" 섹션뿐만 아니라 향후 동작이 매우 불확실해지는 지점에서도 제어 개체를 안정적으로 제어해야 합니다. 이는 동작이 무작위성(또는 현재 수학적으로 "무작위성"으로 설명되는 요소)의 큰 요소를 포함하는 제어 시스템에 대한 접근 방식을 개발해야 함을 의미합니다.

따라서 복잡한 동적 다중 매개변수 약 결정론적 시스템의 제어를 제공하는 유망한 자동화 제어 시스템에는 인공 지능 방법(주로 패턴 인식)을 기반으로 환경 및 제어 개체의 상태를 식별하고 예측하기 위한 하위 시스템, 지원 방법 결정이 포함될 것입니다. 제작과 정보 이론.

제어 작업에 대한 결정을 내리기 위해 이미지 인식 시스템을 사용하는 문제를 간략하게 살펴보겠습니다(이 문제는 이 작업의 핵심이므로 나중에 자세히 설명합니다). 제어 개체의 대상 및 기타 상태를 인식 클래스로 취하고 이에 영향을 미치는 요소를 특징으로 취하면 패턴 인식 모델에서 요소와 상태 간의 관계에 대한 측정이 형성될 수 있습니다. 이를 통해 제어 개체의 특정 상태에 대해 이 상태로의 전환을 촉진하거나 방해하는 요인에 대한 정보를 얻을 수 있으며, 이를 기반으로 제어 작업에 대한 결정을 내릴 수 있습니다.

요인은 다음 그룹으로 나눌 수 있습니다.

컨트롤 개체의 배경을 특성화하는 단계;
제어 객체의 현재 상태를 특성화하는 단계;
환경적 요인;
기술적(통제 가능한) 요인.

따라서 패턴 인식 시스템은 자동 제어 시스템의 일부로 사용될 수 있습니다. 즉, 제어 개체의 상태를 식별하고 제어 작업을 개발하기 위한 하위 시스템에서 사용할 수 있습니다.

이는 제어 개체가 복잡한 시스템인 경우에 적합합니다.

자동화 제어 시스템의 제어 조치에 대한 결정

이 작업에서는 패턴 인식 방법과 의사 결정 방법 간의 수많은 심층적 유추를 고려하여 복잡한 시스템으로 적응형 자동 제어 시스템을 합성하는 문제에 대한 솔루션을 고려합니다.

한편, 패턴 인식의 문제는 인식된 객체가 특정 인식 클래스에 속하는지 여부를 결정하는 것입니다.

반면, 저자들은 의사결정 문제를 역디코딩 문제 또는 역패턴 인식 문제로 간주할 것을 제안합니다(섹션 2.2.2 참조).

패턴 인식 및 의사 결정 방법의 기본 아이디어의 공통성은 정보 이론의 관점에서 고려할 때 특히 분명해집니다.

다양한 의사결정 문제

목표 실현으로서의 의사결정

정의: 의사결정(“선택”)은 일련의 대안에 대한 조치로, 그 결과 초기 대안 집합이 좁아집니다. 그 감소가 발생합니다.

선택은 모든 활동에 목적을 부여하는 행동입니다. 모든 활동이 특정 목표 또는 일련의 상호 연관된 목표에 종속되는 것은 선택 행위를 통해 이루어집니다.

따라서 선택 행위가 가능해지기 위해서는 다음이 필요하다.

선택을 내려야 하는 일련의 대안을 생성하거나 발견합니다.
선택을 위한 목표 결정;
대안을 서로 비교하는 방법의 개발 및 적용, 즉 각 대안이 목표에 얼마나 잘 부합하는지 간접적으로 평가할 수 있는 특정 기준에 따라 각 대안에 대한 선호도 등급을 결정합니다.

의사결정 지원 분야의 현대 작업은 잘 연구되고 상대적으로 단순한 문제에 대해서만 최상의(어떤 의미에서) 솔루션을 찾는 완전한 형식화가 가능한 반면, 실제로는 약하게 구조화된 문제가 가능하다는 특징적인 상황을 보여주었습니다. 공식화된 알고리즘이 전혀 개발되지 않은 경우가 더 자주 발생합니다(철저한 검색 및 시행착오 제외). 그러나 경험이 풍부하고 유능하며 유능한 전문가들이 꽤 좋은 선택을 하는 경우가 많습니다. 따라서 자연 상황에서 의사 결정을 수행하는 현대적인 추세는 비공식적 문제를 해결하는 인간의 능력과 형식적 방법 및 컴퓨터 모델링의 기능(대화형 의사 결정 지원 시스템, 전문가 시스템, 적응형 인간-기계 자동화 제어 시스템)을 결합하는 것입니다. , 신경망 및 인지 시스템.

불확실성 제거를 통한 의사결정(정보접근)

정보를 획득하는 과정은 신호를 수신한 결과 불확실성이 감소하는 것으로 볼 수 있으며, 정보의 양은 불확실성 제거 정도를 정량적으로 측정하는 것으로 볼 수 있다.

그러나 세트에서 대안의 특정 하위 세트를 선택한 결과, 즉 의사결정의 결과에도 동일한 일이 발생합니다(불확실성 감소). 이는 모든 선택, 모든 결정이 일정량의 정보를 생성하므로 정보 이론으로 설명할 수 있음을 의미합니다.

의사결정 문제의 분류

의사결정 업무의 다양성은 의사결정이 내려지는 상황의 각 구성요소가 질적으로 다른 옵션으로 구현될 수 있다는 사실에 기인합니다.

다음 옵션 중 몇 가지만 나열해 보겠습니다.

대안 세트는 한편으로는 유한하고, 셀 수 있거나 연속적일 수 있으며, 다른 한편으로는 폐쇄형(즉, 완전히 알려진) 또는 개방형(알 수 없는 요소 포함)일 수 있습니다.
대안 평가는 하나 이상의 기준에 따라 수행될 수 있으며, 이는 정량적 또는 질적 성격을 가질 수 있습니다.
선택 모드는 선택 결과에 대한 피드백을 포함하여 단일(일회성) 또는 다중 반복일 수 있습니다. 이전 선거의 결과를 고려하여 의사결정 알고리즘을 훈련할 수 있습니다.
각 대안을 선택한 결과는 미리 정확히 알 수 있고(확실성의 조건 하에서의 선택), 선택한 후 가능한 결과의 확률이 알려졌을 때 확률적 성격을 갖거나(위험 조건 하의 선택), 알 수 없는 모호한 결과를 가질 수 있습니다. 확률(불확실한 조건에서의 선택)
개인이든 그룹이든 선택에 대한 책임이 없을 수 있습니다.
그룹 선택에서 목표의 일관성 정도는 당사자 이익의 완전한 일치(협력 선택)부터 반대(갈등 상황에서의 선택)까지 다양할 수 있습니다. 타협, 연합, 갈등의 증가 또는 소멸 등 중간 옵션도 가능합니다.

이러한 옵션의 다양한 조합은 다양한 수준으로 연구된 수많은 의사 결정 문제로 이어집니다.

의사결정 방법을 기술하는 언어

하나의 동일한 현상이 다양한 수준의 일반성과 타당성을 통해 다양한 언어로 언급될 수 있습니다. 현재까지 선택을 설명하는 세 가지 주요 언어가 등장했습니다.

가장 단순하고 가장 개발되었으며 가장 대중적인 것은 기준 언어입니다.

기준 언어

이 언어의 이름은 각 개별 대안이 특정(하나) 숫자로 평가될 수 있다는 기본 가정과 연관되어 있으며, 그 후 대안 비교는 해당 숫자 비교로 축소됩니다.

예를 들어, (X)는 대안의 집합이고 x는 이 집합에 속하는 특정 대안(x∈X)이라고 가정합니다. 그러면 모든 x에 대해 기준(품질 기준, 목적 함수, 선호 함수, 효용 함수 등)이라고 불리는 함수 q(x)가 지정될 수 있다고 믿어지며, 대안 x 1이 더 바람직하다는 속성을 갖습니다. x 2(표시: x 1 > x 2), q(x 1) > q(x 2).

이 경우 기준 함수의 값이 가장 높은 대안을 찾는 것이 선택입니다.

그러나 실제로 대안의 선호도를 비교하기 위해 하나의 기준만을 사용하는 것은 정당화되지 않은 단순화로 판명됩니다. 대안을 더 자세히 고려하면 대안을 하나가 아닌 여러 기준으로 평가해야 하기 때문입니다. 서로 성격이 다르고 질적으로도 다릅니다.

예를 들어 특정 유형의 노선에서 승객과 운영 조직에 가장 적합한 항공기 유형을 선택할 때 기술, 기술, 경제, 사회, 인체 공학 등 여러 기준 그룹에 따라 비교가 동시에 이루어집니다.

다기준 문제에는 고유한 일반 솔루션이 없습니다. 따라서 다기준 문제에 단일 일반 솔루션을 허용하는 특정 형식을 제공하기 위한 여러 가지 방법이 제안되었습니다. 당연히 이러한 솔루션은 일반적으로 방법에 따라 다릅니다. 따라서 아마도 다기준 문제를 해결하는 데 가장 중요한 것은 이러한 유형의 공식화에 대한 정당성을 확보하는 것일 것입니다.

다기준 선택 문제를 단순화하기 위해 다양한 옵션이 사용됩니다. 그 중 일부를 나열해 보겠습니다.

조건부 최대화(적분 기준의 전체 극값이 발견되지 않지만 주요 기준의 로컬 극값이 발견됨).
지정된 속성을 가진 대안을 검색합니다.
파레토 집합을 찾는 것.
적분 기준을 도입하여 다중 기준 문제를 단일 기준 문제로 줄입니다.

다기준 문제를 단일 기준 문제로 축소하는 방법의 공식적인 공식화를 더 자세히 고려해 보겠습니다.

벡터 인수의 스칼라 함수로 적분 기준 q 0 (x)를 소개하겠습니다.

q 0 (x) = q 0 ((q 1 (x), q 2 (x), ..., q n (x)).

적분 기준을 사용하면 q 0 값에 따라 대안을 주문할 수 있으므로 이 기준의 의미에서 가장 좋은 것을 강조할 수 있습니다. 함수 q 0의 형태는 적분 기준에 대한 각 기준의 기여를 얼마나 구체적으로 상상하는지에 따라 결정됩니다. 일반적으로 덧셈 및 곱셈 함수가 사용됩니다.

q 0 = ∑a i ⋅q i /s i

1 - q 0 = ∏(1 - b i ⋅q i /s i)

내가 제공하는 계수는 다음과 같습니다.

무차원 또는 숫자 a i ⋅q i /si /si의 단일 차원(다른 부분 기준은 다른 차원을 가질 수 있으므로 산술 연산을 수행할 수 없으며 적분 기준으로 축소됩니다).
정규화, 즉 조건 보장: b i ⋅q i /s i<1.

계수 a i 및 bi 는 적분 기준에 대한 부분 기준 q i 의 상대적 기여도를 반영합니다.

따라서 다기준 공식화에서 대안 중 하나를 선택하는 결정을 내리는 문제는 적분 기준을 최대화하는 것으로 귀결됩니다.

x * = arg max(q 0 (q 1 (x), q 2 (x), ..., q n (x)))

의사결정 문제의 다기준 공식화에서 주요 문제는 모델의 다음 속성을 제공하는 계수 a i 및 b i 의 분석 형식을 찾는 것이 필요하다는 것입니다.

주제 영역과 전문가의 관점에 대한 높은 수준의 적절성;
적분 기준을 최대화하는 데 있어 최소한의 계산적 어려움, 즉 다양한 대안에 대한 계산;
초기 데이터의 작은 교란으로 인해 적분 기준을 최대화한 결과의 안정성.
솔루션의 안정성은 초기 데이터의 작은 변화로 인해 적분 기준 값이 약간 변경되고 그에 따라 결정이 약간 변경되어야 함을 의미합니다. 따라서 초기 데이터가 실질적으로 동일하다면 동일하거나 매우 유사한 결정을 내려야 합니다.

순차 바이너리 선택 언어

이항 관계의 언어는 다기준 언어의 일반화이며 대안을 평가할 때 이 평가는 항상 상대적이라는 사실을 고려하는 데 기반을 둡니다. 명시적으로 또는 더 자주 암시적으로, 연구 대상 세트 또는 일반 모집단의 다른 대안이 비교를 위한 기준 또는 참조 프레임으로 사용됩니다. 인간의 사고는 반대(구성)의 검색 및 분석을 기반으로 하기 때문에 크고 정렬되지 않은 집합에서 하나의 옵션을 선택하는 것보다 두 개의 반대 옵션 중 하나를 선택하는 것이 항상 더 쉽습니다.

따라서 이 언어의 기본 가정은 다음과 같습니다.

별도의 대안은 평가되지 않습니다. 기준 기능은 도입되지 않았습니다.
각 대안 쌍에 대해 그 중 하나가 다른 것보다 바람직하거나 동등하거나 비교할 수 없다는 것이 어떤 방식으로든 확립될 수 있습니다.
어떤 대안 쌍의 선호 관계도 선택을 위해 제시된 나머지 대안에 의존하지 않습니다.

이진 관계를 지정하는 방법에는 직접, 행렬, 기본 설정 그래프 사용, 섹션 방법 등 다양한 방법이 있습니다.

한 쌍의 대안 간의 관계는 동등성, 순서 및 지배성의 개념을 통해 표현됩니다.

일반화된 선택 기능 언어

선택 함수 언어는 집합 이론을 기반으로 하며 요소를 열거할 필요 없이 집합에서 다른 선택에 해당하는 하위 집합으로의 매핑 작업을 수행할 수 있게 해줍니다. 이 언어는 매우 일반적이며 어떤 선택이든 설명할 수 있는 잠재력을 가지고 있습니다. 그러나 일반화된 선택 함수의 수학적 장치는 현재 기준 기반 또는 이진 접근 방식을 사용하여 이미 해결된 문제를 중심으로 개발 및 테스트 중입니다.

그룹 선택

집단적 의사결정에 참여할 권리를 가진 사람들의 집단이 있게 해주세요. 이 그룹이 특정 대안 세트를 고려하고 있고 그룹의 각 구성원이 스스로 선택한다고 가정해 보겠습니다. 과제는 어떤 방식으로든 개인의 선택을 조정하고 어떤 의미에서는 그룹의 "일반적인 의견"을 표현하는 솔루션을 개발하는 것입니다. 그룹 선택으로 인정됩니다.

당연히 개인 결정을 조정하는 서로 다른 원칙은 서로 다른 그룹 결정에 상응합니다.

그룹 선택 중 개인 결정을 조정하는 규칙을 투표 규칙이라고 합니다. 가장 일반적인 것은 '다수결 원칙'으로, 가장 많은 표를 얻은 대안이 그룹 결정으로 채택됩니다.

그러한 결정은 그룹 내 다양한 관점의 확산만을 반영할 뿐, 아무도 투표할 수 없는 진정한 최적의 옵션은 반영하지 않는다는 점을 이해해야 합니다. “진실은 투표로 결정되지 않는다.”

또한 소위 '투표 역설'이 있는데, 그 중 가장 유명한 것이 애로우의 역설이다.

이러한 역설은 투표 절차의 매우 불쾌한 특징으로 이어질 수 있으며 때로는 실제로 그렇게 됩니다. 예를 들어 그룹이 전혀 단일 결정을 내릴 수 없는 경우가 있습니다(정족수가 없거나 모든 사람이 자신의 고유한 옵션에 투표하는 등). .) 그리고 때로는 (다단계 투표를 통해) 소수가 다수에게 자신의 의지를 강요할 수 있습니다.

불확실한 조건에서의 선택

확실성은 불확실성의 특별한 경우입니다. 즉, 0에 가까운 불확실성입니다.

현대 선택 이론에서는 의사 결정 문제에 세 가지 주요 유형의 불확실성이 있다고 믿어집니다.

의사결정을 위한 초기 데이터의 정보(통계) 불확실성.
의사결정(선택) 결과의 불확실성.
의사결정 과정의 구성요소에 대한 설명이 모호함.

순서대로 살펴보겠습니다.

소스 데이터의 정보(통계) 불확실성

주제 영역에 대해 얻은 데이터는 절대적으로 정확하다고 간주할 수 없습니다. 또한, 분명히 이러한 데이터는 그 자체로는 우리의 관심 대상이 아니며, 우리가 실제로 관심을 갖는 것에 대한 특정 정보를 전달할 수 있는 신호일 뿐입니다. 따라서 우리가 다루고 있는 데이터는 시끄럽고 부정확할 뿐만 아니라 간접적이고 어쩌면 불완전할 수도 있다는 점을 고려하는 것이 더 현실적입니다. 또한 이러한 데이터는 연구 대상 전체 인구에 관한 것이 아니라 실제로 데이터를 수집할 수 있었던 특정 하위 집합에 관한 것이지만 동시에 전체 인구에 대한 결론을 도출하고 싶습니다. 이러한 결론의 신뢰성 정도를 알고 싶습니다.

이러한 조건에서 통계적 결정 이론이 사용됩니다.

이 이론에는 불확실성의 두 가지 주요 원인이 있습니다. 첫째, 원본 데이터가 어떤 분포를 따르는지 알 수 없습니다. 둘째, 초기 데이터를 구성하는 하위 집합에서 결론을 도출하려는 집합(일반 인구)이 어떤 분포를 가지고 있는지 알 수 없습니다.

통계 절차는 이러한 유형의 불확실성을 모두 제거하는 의사 결정 절차입니다.

통계 방법을 잘못 적용하는 데에는 여러 가지 이유가 있다는 점에 유의해야 합니다.

다른 결론과 마찬가지로 통계적 결론에는 항상 어느 정도 신뢰성이나 타당성이 있습니다. 그러나 다른 많은 경우와는 달리 통계적 결론의 신뢰성은 통계 연구 중에 알려지고 결정됩니다.
통계 절차를 적용한 결과 얻은 솔루션의 품질은 원본 데이터의 품질에 따라 달라집니다.
통계적 성격을 갖지 않는 데이터는 통계 처리 대상이 되어서는 안 됩니다.
연구 대상 모집단에 대한 선험적 정보 수준에 적합한 통계 절차를 사용해야 합니다(예를 들어, ANOVA 방법은 비가우시안 데이터에 적용해서는 안 됩니다). 초기 데이터의 분포를 알 수 없는 경우 이를 설정하거나 여러 가지 다른 방법을 사용하여 결과를 비교해야 합니다. 매우 다른 경우 이는 사용된 일부 절차가 적용되지 않음을 나타냅니다.

결과의 불확실성

하나 또는 다른 대안을 선택한 결과가 대안 자체에 의해 명확하게 결정될 때, 우리는 대안을 선택함으로써 실제로 그 결과를 선택한다는 것을 당연하게 여기며 대안과 그 결과를 구별할 수 없습니다.

그러나 실제 실제로는 하나 또는 다른 대안의 선택이 선택의 결과를 모호하게 결정하는 더 복잡한 상황을 처리해야 하는 경우가 많습니다.

별개의 대안 집합과 그들이 선택한 결과의 경우, 가능한 결과 집합 자체가 모든 대안에 공통이라면 우리는 서로 다른 대안이 결과의 확률 분포에서 서로 다르다고 가정할 수 있습니다. 일반적인 경우의 이러한 확률 분포는 대안 선택 결과와 그 결과로 발생한 실제 결과에 따라 달라질 수 있습니다. 가장 간단한 경우에는 결과가 동일할 가능성이 높습니다. 결과 자체는 일반적으로 이익 또는 손실의 의미를 가지며 정량적으로 표현됩니다.

모든 대안의 결과가 동일하다면 선택할 것이 없습니다. 서로 다른 경우 특정 정량적 추정치를 도입하여 대안을 비교할 수 있습니다. 게임 이론의 다양한 문제는 대안을 선택한 결과로 인한 손실과 이익의 수치적 특성의 다양한 선택, 대안을 선택하는 당사자 간의 갈등 정도 등의 차이와 관련이 있습니다.

이러한 유형의 불확실성을 모호한 불확실성으로 간주하십시오.

모든 선택 작업은 일련의 대안을 목표로 좁히는 작업입니다. 대안에 대한 공식적인 설명(목록 자체, 기능 또는 매개변수 목록)과 비교 규칙에 대한 설명(기준, 관계)은 항상 하나 또는 다른 측정 척도의 관점에서 제공됩니다. 이것은 이것에 대해 모릅니다).

모든 척도가 흐려지는 것으로 알려져 있지만 정도는 다양합니다. "흐림"이라는 용어는 구별 가능한 두 가지 대안을 제시하는 것이 항상 가능하다는 사실로 구성된 척도의 특성을 나타냅니다. 같은 규모에서도 다르며 구별할 수 없습니다. 동일하고 다른 하나는 더 흐릿합니다. 특정 스케일에서 그라데이션이 적을수록 흐릿해집니다.

따라서 우리는 대안을 명확하게 볼 수 있는 동시에 이를 모호하게 분류할 수 있습니다. 자신이 어떤 클래스에 속하는지 불확실합니다.

이미 모호한 상황에서의 의사결정에 대한 첫 번째 작업에서 Bellman과 Zadeh는 목표와 제약이 모두 대안 세트의 퍼지 세트로 표현되어야 한다는 아이디어를 제시했습니다.

최적화 접근 방식의 일부 제한 사항에 대해

위에서 논의한 모든 선택 문제와 의사결정 방법에서 문제는 주어진 조건에서 원래 세트에서 가장 좋은 것을 찾는 것이었습니다. 어떤 의미에서 최적의 대안.

최적성 개념은 사이버네틱스의 핵심 아이디어이며 기술 시스템 설계 및 운영 실무에서 확고히 자리 잡았습니다. 동시에, 이 아이디어를 예를 들어 사회 경제적 시스템과 같이 복잡하고 크고 약하게 결정된 시스템을 관리하는 분야로 옮기려고 할 때 신중한 처리가 필요합니다.

이러한 결론을 내리는 데에는 상당한 이유가 있습니다. 그 중 일부를 살펴보겠습니다:

최적의 솔루션은 종종 불안정한 것으로 판명됩니다. 문제 조건, 입력 또는 제약 조건의 사소한 변경으로 인해 상당히 다른 대안이 선택될 수 있습니다.
최적화 모델은 실제 제어 개체를 항상 적절하고 체계적으로 반영하지 않는 매우 간단한 문제의 좁은 클래스에 대해서만 개발됩니다. 대부분의 경우 최적화 방법을 사용하면 일부 크고 복잡한 시스템의 매우 간단하고 공식적으로 잘 설명된 하위 시스템만 최적화할 수 있습니다. 로컬 최적화만 허용합니다. 그러나 대규모 시스템의 각 하위 시스템이 최적으로 작동한다고 해서 시스템 전체가 최적으로 작동한다는 의미는 아닙니다. 따라서 하위 시스템의 최적화가 시스템 전체를 최적화할 때 필요한 동작으로 반드시 이어지는 것은 아닙니다. 게다가 때로는 로컬 최적화가 시스템 전체에 부정적인 결과를 초래할 수도 있습니다. 따라서 하위 시스템과 시스템 전체를 최적화할 때는 목표 트리와 하위 목표의 우선순위를 결정하는 것이 필요합니다.
종종 일부 수학적 모델에 따라 최적화 기준을 최대화하는 것이 최적화의 목표로 간주되지만 실제로 목표는 제어 개체를 최적화하는 것입니다. 최적화 기준과 수학적 모델은 항상 간접적으로만 목표와 관련됩니다. 다소 적절하지만 항상 대략적입니다.

따라서 수학적으로 적절하게 공식화할 수 있는 시스템에 매우 유익한 최적성이라는 개념을 복잡한 시스템에 조심스럽게 적용해야 합니다. 물론, 때때로 그러한 시스템에 대해 제안될 수 있는 수학적 모델은 최적화될 수 있습니다. 그러나 복잡한 시스템의 경우 더 이상 무시할 수 없는 이러한 모델의 강력한 단순화와 복잡한 시스템의 경우 이러한 모델의 적절성 정도가 사실상 알려지지 않았다는 사실을 항상 고려해야 합니다. . 따라서 이 최적화가 순전히 실제적인 의미를 갖는지는 알려져 있지 않습니다. 기술 시스템에서 최적화의 높은 실용성은 복잡한 시스템을 최적화할 때에도 마찬가지로 효과적일 것이라는 착각을 불러일으켜서는 안 됩니다. 복잡한 시스템의 의미 있는 수학적 모델링은 매우 어렵고 대략적이며 부정확합니다. 시스템이 복잡할수록 최적화 아이디어에 더욱 주의해야 합니다.

따라서 복잡하고 크고 약한 결정론적 시스템을 제어하는 방법을 개발할 때 저자는 공식적인 수학적 관점에서 선택한 접근 방식의 최적성뿐만 아니라 목표에 대한 적합성과 시스템의 본질을 가장 중요하게 고려합니다. 제어 객체.

전문가 선정 방법

복잡한 시스템을 연구할 때 여러 가지 이유로 현재 개발된 수학적 장치를 사용하여 엄격하게 공식화하고 해결할 수 없는 문제가 종종 발생합니다. 이러한 경우 경험과 직관을 통해 문제의 복잡성을 줄이는 데 도움이 되는 전문가(시스템 분석가)의 서비스가 사용됩니다.

그러나 전문가 자체는 매우 복잡한 시스템이며 전문가의 활동도 많은 외부 및 내부 조건에 따라 달라진다는 점을 고려해야 합니다. 따라서 전문가 평가를 구성하는 방법에서는 전문가의 작업에 유리한 외부 및 심리적 조건을 조성하는 데 많은 관심을 기울입니다.

전문가의 작업은 다음 요소의 영향을 받습니다.

시험 결과 사용에 대한 책임;
다른 전문가도 관련되어 있다는 지식;
전문가 간의 정보 접촉 가용성;
전문가의 대인 관계(그들 사이에 정보 접촉이 있는 경우)
평가 결과에 대한 전문가의 개인적인 관심;
전문가의 개인적 자질(자만, 순응, 의지 등)

전문가 간의 상호작용은 그들의 활동을 자극할 수도 있고 억제할 수도 있습니다. 따라서 익명 및 공개 설문 조사 및 설문지, 회의, 토론, 비즈니스 게임, 브레인 스토밍 등 전문가 간의 상호 작용 성격이 다른 다양한 조사 방법이 다양한 경우에 사용됩니다.

전문가 의견을 수학적 처리하는 방법에는 여러 가지가 있습니다. 전문가들은 하나 또는 지표 시스템을 사용하여 다양한 대안을 평가하도록 요청받습니다. 또한 각 지표의 중요성(“가중치” 또는 “기여도”)의 정도를 평가하도록 요청받습니다. 전문가들 자신에게도 그룹의 결과 의견에 대한 각자의 기여도에 따라 역량 수준이 할당됩니다.

전문가와 협력하기 위해 개발된 방법론은 Delphi 방법입니다. 이 방법의 주요 아이디어는 전문가의 자존심이 손상되지 않고 개인적인 대결을 배제하는 조건이 제공되면 비판과 논쟁이 전문가에게 유익한 영향을 미친다는 것입니다.

전문가 시스템과 의사결정 지원에서 전문가 방법을 사용하는 성격에는 근본적인 차이가 있다는 점을 특히 강조해야 합니다. 첫 번째 경우 전문가가 의사 결정 방법을 공식화해야 하는 경우 두 번째 경우에는 결정 자체만 필요합니다.

전문가는 현재 자동화 시스템이 전혀 제공하지 않거나 인간보다 더 나쁘게 수행되는 기능의 구현에 전문가가 참여하기 때문에 자동화 시스템 개발의 유망한 방향은 이러한 기능의 최대 자동화입니다.

자동화된 의사결정 지원 시스템

인간은 결정을 내릴 때 항상 보조자를 사용해 왔습니다. 이들은 단순히 관리 대상에 대한 정보 제공자이자 결정 옵션을 제공하고 그 결과를 분석하는 컨설턴트(고문)였습니다. 결정을 내리는 사람은 항상 특정 정보 환경에서 결정을 내립니다. 군 지도자에게는 본부, 총장에게는 학술 위원회, 장관에게는 대학이 됩니다.

오늘날 의사결정을 위한 정보 인프라는 대화형 의사결정 평가를 위한 자동화 시스템, 특히 의사결정 지원 시스템(DDS - 의사결정 지원 시스템) 없이는 상상할 수 없습니다. 사람이 결정을 내리는 데 필요한 정보를 준비하도록 특별히 설계된 자동화 시스템입니다. 특히 의사결정 지원 시스템의 개발은 락센부르크(오스트리아)에 있는 국제 응용 시스템 분석 연구소의 후원으로 수행되는 국제 프로젝트의 틀 내에서 수행됩니다.

실제 상황에서 선택을 하려면 여러 가지 작업이 필요하며, 그 중 일부는 인간이 더 효율적으로 수행하고 일부는 기계가 수행합니다. 단점을 보완하면서 장점을 효과적으로 조합하는 것이 자동화된 의사결정 지원 시스템에 구현됩니다.

사람은 불확실한 상황에서 기계보다 더 나은 결정을 내리지만, 올바른 결정을 내리려면 주제 영역을 특징짓는 적절한(완전하고 신뢰할 수 있는) 정보도 필요합니다. 그러나 인간은 처리되지 않은 대량의 "원시" 정보에 잘 대처하지 못하는 것으로 알려져 있습니다. 따라서 의사 결정 지원에서 기계의 역할은 제어 대상 및 제어할 수 없는 요소(환경)에 대한 정보의 사전 준비를 수행하고 특정 결정의 결과를 확인하는 데 도움을 주며 이 모든 정보를 시각적으로 표시하는 것일 수 있습니다. 의사결정 양식을 위한 편리한 방법입니다.

따라서 자동화된 의사결정 지원 시스템은 개인의 약점을 보완하여 일상적인 사전 정보 처리에서 해방되고, 자신의 강점을 더 잘 발휘할 수 있는 편안한 정보 환경을 제공합니다. 이러한 시스템은 의사결정자의 기능을 자동화하는 것을 목표로 하지 않으며(결과적으로 의사결정자로부터 이러한 기능을 소외시키고, 따라서 일반적으로 받아들일 수 없는 결정에 대한 책임을 지게 됨), 그에게 상품을 찾는 데 도움을 제공하는 것을 목표로 합니다. 해결책.

일반적으로 패턴 인식에는 세 가지 방법이 있습니다. 무차별 대입 방법. 이 경우 각 개체 유형에 대해 다양한 표시 수정 사항이 제공되는 데이터베이스를 통해 비교가 이루어집니다. 예를 들어, 광학적 패턴 인식의 경우 다양한 각도, 크기, 변위, 변형 등에서 물체의 모양을 열거하는 방법을 사용할 수 있습니다. 문자의 경우 글꼴, 글꼴 속성 등을 열거해야 합니다. 따라서 소리 이미지 인식의 경우 몇 가지 알려진 패턴(예: 여러 사람이 말하는 단어)을 비교합니다.

두 번째 접근 방식은 이미지의 특성을 보다 심층적으로 분석하는 것입니다. 광학 인식의 경우 이는 다양한 기하학적 특성을 결정하는 것일 수 있습니다. 이 경우 사운드 샘플은 주파수, 진폭 분석 등을 거칩니다.

다음 방법은 인공신경망(ANN)을 활용하는 것이다. 이 방법에는 훈련 중 인식 작업에 대한 많은 수의 예가 필요하거나 이 작업의 세부 사항을 고려하는 특수 신경망 구조가 필요합니다. 그러나 더 높은 효율성과 생산성을 제공합니다.

4. 패턴인식의 역사

패턴 인식의 수학적 형식을 간략하게 살펴보겠습니다. 패턴 인식의 객체는 일련의 기본 특성(특징, 속성)으로 설명됩니다. 주요 특성은 성격이 다를 수 있습니다. 실제 선 유형의 정렬된 세트 또는 개별 세트(그러나 구조가 부여될 수도 있음)에서 가져올 수 있습니다. 물체에 대한 이러한 이해는 패턴 인식의 실제 적용에 대한 필요성과 인간의 물체 인식 메커니즘에 대한 우리의 이해와 일치합니다. 실제로 우리는 사람이 물체를 관찰(측정)할 때 그에 대한 정보가 유한한 수의 센서(분석된 채널)를 통해 뇌에 도달하고 각 센서가 물체의 해당 특성과 연관될 수 있다고 믿습니다. 객체 측정에 해당하는 특징 외에도 선택된 특징 또는 특징 그룹이 있습니다. 이를 특징 분류라고 하며 주어진 벡터 X에 대한 해당 값을 찾는 것이 수행되는 작업입니다. 자연 및 인공 인식 시스템.

이러한 특징의 가치를 설정하려면 알려진 특징이 분류된 특징과 어떻게 관련되어 있는지에 대한 정보가 필요하다는 것은 분명합니다. 이 연결에 대한 정보는 선례, 즉 알려진 분류 특성 값을 가진 개체에 대한 설명 집합의 형태로 제공됩니다. 그리고 이러한 선례 정보를 바탕으로 객체의 임의 설명에 분류 특징의 값을 할당하는 결정 규칙을 구축하는 것이 필요합니다.

패턴 인식 문제에 대한 이러한 이해는 지난 세기 50년대부터 과학에서 확립되었습니다. 그리고 그러한 제작이 전혀 새로운 것이 아니라는 것이 밝혀졌습니다. 우리는 유사한 공식을 접했고 이미 기술 진단과 같은 많은 실제 문제에 적극적으로 사용되는 꽤 잘 입증된 통계 데이터 분석 방법이 존재했습니다. 따라서 패턴 인식의 첫 번째 단계는 주요 문제를 나타내는 통계적 접근 방식으로 진행되었습니다.

통계적 접근은 사물의 원래 공간은 확률적 공간이고, 사물의 기호(특성)는 그 위에 명시된 확률변수라는 생각에 기초한다. 그런 다음 데이터 과학자의 임무는 특정 고려 사항을 기반으로 특성 분포, 더 정확하게는 분류 특성이 다른 특성에 대한 의존성에 대한 통계적 가설을 제시하는 것이었습니다. 일반적으로 통계적 가설은 매개변수적으로 정의된 특징 분포 함수 세트였습니다. 전형적이고 고전적인 통계 가설은 이 분포의 정규성에 대한 가설입니다(통계학자들은 그러한 가설을 매우 다양하게 생각해 냈습니다). 가설을 공식화한 후에는 선행 데이터를 바탕으로 이 가설을 테스트하는 것이 남았습니다. 이 테스트는 초기에 지정된 분포 세트(분포 가설의 매개변수)에서 특정 분포를 선택하고 이 선택의 신뢰성(신뢰 구간)을 평가하는 것으로 구성되었습니다. 실제로 이 분포 함수는 문제에 대한 답이었고 객체만 더 이상 명확하게 분류되지 않고 클래스에 속할 특정 확률로 분류되었습니다. 통계학자들은 또한 그러한 방법에 대한 점근적 정당성을 개발했습니다. 이러한 정당화는 다음 계획에 따라 이루어졌습니다. 배포 선택의 품질에 대한 특정 기능이 설정되었으며(신뢰 구간), 선례의 수가 증가함에 따라 확률이 1인 선택이 다음에서 옳아지는 것으로 나타났습니다. 이 함수의 의미(신뢰 구간은 0으로 향함). 앞으로 우리는 인식 문제에 대한 통계적 관점이 개발된 알고리즘(클러스터 및 판별 분석, 비모수적 회귀 등을 포함하는 방법 포함) 측면에서 매우 유익한 것으로 판명되었을 뿐만 아니라 이후 Vapnik은 깊은 통계적 인식 이론을 창안했습니다.

그러나 패턴 인식 문제를 통계로 환원할 수 없다는 강력한 주장이 있습니다. 원칙적으로 이러한 문제는 통계적 관점에서 고려될 수 있으며 해당 해결 결과는 통계적으로 해석될 수 있습니다. 이를 위해서는 문제의 객체 공간이 확률적이라고 가정하면 됩니다. 그러나 도구주의의 관점에서 볼 때 특정 인식 방법에 대한 통계적 해석의 성공 기준은 수학의 한 분야인 통계 언어에서 이 방법에 대한 정당성이 존재하는 것뿐입니다. 여기서 정당화는 이 방법을 성공적으로 적용할 수 있도록 작업에 대한 기본 요구 사항을 개발하는 것을 의미합니다. 그러나 현재로서는 통계적 접근 방식의 틀 내에서 직접적으로 발생한 인식 방법을 포함하여 대부분의 인식 방법에 대해 만족스러운 정당성을 찾지 못했습니다. 또한 베이지안 신념 네트워크는 물론이고 Fisher 선형 판별식, Parzen 창, EM 알고리즘, 최근접 이웃 방법 등 현재 가장 일반적으로 사용되는 통계 알고리즘은 휴리스틱 특성이 강하며 다음과 같이 해석할 수 있습니다. 통계적인 것과 다릅니다. 그리고 마지막으로, 위의 모든 사항에 통계의 주요 문제인 인식 방법의 점근적 동작 외에도 인식의 실행은 훨씬 더 뛰어난 방법의 계산적 및 구조적 복잡성에 대한 질문을 제기한다는 점을 추가해야 합니다. 확률 이론의 범위만.

따라서 패턴 인식을 통계의 한 분야로 간주하려는 통계학자의 열망과는 달리 인식의 실천과 이념에는 완전히 다른 아이디어가 포함되었습니다. 그 중 하나는 시각적 패턴 인식 분야의 연구로 인해 발생했으며 다음과 같은 비유를 기반으로 합니다.

이미 언급했듯이 일상 생활에서 사람들은 다양한 상황, 청각 및 시각적 이미지를 인식하는 문제를 지속적으로 (종종 무의식적으로) 해결합니다. 컴퓨터의 이러한 기능은 기껏해야 미래의 일입니다. 따라서 패턴 인식 분야의 일부 선구자들은 컴퓨터에서 이러한 문제를 해결하려면 일반적으로 인간의 사고 과정을 모델로 삼아야 한다고 결론지었습니다. 이 각도에서 문제에 접근하려는 가장 유명한 시도는 퍼셉트론에 대한 F. Rosenblatt의 유명한 연구였습니다.

50년대 중반이 되자 신경생리학자들은 뇌의 물리적 원리를 이해한 것 같았습니다. (영국의 유명한 이론물리학자 R. 펜로즈는 "The New Mind of the King"이라는 책에서 뇌의 신경망 모델에 흥미로운 질문을 던졌습니다. 기능에 있어 양자역학적 효과의 중요한 역할 그러나 이 모델은 처음부터 의문의 여지가 있었습니다. 이러한 발견을 바탕으로 F. Rosenblatt는 시각적 이미지 인식 학습을 위한 모델을 개발했으며 이를 퍼셉트론이라고 부릅니다. Rosenblatt의 퍼셉트론은 다음 기능(그림 1):

그림 1. 퍼셉트론 회로

입력에서 퍼셉트론은 객체 벡터를 수신합니다. Rosenblatt의 작업에서는 화면 픽셀 중 이미지에 의해 검게 변하는 픽셀과 그렇지 않은 픽셀을 보여주는 이진 벡터였습니다. 다음으로, 각 기호는 뉴런의 입력에 공급되며, 그 작용은 뉴런의 특정 가중치에 대한 단순한 곱셈입니다. 결과는 마지막 뉴런에 입력되어 총합을 특정 임계값과 비교합니다. 비교 결과에 따라 입력 객체 X가 필수인지 여부가 인식됩니다. 그런 다음 패턴 인식을 가르치는 작업은 퍼셉트론이 선행 시각적 이미지에 대해 올바른 답을 제공할 수 있도록 뉴런 가중치와 임계값을 선택하는 것이었습니다. Rosenblatt는 입력된 개체가 선례에 속하지 않더라도 결과 함수가 원하는 시각적 이미지를 잘 인식할 수 있을 것이라고 믿었습니다. 생체 공학적 이유로 그는 가중치와 임계값을 선택하는 방법도 제시했지만 이에 대해서는 자세히 설명하지 않겠습니다. 그의 접근 방식이 여러 인식 문제에서 성공한 것으로 밝혀졌고, 퍼셉트론이 특별한 경우인 신경망을 기반으로 한 학습 알고리즘에 대한 전체 연구 방향이 탄생했다고 가정해 보겠습니다.

또한 퍼셉트론의 다양한 일반화가 발명되었으며 뉴런의 기능이 복잡해졌습니다. 이제 뉴런은 입력 숫자를 곱하거나 더하고 결과를 임계값과 비교할 수 있을 뿐만 아니라 더 복잡한 기능을 입력에 적용할 수 있습니다. 그림 2는 이러한 뉴런 합병증 중 하나를 보여줍니다.

쌀. 2 신경망의 다이어그램.

또한 신경망의 토폴로지는 Rosenblatt가 고려한 것보다 훨씬 더 복잡할 수 있습니다. 예를 들면 다음과 같습니다.

쌀. 3. Rosenblatt 신경망 다이어그램.

합병증으로 인해 훈련 중에 조정 가능한 매개변수 수가 증가했지만 동시에 매우 복잡한 패턴으로 조정하는 능력도 향상되었습니다. 이 분야에 대한 연구는 현재 밀접하게 관련된 두 가지 방향으로 진행되고 있습니다. 다양한 네트워크 토폴로지와 다양한 구성 방법이 연구되고 있습니다.

신경망은 현재 패턴 인식 문제를 해결하기 위한 도구일 뿐만 아니라 연관 기억 및 이미지 압축에 대한 연구에도 사용되어 왔습니다. 이 연구 영역은 패턴 인식 문제와 밀접하게 교차하지만 사이버네틱스의 별도 분야를 나타냅니다. 현재 인식기의 경우 신경망은 매우 구체적으로 정의되고 매개변수적으로 정의된 매핑 세트에 지나지 않습니다. 이러한 의미에서 아래에 간략하게 나열될 다른 유사한 학습 모델에 비해 큰 이점이 없습니다.

인식 자체를 위한 신경망의 역할에 대한 평가와 관련하여(즉, 현재 가장 중요한 생체공학이 아닌) 다음 사항에 주목하고 싶습니다. 분석을 올바르게 사용하면 데이터에서 매우 사소하지 않은 법칙을 찾는 것이 가능해집니다. 일반적으로 분석의 어려움은 복잡한 구조와 결과적으로 다양한 패턴을 일반화할 수 있는 실질적으로 무한한 가능성으로 설명됩니다. 그러나 이러한 이점은 흔히 발생하는 것처럼 잠재적인 오류와 재교육 가능성의 원인이 됩니다. 아래에서 논의되겠지만, 모든 학습 모델의 전망에 대한 이중 관점은 기계 학습의 원리 중 하나입니다.

또 다른 대중적인 인식 방향은 논리적 규칙과 의사 결정 트리입니다. 위에서 언급한 인식 방법과 비교하여 이러한 방법은 아마도 가장 자연스러운 (의식 수준에서) 구조, 즉 논리적 규칙의 형태로 주제 영역에 대한 지식을 표현하는 아이디어를 가장 적극적으로 사용합니다. 기본 논리 규칙은 "분류할 수 없는 특성이 X 관계에 있으면 분류된 특성은 Y 관계에 있습니다."와 같은 진술을 의미합니다. 의료 진단에서 이러한 규칙의 예는 다음과 같습니다. 환자가 60세 이상이고 이전에 심장마비를 앓은 적이 있는 경우 수술을 수행하지 마십시오. 부정적인 결과가 발생할 위험이 높습니다.

데이터에서 논리적 규칙을 검색하려면 규칙의 "정보성" 척도와 규칙의 공간을 결정하는 두 가지가 필요합니다. 그리고 규칙을 검색하는 작업은 가장 유용한 정보를 찾기 위해 규칙 공간에서 전체 또는 부분을 열거하는 작업으로 전환됩니다. 정보 콘텐츠의 정의는 다양한 방식으로 도입될 수 있으며, 이것이 모델의 특정 매개변수이기도 하다는 점을 고려하여 이에 대해 자세히 설명하지 않겠습니다. 검색 공간은 표준 방식으로 정의됩니다.

충분한 정보를 제공하는 규칙을 찾은 후 규칙을 최종 분류자로 "조립"하는 단계가 시작됩니다. 여기에서 발생하는 문제(상당수의 문제가 있음)에 대해 깊이 논의하지 않고 "조립"의 두 가지 주요 방법을 나열하겠습니다. 첫 번째 유형은 선형 목록입니다. 두 번째 유형은 가중치 투표(Weighted vote)로, 각 규칙에 특정 가중치가 할당되고 분류기에 의해 가장 많은 수의 규칙이 투표된 클래스에 객체가 할당됩니다.

실제로 규칙 구성 단계와 "조립" 단계는 함께 수행되며, 가중치 투표 또는 목록을 구성할 때 사례 데이터의 일부에 대한 규칙 검색이 데이터와 모델 간의 더 나은 적합성을 보장하기 위해 계속해서 호출됩니다. .

그리고 표지판. 이러한 문제는 예를 들어 신호등을 따라 길을 건너거나 지나갈 때 자주 해결됩니다. 불이 켜진 신호등의 색상을 인식하고 도로의 규칙을 알면 현재 길을 건너도 되는지, 아니면 건너갈 수 없는지에 대한 올바른 결정을 내릴 수 있습니다.

생물학적 진화 과정에서 많은 동물들은 시각 및 청각 장치의 도움으로 문제를 해결했습니다. 패턴 인식충분하다. 인공 시스템의 생성 패턴 인식여전히 복잡한 이론적, 기술적 문제로 남아 있습니다. 이러한 인식에 대한 필요성은 군사 업무 및 보안 시스템부터 모든 종류의 아날로그 신호의 디지털화에 이르기까지 다양한 영역에서 발생합니다.

전통적으로 패턴 인식 작업은 인공지능 작업 범위에 포함됩니다.

패턴 인식의 방향

두 가지 주요 방향을 구분할 수 있습니다.

생명체가 가지고 있는 인식 능력을 연구하고, 이를 설명하고, 모델링하는 것;
응용 분야의 개별 문제를 해결하도록 설계된 장치 구성에 대한 이론 및 방법 개발.

문제에 대한 공식적인 설명

패턴 인식은 중요하지 않은 데이터의 전체 질량에서 해당 데이터를 특징짓는 중요한 특징을 식별하여 소스 데이터를 특정 클래스에 할당하는 것입니다.

인식 문제를 설정할 때 실험을 통해 결과를 얻는 것이 기초인 인공신경망 이론과 달리 실험을 논리적 추론과 수학적 증명으로 대체하려고 하는 등 수학적 언어를 사용하려고 한다.

단색 이미지는 패턴 인식 문제에서 가장 자주 고려되며, 이는 이미지를 평면상의 함수로 간주하는 것을 가능하게 합니다. 평면에 설정된 점을 고려하면 티, 여기서 함수는 엑스(엑스,와이) 밝기, 투명도, 광학 밀도 등 이미지의 각 지점에서 특성을 표현하며 이러한 기능은 이미지의 공식적인 기록입니다.

가능한 모든 기능의 집합 엑스(엑스,와이) 표면에 티- 모든 이미지 세트의 모델이 있습니다. 엑스. 개념 소개 유사점이미지 사이에 인식 작업을 수행할 수 있습니다. 그러한 진술의 구체적인 유형은 하나 또는 다른 접근 방식에 따른 후속 인식 단계에 따라 크게 달라집니다.

패턴 인식 방법

광학 패턴 인식의 경우 다양한 각도, 축척, 오프셋 등에서 개체의 뷰를 검색하는 방법을 사용할 수 있습니다. 문자의 경우 글꼴, 글꼴 속성 등을 정렬해야 합니다.

두 번째 접근 방식은 객체의 윤곽선을 찾고 객체의 속성(연결성, 모서리 존재 등)을 검사하는 것입니다.

또 다른 접근 방식은 인공 신경망을 사용하는 것입니다. 이 방법에는 인식 작업의 많은 예(정답 포함) 또는 이 작업의 세부 사항을 고려하는 특수 신경망 구조가 필요합니다.

패턴 인식 방법으로서의 퍼셉트론

F. Rosenblatt는 구조와 기능적 특성이 알려진 일부 물리적 시스템에서 심리적 현상이 어떻게 발생할 수 있는지 보여주는 뇌 모델의 개념을 소개합니다. 그는 가장 간단하게 설명했습니다. 차별 실험. 이러한 실험은 전적으로 패턴 인식 방법과 관련되어 있지만 솔루션 알고리즘이 결정적이지 않다는 점에서 다릅니다.

특정 시스템에 대해 심리적으로 중요한 정보를 얻을 수 있는 가장 간단한 실험은 모델에 두 가지 다른 자극이 제시되고 이에 대해 서로 다른 방식으로 반응해야 한다는 사실로 요약됩니다. 이러한 실험의 목적은 실험자의 개입 없이 시스템에 의한 자발적 차별 가능성을 연구하는 것일 수도 있고, 반대로 실험자가 시스템을 훈련시키려는 강제 차별을 연구하는 것일 수도 있습니다. 필요한 분류를 수행합니다.

퍼셉트론 훈련 실험에서는 일반적으로 구별할 각 클래스의 대표자를 포함하는 특정 이미지 시퀀스가 제시됩니다. 기억 수정의 일부 규칙에 따라 올바른 반응 선택이 강화됩니다. 그런 다음 퍼셉트론에 제어 자극이 제공되고 주어진 클래스의 자극에 대해 올바른 응답을 얻을 확률이 결정됩니다. 선택한 제어 자극이 훈련 시퀀스에 사용된 이미지 중 하나와 일치하는지 또는 일치하지 않는지에 따라 다른 결과가 얻어집니다.

1. 제어 자극이 훈련 자극과 일치하지 않으면 실험은 순수한 차별이지만 요소도 포함됩니다. 일반화.
2. 제어 자극이 이전에 제시된 동일한 클래스 자극의 영향으로 활성화된 요소와 완전히 다른 특정 감각 요소 세트를 자극하는 경우 실험은 연구입니다. 순수 일반화 .

퍼셉트론에는 순수 일반화 능력이 없지만 판별 실험에서는 매우 만족스럽게 기능합니다. 특히 제어 자극이 퍼셉트론이 이미 일부 경험을 축적한 이미지 중 하나와 충분히 밀접하게 일치하는 경우 더욱 그렇습니다.

패턴 인식 문제의 예

문자 인식.
바코드 인식.
번호판 인식.
얼굴 인식.
음성 인식.
이미지 인식.
광물 매장지가 위치한 지각의 국지적 영역을 인식합니다.

패턴 인식 프로그램

또한보십시오

노트

연결

유리 리프쉬츠. "이론 컴퓨터 과학의 현대 문제" 과정 - 패턴 인식, 얼굴 인식, 텍스트 분류의 통계적 방법에 대한 강의
패턴인식연구저널

문학

데이비드 A. 포사이스, 진 폰스컴퓨터 시각 인식. 현대적인 접근 방식 = 컴퓨터 비전: 현대적인 접근 방식. - M.: "Williams", 2004. - P. 928. - ISBN 0-13-085198-1
조지 스톡먼, 린다 샤피로컴퓨터 비전 = 컴퓨터 비전. -M .: Binom. 지식연구소, 2006. - P. 752. - ISBN 5947743841

A.L.Gorelik, V.A.Skripkin, 인식 방법, M.: 고등 학교, 1989.
Sh.-K. 쳉, 시각 정보 시스템의 설계 원리, M.: Mir, 1994.

위키미디어 재단. 2010.

- 기술 분야에서는 특정 대상(객체, 프로세스, 현상, 상황, 신호)이 진보 중 하나에 속함을 확립하기 위한 방법 개발 및 시스템 구축(컴퓨터 기반 포함)과 관련된 과학적, 기술적 방향을 의미합니다. ... ... 큰 백과사전

새로운 지역 중 하나 사이버네틱스. R.o 이론의 내용. 여러 클래스에 속하는 객체(이미지)의 속성을 어떤 의미에서는 해당 클래스에 가까운 객체로 추정하는 것입니다. 일반적으로 자동인형 R.o를 훈련할 때. 사용 가능... ... 지질백과사전

영어 인식, 이미지; 독일 사람 게슈탈트 변경. 물체를 특징짓는 유한한 특징 세트로 설명되는 물체를 분류하고 식별하기 위한 원리와 방법을 개발하는 수학적 사이버네틱스의 한 분야입니다. 안티나치. 백과사전... ... 사회학백과사전

패턴 인식- 컴퓨터를 사용하여 복잡한 물체를 연구하는 방법 특징을 선택하고 컴퓨터가 이러한 특징을 기반으로 개체를 자동으로 분류할 수 있도록 하는 알고리즘과 프로그램을 개발하는 것으로 구성됩니다. 예를 들어, 다음 중 무엇을 결정합니다... ... 경제 및 수학 사전

- (기술적) 특정 대상(객체, 프로세스, 현상, 상황, 신호)이 진보 중 하나에 속함을 확립하기 위한 방법 개발 및 시스템 구축(컴퓨터 기반 시스템 포함)과 관련된 과학적, 기술적 방향 ... ... 백과사전

패턴 인식- 특정 기호 또는 속성의 한정된 집합으로 설명할 수 있는 모든 객체의 객체, 현상, 프로세스, 신호, 상황을 분류하고 식별하는 방법을 개발하는 수학적 사이버네틱스 섹션... ... 러시아 사회학 백과사전

패턴 인식- 160 패턴 인식: 자동 수단을 사용하여 표현 및 구성의 형태 식별

인간을 포함한 생명체는 출현 이후 끊임없이 패턴 인식 문제에 직면해 왔습니다. 특히, 감각에서 나오는 정보는 뇌에 의해 처리되고, 뇌는 정보를 분류하고 의사 결정을 내린 다음 전기화학적 자극을 사용하여 필요한 신호를 예를 들어 운동 기관에 전달합니다. 필요한 조치. 그러면 환경이 바뀌고, 위와 같은 현상이 다시 발생하게 됩니다. 그리고 보면 각 단계마다 인식이 동반된다.

컴퓨터 기술의 발달로 삶의 과정에서 발생하는 여러 가지 문제를 해결하고 결과의 질을 촉진하고 속도를 높이며 향상시키는 것이 가능해졌습니다. 예를 들어, 다양한 생명 유지 시스템의 작동, 인간-컴퓨터 상호 작용, 로봇 시스템의 출현 등이 있습니다. 그러나 현재 일부 작업(빠르게 움직이는 유사한 물체의 인식)에서는 만족스러운 결과를 제공할 수 없다는 점에 주목합니다. , 손으로 쓴 텍스트).

작업 목적: 이미지 인식 시스템의 역사를 연구합니다.

패턴 인식 분야에서 이론적, 기술적 측면에서 발생한 질적 변화를 설명하고 그 이유를 나타냅니다.

컴퓨팅에 사용되는 방법과 원리에 대해 토론합니다.

가까운 장래에 예상되는 전망의 예를 들어보십시오.

1. 패턴 인식이란 무엇입니까?

컴퓨터 기술에 대한 최초의 연구는 주로 수학적 모델, 알고리즘 및 계산과 같은 고전적인 수학적 모델링 방식을 따랐습니다. 이는 원자폭탄 폭발 중에 발생하는 과정을 모델링하고, 탄도 궤적을 계산하고, 경제 및 기타 적용을 수행하는 작업이었습니다. 그러나 이 시리즈의 고전적인 아이디어 외에도 완전히 다른 성격을 기반으로 한 방법이 등장했으며 일부 문제를 해결하는 실습에서 알 수 있듯이 지나치게 복잡한 수학적 모델을 기반으로 한 솔루션보다 더 나은 결과를 제공하는 경우가 많습니다. 그들의 생각은 연구 대상의 철저한 수학적 모델을 만들려는 욕구를 버리고(게다가 적절한 모델을 구성하는 것이 거의 불가능했던 경우가 많았음) 대신에 우리가 관심을 갖는 특정 질문에 대한 답변에만 만족하고, 다양한 종류의 문제에 공통적으로 적용되는 고려 사항에서 이러한 답을 찾으십시오. 이러한 종류의 연구에는 시각적 이미지 인식, 작물 수확량 예측, 강 수위 예측, 간접적인 지구물리학적 데이터를 기반으로 석유 함유 및 대수층을 구별하는 작업 등이 포함됩니다. 이러한 작업에 대한 구체적인 답변은 다음과 같이 상당히 간단한 형식으로 필요했습니다. 예를 들어 객체가 접두사 클래스 중 하나에 속하는지 여부입니다. 그리고 이러한 작업의 초기 데이터는 일반적으로 사전 분류된 개체 집합의 형태와 같이 연구 대상 개체에 대한 단편적인 정보 형태로 제공되었습니다. 수학적 관점에서 볼 때 이는 패턴 인식(그리고 이것이 우리나라에서 이러한 종류의 문제라고 불리는 방식)이 함수 외삽 아이디어의 광범위한 일반화임을 의미합니다.

기술 과학에 대한 그러한 진술의 중요성은 의심의 여지가 없으며, 이는 그 자체로 이 분야에 대한 수많은 연구를 정당화합니다. 그러나 패턴 인식의 문제는 자연 과학에 있어서도 더 넓은 측면을 가지고 있습니다. (그러나 인공 사이버네틱스 시스템에 그렇게 중요한 것이 자연 시스템에 중요하지 않다면 이상할 것입니다.) 이 과학의 맥락에는 고대 철학자들이 우리 지식의 본질, 주변 세계의 이미지, 패턴 및 상황을 인식하는 능력에 대해 제기한 질문도 유기적으로 포함되었습니다. 사실, 다가오는 위험한 포식자나 음식의 이미지와 같은 가장 단순한 이미지를 인식하는 메커니즘이 기본 언어 및 형식적 논리 장치의 출현보다 훨씬 일찍 형성되었다는 것은 의심의 여지가 없습니다. 그리고 그러한 메커니즘이 고등 동물에서 상당히 발달했다는 것은 의심의 여지가 없습니다. 고등 동물의 생활 활동에서도 다소 복잡한 자연 징후 시스템을 구별하는 능력이 시급히 필요합니다. 따라서 자연에서 우리는 사고와 의식의 현상이 이미지를 인식하는 능력에 기반을 두고 있음을 알 수 있으며, 지능 과학의 발전은 인식의 기본 법칙에 대한 이해의 깊이와 직접적으로 관련되어 있음을 알 수 있습니다. 위의 문제가 패턴 인식의 표준 정의를 훨씬 뛰어넘는다는 사실을 이해하면(영어 문헌에서는 지도 학습이라는 용어가 더 일반적임) 상대적으로 좁은 범위의 문제와 깊은 연관이 있다는 점도 이해해야 합니다(그러나 여전히 지친 것과는 거리가 먼) 방향.

이미 패턴 인식은 일상 생활의 필수적인 부분이 되었으며 현대 엔지니어의 가장 중요한 지식 중 하나입니다. 의학에서 패턴 인식은 의사가 보다 정확한 진단을 내리는 데 도움이 되며, 공장에서는 제품 배치의 결함을 예측하는 데 사용됩니다. 알고리즘의 핵심인 생체 인식 개인 식별 시스템도 이 분야의 결과를 기반으로 합니다. 인공 지능의 추가 개발, 특히 인간에게 자연스러운 언어와 음성을 통해 인간과 보다 직접적으로 소통할 수 있는 5세대 컴퓨터의 설계는 인식 없이는 상상할 수 없습니다. 인식 시스템을 중요한 하위 시스템으로 포함하는 로봇 공학 및 인공 제어 시스템과 매우 가깝습니다.

그렇기 때문에 처음부터 패턴 인식의 개발은 사이버네틱스, 신경 생리학자, 심리학자, 수학자, 경제학자 등 다양한 분야의 전문가로부터 많은 관심을 끌었습니다. 현대적인 패턴 인식 자체가 이러한 분야의 아이디어에 의해 촉진되는 것은 주로 이러한 이유 때문입니다. 완전성을 주장하지 않고(짧은 에세이로 주장하는 것도 불가능함) 패턴 인식의 역사와 핵심 아이디어를 설명합니다.

정의

패턴 인식의 주요 방법을 진행하기 전에 몇 가지 필요한 정의를 제시합니다.

패턴 인식(객체, 신호, 상황, 현상 또는 프로세스)은 객체를 식별하거나 객체의 이미지(광학 인식) 또는 오디오 녹음(음향 인식) 및 기타 특성을 통해 객체의 속성을 결정하는 작업입니다.

기본적인 것 중 하나는 특정한 공식이 없는 집합의 개념이다. 컴퓨터에서 집합은 동일한 유형의 반복되지 않는 요소 집합으로 표시됩니다. "비반복"이라는 단어는 집합의 일부 요소가 존재하거나 존재하지 않음을 의미합니다. 보편적 집합은 해결하려는 문제에 가능한 모든 요소를 포함하고, 빈 집합은 아무것도 포함하지 않습니다.

이미지는 특정 기준에 따라 특정 개체 그룹을 통합(강조 표시)하는 분류 시스템의 분류 그룹입니다. 이미지는 동일한 세트의 유한한 수의 현상에 익숙해지면 임의로 많은 수의 대표자를 인식할 수 있다는 사실에서 나타나는 특징적인 속성을 가지고 있습니다. 이미지는 서로 다른 관찰 자료에 대해 훈련받은 서로 다른 사람들이 대부분 동일한 대상을 동일한 방식으로 서로 독립적으로 분류한다는 점에서 특징적인 객관적 속성을 가지고 있습니다. 인식 문제의 고전적 공식화에서 보편 집합은 이미지 부분으로 나뉩니다. 인식 시스템의 지각 기관에 대한 객체의 각 매핑은 이러한 기관과 관련된 위치에 관계없이 일반적으로 객체의 이미지라고 불리며, 일부 공통 속성으로 통합된 이러한 이미지 세트는 이미지입니다.

이미지에 요소를 할당하는 방법을 결정적인 규칙이라고 합니다. 또 다른 중요한 개념은 보편적 세트의 요소 사이의 거리를 결정하는 방법인 미터법입니다. 이 거리가 작을수록 우리가 인식하는 물체(기호, 소리 등)는 더 유사해집니다. 일반적으로 요소는 숫자 집합으로 지정되고 메트릭은 함수로 지정됩니다. 프로그램의 효율성은 이미지 표현과 측정항목 구현의 선택에 따라 달라집니다. 측정항목이 다른 하나의 인식 알고리즘은 빈도가 다른 실수를 범하게 됩니다.

학습은 일반적으로 외부 조정 시스템에 반복적으로 노출되어 특정 시스템에서 외부 동일한 신호 그룹에 대한 하나 또는 다른 반응을 개발하는 프로세스라고 합니다. 이러한 훈련의 외부 조정을 일반적으로 "보상" 및 "처벌"이라고 합니다. 이 조정을 생성하는 메커니즘은 학습 알고리즘을 거의 완전히 결정합니다. 자가 학습은 시스템에 대한 반응의 정확성에 대한 추가 정보가 제공되지 않는다는 점에서 훈련과 다릅니다.

적응은 초기 불확실성과 변화하는 작동 조건 하에서 시스템의 특정 상태를 달성하기 위해 현재 정보를 기반으로 시스템의 매개변수와 구조, 가능한 제어 조치를 변경하는 프로세스입니다.

학습은 시스템이 특정 외부 영향 세트에 대해 필요한 반응으로 대응하는 능력을 점차적으로 획득하는 프로세스이며, 적응은 필요한 제어 품질을 달성하기 위해 시스템의 매개변수 및 구조를 조정하는 것입니다. 외부 조건의 지속적인 변화에 직면하여.

패턴 인식 작업의 예: - 문자 인식;

지도 시간

나는 오랫동안 이미지 인식의 기본 사항, 기본 방법에 대한 일종의 가이드, 언제 사용하는지, 어떤 문제를 해결하는지, 저녁에 무릎을 꿇고 무엇을 할 수 있는지, 무엇을 할 수 있는지를 포함하는 일반 기사를 쓰고 싶었습니다. 20대에 사람들로 구성된 팀이 없으면 생각하지 않는 것이 좋습니다.

저는 오랫동안 광학 인식에 관한 기사를 써왔기 때문에 한 달에 두 번씩 다양한 사람들이 이 주제에 대한 질문을 저에게 보내왔습니다. 때로는 다른 세계에서 그들과 함께 살고 있다는 느낌을 갖습니다. 한편으로는 그 사람이 관련 주제의 전문가일 가능성이 높지만 광학 인식 방법에 대해서는 거의 알지 못한다는 것을 이해합니다. 그리고 가장 짜증나는 것은 그가 가까운 지식 분야의 방법을 적용하려고한다는 것입니다. 이는 논리적이지만 이미지 인식에서는 완전히 작동하지 않지만 이것을 이해하지 못하고 그에게 무언가를 말하기 시작하면 매우 기분이 상합니다. 아주 기본적인 것. 그리고 기본부터 이야기하는 데 시간이 많이 걸리고, 그럴 수 없는 경우가 많다는 점을 생각하면 더욱 안타깝습니다.

이 기사는 이미지 인식 방법을 사용해 본 적이 없는 사람이 10~15분 안에 주제에 해당하는 세상에 대한 특정 기본 그림을 머릿속에 만들고 어느 방향으로 파헤칠지 이해할 수 있도록 작성되었습니다. 여기에 설명된 많은 기술은 레이더 및 오디오 처리에 적용 가능합니다.
잠재 고객이나 광학 인식을 시작하려는 사람에게 항상 이야기하기 시작하는 몇 가지 원칙부터 시작하겠습니다.

문제를 해결할 때는 항상 가장 단순한 것부터 해결하십시오. 사람을 따라가며 계단식으로 강조 표시하는 것보다 사람에게 주황색 태그를 붙이는 것이 훨씬 쉽습니다. 초해상도 알고리즘을 개발하는 것보다 더 높은 해상도의 카메라를 사용하는 것이 훨씬 쉽습니다.
광학 인식 방법에서 문제를 엄격하게 공식화하는 것은 시스템 프로그래밍 문제보다 훨씬 더 중요합니다. 기술 사양에 단어 하나를 추가하면 작업의 50%가 추가될 수 있습니다.
인식 문제에 대한 보편적인 해결책은 없습니다. 단순히 "모든 비문을 인식"하는 알고리즘을 만들 수는 없습니다. 거리의 표지판과 텍스트 시트는 근본적으로 다른 개체입니다. 일반적인 알고리즘(Google의 좋은 예)을 만드는 것이 가능할 수도 있지만 이를 위해서는 대규모 팀의 많은 작업이 필요하고 수십 개의 서로 다른 서브루틴으로 구성됩니다.
OpenCV는 많은 방법이 있고 거의 모든 문제의 50%를 해결할 수 있는 성경이지만 OpenCV는 실제로 수행할 수 있는 작업의 극히 일부에 불과합니다. 한 연구에서는 "OpenCV 방법으로는 문제를 해결할 수 없으므로 해결할 수 없습니다."라는 결론을 내렸습니다. 이를 피하고 게으르지 말고 OpenCV 템플릿을 사용하지 않고 매번 처음부터 현재 작업을 진지하게 평가하십시오.

보편적인 조언을 제공하거나 임의의 컴퓨터 비전 문제에 대한 솔루션을 구축할 수 있는 일종의 구조를 만드는 방법을 알려주는 것은 매우 어렵습니다. 이 글의 목적은 사용할 수 있는 것을 구조화하는 것입니다. 기존 방식을 세 가지로 나누어서 시도해 보도록 하겠습니다. 첫 번째 그룹은 예비 필터링 및 이미지 준비입니다. 두 번째 그룹은 필터링 결과의 논리적 처리입니다. 세 번째 그룹은 논리적 처리를 기반으로 한 의사결정 알고리즘입니다. 그룹 간의 경계는 매우 임의적입니다. 문제를 해결하기 위해 항상 모든 그룹의 방법을 사용할 필요는 없으며 때로는 두 가지로 충분할 때도 있고 때로는 하나만 사용할 수도 있습니다.

여기에 제공된 방법 목록은 완전하지 않습니다. 제가 작성하지 않은 댓글에 비판적 방법을 추가하고 각 댓글에 2~3개의 동반 단어를 부여하는 것이 좋습니다.

1부. 여과

이 그룹에서는 이미지를 분석하지 않고 이미지의 관심 영역을 선택할 수 있는 방법을 배치했습니다. 이러한 방법의 대부분은 이미지의 모든 점에 일종의 단일 변환을 적용합니다. 필터링 수준에서는 이미지 분석이 수행되지 않지만 필터링된 포인트는 특별한 특성을 가진 영역으로 간주될 수 있습니다.

임계값별 이진화, 히스토그램 영역 선택

가장 간단한 변환은 임계값을 기준으로 이미지를 이진화하는 것입니다. RGB 및 회색조 이미지의 경우 임계값은 색상 값입니다. 그러한 변환만으로 충분한 이상적인 문제가 있습니다. 흰색 종이에 있는 객체를 자동으로 선택한다고 가정해 보겠습니다.

이진화가 발생하는 임계값을 선택하면 이진화 프로세스 자체가 크게 결정됩니다. 이 경우 이미지는 평균 색상으로 이진화되었습니다. 일반적으로 이진화는 임계값을 적응적으로 선택하는 알고리즘을 사용하여 수행됩니다. 이러한 알고리즘은 기대 또는 모드를 선택할 수 있습니다. 또는 히스토그램에서 가장 큰 피크를 선택할 수 있습니다.

이진화는 RGB가 아닌 HSV의 이미지를 고려하는 상황을 포함하여 히스토그램으로 작업할 때 매우 흥미로운 결과를 제공할 수 있습니다. 예를 들어 관심 있는 세그먼트 색상이 있습니다. 이 원리에 따라 태그 감지기와 사람 피부 감지기를 모두 구축할 수 있습니다.

클래식 필터링: 푸리에, 저역 통과 필터, 고역 통과 필터

전통적인 레이더 필터링 및 신호 처리 방법은 다양한 패턴 인식 작업에 성공적으로 적용될 수 있습니다. 순수한 형태의 이미지에서는 거의 사용되지 않는 레이더의 전통적인 방법은 푸리에 변환(더 구체적으로 FFT)입니다. 1차원 푸리에 변환이 사용되는 몇 가지 예외 중 하나는 이미지 압축입니다. 이미지 분석의 경우 일반적으로 1차원 변환으로는 충분하지 않으며 훨씬 더 리소스 집약적인 2차원 변환을 사용해야 합니다.

실제로 이를 계산하는 사람은 거의 없습니다. 일반적으로 높은(HPF) 또는 낮은(LPF) 주파수에 맞게 조정된 기성 필터를 사용하여 관심 영역의 컨볼루션을 사용하는 것이 훨씬 빠르고 쉽습니다. 물론 이 방법은 스펙트럼 분석을 허용하지 않지만 특정 비디오 처리 작업에서 일반적으로 필요한 것은 분석이 아니라 결과입니다.

저주파(가우스 필터)와 고주파(가보르 필터)를 강조하는 필터의 가장 간단한 예입니다.
각 이미지 포인트에 대해 창을 선택하고 동일한 크기의 필터를 곱합니다. 이러한 컨볼루션의 결과는 새로운 포인트 값입니다. 저역 통과 필터와 고역 통과 필터를 구현할 때 다음 유형의 이미지를 얻습니다.

웨이블릿

하지만 신호와의 컨볼루션을 위해 임의의 특성 함수를 사용하면 어떻게 될까요? 그런 다음 "Wavelet 변환"이라고 합니다. 웨이블릿에 대한 이러한 정의는 정확하지 않지만 전통적으로 많은 팀에서 웨이블릿 분석은 이 패턴의 모델과의 컨볼루션을 사용하여 이미지에서 임의의 패턴을 검색하는 것입니다. 웨이블릿 분석에 사용되는 일련의 고전적인 함수가 있습니다. 여기에는 Haar 웨이블릿, Morlet 웨이블릿, 멕시코 모자 웨이블릿 등이 포함됩니다. 이전 기사(,)에서 여러 차례 다루었던 Haar 기본 요소는 2차원 공간에 대한 이러한 기능과 관련이 있습니다.

위에는 클래식 웨이블릿의 4가지 예가 있습니다. 3차원 Haar 웨이블릿, 2차원 Meyer 웨이블릿, Mexican Hat 웨이블릿, Daubechies 웨이블릿. 웨이블릿의 확장된 해석을 사용하는 좋은 예는 눈에서 눈부심을 찾는 문제입니다. 여기서 웨이블릿은 눈부심 자체입니다.

고전적인 웨이블릿은 일반적으로 분류를 위해 사용됩니다(아래에 설명됨).

상관관계

내 입장에서 웨이블릿을 자유롭게 해석한 후에는 웨이블릿의 기초가 되는 실제 상관관계를 언급할 가치가 있습니다. 이는 이미지를 필터링할 때 없어서는 안될 도구입니다. 전통적인 응용 프로그램은 비디오 스트림을 상호 연결하여 변화 또는 광학 흐름을 찾는 것입니다. 가장 간단한 이동 검출기는 어떤 의미에서는 차이 상관기이기도 합니다. 이미지가 서로 연관되지 않은 곳에 움직임이 있었습니다.

필터링 기능

흥미로운 필터 클래스는 함수 필터링입니다. 이는 이미지(선, 포물선, 원)에서 간단한 수학 함수를 감지할 수 있는 순전히 수학 필터입니다. 원본 이미지의 각 지점에 대해 이를 생성하는 일련의 함수가 그려지는 누적 이미지가 구성됩니다. 가장 고전적인 변환은 선에 대한 Hough 변환입니다. 이 변환에서는 각 점(x;y)에 대해 동일성이 참인 직선 y=ax+b의 점 집합(a;b)이 그려집니다. 아름다운 사진을 얻을 수 있습니다:

(첫 번째 플러스는 그림과 이 정의에서 가장 먼저 문제점을 찾아서 설명하는 사람을 위한 것이며, 두 번째 플러스는 여기에 표시된 내용을 가장 먼저 말하는 사람을 위한 것입니다)
Hough 변환을 사용하면 매개변수화 가능한 함수를 찾을 수 있습니다. 예를 들어 원. 어떤 . 수학자들은 이러한 변화를 매우 좋아합니다. 하지만 안타깝게도 이미지를 처리할 때 항상 작동하는 것은 아닙니다. 작동 속도가 매우 느리고 이진화 품질에 대한 민감도가 매우 높습니다. 이상적인 상황에서도 나는 다른 방법을 사용하는 것을 선호했습니다.
직선에 대한 Hough 변환의 유사체는 Radon 변환입니다. FFT를 통해 계산되는데, 포인트가 많은 상황에서 성능상의 이득을 줍니다. 또한, 이진화되지 않은 이미지에도 적용할 수 있습니다.

윤곽 필터링

별도의 필터 클래스는 경계 및 윤곽선 필터링입니다. 윤곽선은 이미지 작업에서 해당 이미지의 개체 작업으로 전환할 때 매우 유용합니다. 객체가 상당히 복잡하지만 명확하게 구별할 수 있는 경우 해당 객체를 사용하는 유일한 방법은 윤곽선을 선택하는 것뿐입니다. 윤곽선 필터링 문제를 해결하는 여러 가지 알고리즘이 있습니다.

가장 자주 사용되는 것은 잘 작동하고 OpenCV에서 구현되는 Canny입니다(Sobel도 있지만 윤곽선 검색이 더 나쁩니다).

기타 필터

위에는 수정을 통해 문제의 80-90%를 해결하는 데 도움이 되는 필터가 있습니다. 그러나 그 외에도 로컬 작업에 사용되는 필터가 더 드물습니다. 그러한 필터가 수십 개 있으므로 모두 나열하지는 않겠습니다. 흥미로운 것은 반복 필터(예를 들어)뿐만 아니라 라돈 변환 분야의 전통적인 웨이블릿 필터링과 분석이 융합된 능선 및 곡선 변환입니다. 빔렛 변환은 웨이블렛 변환과 논리적 분석의 경계에서 아름답게 작동하여 윤곽을 강조할 수 있습니다.

그러나 이러한 변환은 매우 구체적이며 드문 작업에 맞게 조정되었습니다.

2부. 필터링 결과의 논리적 처리

필터링은 처리에 적합한 데이터 세트를 제공합니다. 그러나 종종 이 데이터를 처리하지 않고 단순히 가져와 사용할 수는 없습니다. 이 섹션에는 이미지에서 개체 속성 또는 개체 자체로 이동할 수 있는 몇 가지 고전적인 방법이 있습니다.

형태

제 생각에는 필터링에서 논리로의 전환은 수학적 형태학(,)의 방법입니다. 본질적으로 이는 이진 이미지를 늘리고 침식하는 가장 간단한 작업입니다. 이러한 방법을 사용하면 기존 요소를 늘리거나 줄여서 이진 이미지에서 노이즈를 제거할 수 있습니다. 수학적 형태론을 기반으로 한 윤곽 알고리즘도 있지만 일반적으로 일종의 하이브리드 알고리즘이나 조합된 알고리즘이 사용됩니다.

윤곽 분석

경계를 얻는 알고리즘은 필터링 섹션에서 이미 언급했습니다. 결과 경계는 매우 간단하게 윤곽선으로 변환됩니다. Canny 알고리즘의 경우 이는 자동으로 발생하며, 다른 알고리즘의 경우 추가 이진화가 필요합니다. 예를 들어 딱정벌레 알고리즘을 사용하여 이진 알고리즘에 대한 윤곽선을 얻을 수 있습니다.
윤곽선은 개체의 고유한 특성입니다. 이를 통해 개체의 윤곽선을 통해 개체를 식별할 수 있는 경우가 많습니다. 이를 가능하게 하는 강력한 수학적 장치가 있습니다. 이 장치를 윤곽분석(,)이라고 합니다.

솔직히 말해서 나는 실제 문제에 윤곽 분석을 적용해 본 적이 없습니다. 너무 이상적인 조건이 필요합니다. 경계가 없거나 소음이 너무 많습니다. 그러나 이상적인 조건에서 무언가를 인식해야 한다면 윤곽 분석이 훌륭한 옵션입니다. 매우 신속하고 아름다운 수학과 명확한 논리로 작동합니다.

특별 포인트

특이점(Singular Point)은 물체를 그 자체 또는 유사한 종류의 물체와 비교할 수 있게 해주는 물체의 고유한 특성입니다. 그러한 점을 식별하는 방법은 수십 가지가 있습니다. 일부 방법은 인접한 프레임의 특수 지점을 식별하고, 일부 방법은 오랜 시간이 지난 후 조명이 변경될 때 개체가 회전하더라도 남아 있는 특수 지점을 찾을 수 있도록 합니다. 그다지 안정적이지는 않지만 신속하게 계산되는 특별한 점을 찾을 수 있는 방법부터 시작해 복잡성을 증가시켜 보겠습니다.
1학년. 몇 초 동안 안정적인 특수 포인트입니다.이러한 점은 인접한 비디오 프레임 사이에서 개체를 안내하거나 인접한 카메라의 이미지를 결합하는 데 사용됩니다. 이러한 지점에는 이미지의 로컬 최대값, 이미지의 모서리(가장 좋은 검출기는 아마도 Charis 검출기일 수 있음), 최대 분산이 달성되는 지점, 특정 그라데이션 등이 포함됩니다.
이급. 조명의 변화와 물체의 작은 움직임에도 안정적인 특수 포인트입니다.이러한 포인트는 주로 객체 유형의 훈련 및 후속 분류에 사용됩니다. 예를 들어 보행자 분류기 또는 얼굴 분류기는 이러한 지점에 정확하게 구축된 시스템의 산물입니다. 이전에 언급한 웨이블릿 중 일부는 이러한 점의 기초가 될 수 있습니다. 예를 들어 Haar 기본 요소, 하이라이트 검색, 기타 특정 기능 검색 등이 있습니다. 이러한 점에는 HOG(방향 기울기 히스토그램) 방법으로 찾은 점이 포함됩니다.
병종. 안정적인 포인트.나는 완전한 안정성을 제공하는 두 가지 방법과 그 수정에 대해서만 알고 있습니다. 이것과 . 이미지를 회전할 때에도 특별한 점을 찾을 수 있습니다. 이러한 포인트 계산은 다른 방법에 비해 시간이 오래 걸리지만 시간이 상당히 제한되어 있습니다. 불행히도 이러한 방법은 특허를 받았습니다. 그러나 러시아에서는 알고리즘 특허가 불가능하므로 국내 시장에 활용한다.

3부. 훈련

이야기의 세 번째 부분은 이미지와 직접적으로 작동하지 않지만 결정을 내릴 수 있는 방법에 대해 다룰 것입니다. 기본적으로 이는 기계 학습 및 의사 결정의 다양한 방법입니다. Yandyx는 최근 이 주제에 대해 Habr에 게시했는데 거기에는 아주 좋은 선택이 있습니다. 여기는 텍스트 버전입니다. 주제에 대한 진지한 연구를 위해서는 시청을 적극 권장합니다. 여기서는 패턴 인식에 특별히 사용되는 몇 가지 주요 방법을 간략히 설명하겠습니다.
80%의 상황에서 인식 과제 학습의 본질은 다음과 같습니다.
여러 클래스의 개체가 포함된 테스트 샘플이 있습니다. 사진 속 인물의 존재/부재를 가정해 보세요. 각 이미지에는 Haar, HOG, SURF 또는 일부 웨이블릿과 같은 일부 기능으로 강조된 일련의 기능이 있습니다. 학습 알고리즘은 새로운 이미지를 분석하고 이미지에 어떤 객체가 있는지 결정할 수 있도록 모델을 구축해야 합니다.
어떻게 이루어졌나요? 각 테스트 이미지는 특징 공간의 한 지점입니다. 좌표는 이미지에 있는 각 특징의 가중치입니다. 표지판을 "눈의 존재", "코의 존재", "두 손의 존재", "귀의 존재" 등으로 설정합니다. 우리는 훈련된 기존 탐지기를 사용하여 이러한 모든 표지판을 강조 표시합니다. 인간과 유사한 신체 부위 그러한 공간에 있는 사람의 경우 정확한 지점은 입니다. 원숭이의 경우 말에 점을 찍으세요. 분류기는 예제 샘플을 사용하여 훈련됩니다. 그러나 모든 사진에 손이 있는 것은 아니고, 다른 사진에는 눈이 없었으며, 세 번째 사진에서는 분류 오류로 인해 원숭이의 코가 사람의 코를 갖게 되었습니다. 훈련된 인간 분류자는 첫 번째 특징이 0.5 범위에 있는 경우 다음과 같은 방식으로 특징 공간을 자동으로 분할합니다. 본질적으로 분류기의 목표는 분류 객체의 특징인 특징 공간의 영역을 그리는 것입니다. 다음은 2차원 공간에서 분류기 중 하나(AdaBoost)에 대한 답변의 순차적 근사치입니다.

분류자가 많이 있습니다. 그들 각각은 특정 작업에서 더 잘 작동합니다. 특정 작업에 대한 분류자를 선택하는 작업은 대체로 예술입니다. 다음은 주제에 관한 아름다운 사진입니다.

단순한 케이스, 1차원 분리

특징 공간이 1차원이고 2개의 클래스를 분리해야 하는 가장 간단한 분류 사례의 예를 살펴보겠습니다. 상황은 생각보다 자주 발생합니다. 예를 들어 두 신호를 구별해야 하거나 패턴을 샘플과 비교해야 하는 경우입니다. 훈련 샘플을 하나 만들어 보겠습니다. 이는 X축이 유사성의 척도이고 Y축이 그러한 척도를 갖는 이벤트 수인 이미지를 생성합니다. 원하는 객체가 자신과 유사하면 왼쪽 가우스를 얻습니다. 그렇지 않을 때 – 옳은 것. X=0.4 값은 잘못된 결정이 잘못된 결정을 내릴 가능성을 최소화하도록 샘플을 분리합니다. 그러한 구분자를 찾는 것이 분류 작업입니다.

작은 메모. 오류를 최소화하는 기준이 항상 최적인 것은 아닙니다. 다음 그래프는 실제 홍채인식 시스템의 그래프이다. 이러한 시스템의 경우, 허가받지 않은 사람이 시설에 잘못 입장할 가능성을 최소화하는 기준이 선택됩니다. 이 확률을 "제1종 오류", "거짓 경보 확률", "거짓 양성"이라고 합니다. 영문학 문헌에서 “False Access Rate”.
) AdaBusta는 가장 일반적인 분류기 중 하나입니다. 예를 들어, Haar 캐스케이드가 그 위에 세워졌습니다. 일반적으로 이진 분류가 필요할 때 사용되지만 더 많은 수의 클래스에 대한 훈련을 방해하는 것은 없습니다.
SVM ( , , , ) 많은 구현이 있는 가장 강력한 분류자 중 하나입니다. 기본적으로 제가 접한 학습 작업에서는 Adabusta와 유사하게 작동했습니다. 상당히 빠르다고 여겨지지만, 훈련이 아다부스타보다 어렵고 올바른 코어 선택이 필요합니다.

신경망과 회귀도 있습니다. 하지만 이들을 간략하게 분류하고 어떻게 다른지 보여주기 위해서는 이보다 훨씬 긴 글이 필요합니다.
________________________________________________
수학과 설명에 뛰어들지 않고도 사용된 방법에 대한 간략한 개요를 제공할 수 있었으면 좋겠습니다. 아마도 이것은 누군가에게 도움이 될 것입니다. 물론 기사는 불완전하고 스테레오 이미지 작업, Kalman 필터를 사용하는 LSM, 적응형 Bayes 접근 방식에 대한 단어는 없습니다.
기사가 마음에 들면 기존 ImageRecognition 문제가 어떻게 해결되는지에 대한 몇 가지 예를 선택하여 두 번째 부분을 작성해 보겠습니다.

그리고 마지막으로

무엇을 읽어야 할까요?
1) 한때 B. Yane의 "Digital Image Process"라는 책을 정말 좋아했습니다. 이 책은 간단하고 명확하게 작성되었지만 동시에 거의 모든 수학이 제공됩니다. 기존 방법에 익숙해지는 데 좋습니다.
2) 장르의 고전은 R. Gonzalez, R. Woods "Digital Image Process"입니다. 왠지 첫 번째 것보다 더 어려웠습니다. 수학은 훨씬 적지만 방법과 그림은 더 많습니다.
3) "컴퓨터 비전 문제의 이미지 처리 및 분석" - 물리학 및 기술학과에서 강의한 과정을 기반으로 작성되었습니다. 많은 방법과 자세한 설명이 있습니다. 하지만 제 생각에는 이 책에는 두 가지 큰 단점이 있습니다. 이 책은 함께 제공되는 소프트웨어 패키지에 크게 초점을 맞추고 있으며, 책에서 간단한 방법에 대한 설명이 너무 자주 수학적 정글로 바뀌어 이해하기 어렵습니다. 방법의 구조 다이어그램을 도출합니다. 그러나 저자는 거의 모든 콘텐츠가 표시되는 편리한 웹사이트인 wiki.technicalvision.ru를 만들었습니다. 태그 추가