I. Introduction
AI 등 4차산업혁명 관련 첨단기술을 중심으로 한 기술 패권경쟁 시대를 맞아 다양한 분야에서 AI 기술을 접목시키기 위해 노력하고 있다. 특히 국방 분야에서는 인공지능 기술을 통해 전장 상황을 판단 및 인식하고자 하는 다양한 노력이 진행되고 있다 [1].
구체적으로 지휘관은 기존의 C4I 체계 (command, control, communication, computer, intelligence)를 통해 전장상황을 인식 및 상황을 판단하고, 실시간으로 지휘통제하여 군에 임무를 하달한다. 그러나 개인의 경험과 전문성에 의존했던 기존의 지휘결심체계는 점점 더 복잡하고 다양해진 무기체계와 급격하게 변화하는 전장정보를 융합하여 지원해야 하는 미래 전장상황에 적용하는 데에는 분명한 한계가 있다.
따라서 지휘관에게 최선의 방책 제공 및 지휘결심을 지원하기 위해서는, 인공지능에 기반한 의사결정지원체계의 개발이 필요하다. 실제로 미국 국방성에서는 COMPASS (Collection and Monitoring via Planning for Active Situational Scenarios) [2], AIDA (Active Interpretation of Disparate Alternatives) [3]와 같은 전장 상황 판단 인공지능 프로젝트를 진행 중에 있다. 우리나라에서도 다양한 AI 군 참모 기술들이 개발되고 있으며 [4,5], 특히 최근 연구 [6]에서는 전장 상황 모의 시나리오를 기반으로 한 가설 데이터셋 생성 방법을 제안하였다.
인공지능 기술이 지휘관의 전장 상황 식별을 효과적으로 지원하기 위해서는 해당가설에 대한 주요 정보를 간략하게 추출하는 것이 중요하다 [1]. 앞서 언급한대로 변화하는 지휘체계에서는 수많은 복잡한 변수들을 지휘관이 한번에 판단하는 것이 어렵기 때문에, 빠른 시간 이내에 전장상황에 대하여 세운 여러 개의 가설들 중 어느 것이 적합한가를 정확하게 추론하는 것은 불가능하다.
본 논문에서는 전장 상황을 분석하여 적합한 가설을 추천하는 랭킹 모델을 제안한다. 랭킹 모델은 사용자가 정보를 검색했을 때 검색 결과를 나열하는 순위를 정하는 시스템으로, 주로 검색이나 추천 시스템에서 널리 사용되고 있다.
본 연구에서는 이러한 시스템을 국방 분야에 적용하여, 지휘관이 전달받는 전장 상황에 대한 여러 가설들을 나열하여 순위 및 점수를 정하는 기술을 개발하였다. 먼저 전문가의 의견을 반영하여 두 개의 가설을 비교하고 (pairwise comparison) 선호 여부를 레이블로 생성하였으며, 이를 샴 네트워크(Siamese Neural Network) [7] 형태로 학습하여 가설의 선호도 판단 모델을 개발하였다. 마지막으로 Spectral MLE [8] 알고리즘을 활용하여 각각의 가설에 대한 점수 및 우선순위를 측정하였다.
본 논문의 구성은 다음과 같다. 2장에서는 본 논문에 관련된 배경지식 및 용어에 대하여 설명한다. 3장에서는 제안하는 알고리즘의 자세한 내용에 대하여 설명한다. 4장에서는 제안하는 방법을 구현 및 실험을 통해 검증하고, 5장에서 결론을 맺는다.
II. Background
본 장에서는 연구 진행을 위한 시뮬레이션의 배경 및 세팅을 소개한다. 또한 서술한 배경 하에서 사용하게 될 데이터의 구조 및 생성방법을 설명한다.
1. Simulation Setting
선행 연구 [6]를 통해 실제 환경을 고려하여 모의용 배경 전장 상황을 구성하였으며, 이를 바탕으로 과거의 훈련 내용을 바탕으로 하여 모의 개체 간 관계와 행동 데이터를 설정한 모의 시나리오를 구축하였다.
모의 시나리오는 여러 개의 토픽으로 구성되어 있으며, 각각의 토픽에는 목적, 아군 및 적군의 부대 정보, 모의 장비 및 편성 계획, 조건, 작전지역, 일시 등이 포함되어 있다. 이러한 토픽 내에서 사용자가 사건, 개체, 관계 정보를 식별하여 후술하는 데이터 셋을 생성하였다.
2. Description of Terms
가설 데이터셋의 기본 단위는 전장 지식요소 중 사건 (Event)과 개체(Object)이다. 지식그래프 상에서 사건과 개체는 노드(Node)로 표현되며, 둘 사이의 관계 (Relation)는 엣지(Edge)로 표현된다. 가설 데이터셋은 Fig. 1과 같이 수많은 사건과 개체가 노드 및 엣지로 표현되어 연결된 지식그래프로 표현된다.
Fig. 1. Example of Battlefield Knowledge Graph
본 연구에서 고려하는 가설 데이터셋은 전장 상황 파악의 단계 및 범주에 따라 단위가설, 후보가설, 집합가설, 조합가설로 구분된다. 각각의 가설에 대한 설명은 Table. 1과 같다. 본 연구에서는 주로 조합가설을 분석하여 전장상황에 적합한 가설을 추천하는 데에 초점을 맞춘다. 조합가설 내용을 그래프화한 도식은 Fig. 2와 같다. Table. 1의 설명과 같이 관련성이 있으나 상충되지 않는 후보가설들을 병합하여 집합가설을 생성하고, 생성된 집합가설들을 다양한 방법으로 조합하여 전장상황을 설명하는 여러 개의 조합가설을 생성한다.
Table 1. Description of Hypothesis Dataset Categories
Fig. 2. Example of Combination Hypothesis
3. Dataset Construction
위에서 서술한 조합가설의 우선순위를 학습시키기 위해서는 조합가설을 평가하는 데이터를 사용하여야 한다. 이를 충족시키기 위해, 두 개의 조합가설의 우선순위를 모의 시뮬레이터를 사용하여 수집하고 이를 레이블로 사용하는 데이터셋을 구성하였다. 즉, Fig. 3과 같이 각각의 데이터가 (조합가설1, 조합가설2, 선호가설(0 or 1)) 형태로 구성되어 있다.
Fig. 3. Pairwise Comparison Dataset of Combination Hypothesis
III. Algorithm Description
1. Vector Embedding
생성된 조합가설들을 바탕으로 종합상황 추천 모델을 학습하기 위하여, 우선적으로 가설을 벡터 형태로 임베딩(embedding)하는 방법을 구축하였다. 우선적으로 각각의 후보가설을 임베딩하는 방법으로 본 연구에서는 OWL 언어로 표현된 온톨로지를 벡터 형태로 변환하는 OWL2Vec* 알고리즘 [9]을 사용하여 후보가설에 포함되는 각각의 사건 및 객체를 50차원의 벡터 형태로 변환하였다. 최종적으로 변환된 객체 벡터들을 모두 결합 (concatenate)하고, Fig. 4와 같이 후보 가설이 추가적으로 갖고 있는 4가지 지표인 relevance, source reliability, information occurrence frequency, knowledge correctness의 값을 이어 붙여서 하나의 후보 가설의 벡터 임베딩을 생성하였다.
Fig. 4. Additional Metrics of Combination Hypothesis
각 집합가설은 여러 개의 후보가설 및 위 문단에서 언급한 4가지 지표로 구성되어 있다. Fig. 5는 해당 구조의 형태를 임베딩하기 위한 방법이다. 본 연구에서는 포함된 후보가설의 임베딩 벡터들의 평균을 취하여 후보가설들에 해당하는 벡터 부분을 계산하고, 이후 4가지 지표의 값을 이어 붙여 하나의 집합 가설의 벡터 임베딩을 생성하였다. 마찬가지의 과정을 각각의 조합가설에도 적용하여 최종적으로 조합가설에 대한 임베딩 값을 계산하여 학습에 활용하였다.
Fig. 5. Embedding Algorithm for Aggregation & Combination Hypothesis
2. Learning Model
본 장에서는 지휘관/참모에게 신뢰성 높은 결과를 우선하여 제공하기 위해 이용하게 될 분석결과 추천 학습모델의 구조에 대하여 설명한다. 학습모델은 사용자 분석 연구에 대한 종합점수/순위를 제공하는 다중분석 결과들을 생성하며 최종 결과를 도출하게 된다.
본 연구에서는 제안하는 조합가설 학습 모델은 샴 네트워크(Siamese Network Model) [7]을 기반으로 하여 설계하였다. 학습하고자 하는 우선순위 파악 인공지능 모델은 Fig. 6과 같이 조합가설 데이터셋을 전처리하여 생성된 두 개의 조합가설 쌍 데이터를 입력으로 받아 두 벡터를 비교하여 선호도를 0~1 사이의 값으로 반환하는 pairwise comparison 네트워크이다.
Fig. 6. Description of Pairwise Comparison Model
Fig. 7은 제안하는 샴 뉴럴 네트워크 모델 [7]의 설계 도식을 나타낸다. 샴 뉴럴 네트워크는 각각의 입력값에 해당하는 신경망이 가중치를 서로 공유하여 상단에서 네트워크가 연결되는 구조로, 적은 데이터로도 두 데이터의 우선적인 차이를 비교하는데 효과적인 모델 구조이다. 두 개의 입력값에 대해 동시에 가중치가 업데이트되므로 복잡하지 않은 구조임에도 우선순위 학습에 유용하다는 장점이 있다.
Fig. 7. Structure of Siamese Neural Network
사용하는 데이터셋은 (조합가설1, 조합가설2, d+, d-) 쌍들로 이루어져 있으며, 조합가설 쌍 중 우선순위가 높은 레이블(d+)은 1, 우선순위가 낮은 레이블(d-)은 0으로 설정된다. weight를 공유하는 샴 네트워크 모델에 조합가설쌍 데이터를 입력 후 그 값을 결합한다.
기존에 Gregory Koch에 의해 제안된 샴 뉴럴 네트워크 모델 [7]의 경우 이미지를 임베딩하는 방법 자체를 학습하고 임베딩 벡터 사이의 거리를 계산하여 선호 확률값을 출력하였으나, 본 연구에서는 임베딩 벡터가 사전 연구를 통해 주어지기 때문에 이러한 과정을 생략하고 바로 FC(Fully-Connected) Layer에 통과시킨 후, Sigmoid 함수를 통해 선호될 확률값을 출력한다. 확률값이 우선순위가 더 높은 조합가설의 레이블인 1에 가까운 값이 되도록 학습을 진행하여, 두 가지의 조합가설 입력 중 어느 쪽을 더 선호하는지 잘 파악할 수 있게 된다. 본 연구에서는 가중치를 공유하는 쌍둥이 네트워크로 3-layer MLP(Multi-Layer Perceptron) 모델을 활용하였으며, output layer는 8차원의 형태로 학습을 진행하였다.
3. Ranking Algorithm
본 절에서는 학습 모델을 통해 임베딩 값을 바탕으로 하여 pairwise comparison 모델을 사전학습한 이후에, 후처리를 통해 조합가설의 랭킹 및 스코어를 매기는 방안을 서술한다.
Fig. 8은 pairwise 형태의 출력값을 행렬 형태로 변환시키는 방법이다. 먼저 조합가설의 수에 해당하는 크기의 행렬을 생성한다. 이후에 비교 모델의 출력값들을 해당하는 행렬 위치에 매긴다. 예를 들어 조합 가설의 쌍 (com011000055, com011000068) 중 전자가 더 선호되는 것으로 출력되었다면, 도식과 같이 해당하는 index에 선호된다면 1, 비선호된다면 0을 부여한다. 모든 출력값에 대해 위 과정을 반복하여, 전체 출력값을 모두 포함하는 행렬을 얻는다.
Fig. 8. Ranking Algorithm – Matrix Transformation
위에서 얻은 행렬을 바탕으로, Rank Centrality [10] 알고리즘을 이용하여 각 조합가설의 스코어 초기값을 획득한다. 이를 위해 우선 Fig. 9과 같이 정규화 (normalization)을 통해 선호도 레이블들을 transition 행렬 형태로 변환한다. 우선 전체 값을 조합가설들 중 가장 많이 비교된 횟수로 나눠주고 (예시에서는 4), 각각의 행총합이 1이 되도록 대각선 성분에 값을 배정한다. 최종적으로 빈 칸에는 0값을 배정하여 행렬을 완성한다. 이를 수식으로 나타내면 Fig. 10과 같다. 이 수식을 바탕으로 Fig. 9를 통해 얻어낸 행렬이 A, 최종 출력값이 P이다. 변환한 transition 행렬 P의 stationary distribution을 구하여 스코어의 초기값을 구한다.
Fig. 9. Ranking Algorithm – Constructing Transition Matrix
Fig. 10. Ranking Algorithm – Equation for entries of Transition Matrix
스코어의 초기값을 획득한 이후에는, Spectral MLE 알고리즘 [9]을 사용한 정제(refinement) 단계를 거쳐 근사한 스코어 값을 보정한다. 이 과정에서는 초기 스코어를 구할 때 사용하지 않은 비교 쌍들을 사용한다.
예를 들어 Fig. 11과 같은 초기값을 얻었다고 가정하자. Fig.8의 행렬과 비교해보면 com1은 com4, com5, com6과 비교했을 때 더 선호되지만 초기값은 낮게 책정되어 있다. 이러한 경우에 대해서 비교를 충족하도록 적절한 값, 예를 들어 0.8로 해당하는 값을 교체한다. 위 과정을 각각의 조합가설에 대하여 여러 차례 반복하고, 정제를 거친 벡터 값을 최종 스코어로 출력한다. 실제 실험에서도 index 상으로 앞의 조합가설 7개에 대하여 Fig. 12와 같이 스코어가 업데이트됨을 확인할 수 있다.
Fig. 11. Example of Score Update
Fig. 12. Output of Score Update in Simulation
IV. Experimental Result
본 장에서는 제안하는 알고리즘을 바탕으로 하여 진행한 실험 결과에 대하여 서술한다. 본 실험은 python을 통하여 구현하였으며, 크게 두 가지로 나뉜 실험을 진행하였다.
1. Dataset & Experiment
3장에서 확인할 수 있듯이, 기본설계에서 선정한 pairwise comparison 방법론은 데이터셋을 조합가설의 쌍으로 입력해야만 한다. 이를 위하여 집합가설을 입력 데이터로 받아 조합가설 쌍을 출력하는 데이터셋 전처리 과정이 필요하며, 이에 대한 설계 방안은 Fig. 13과 같다.
Fig. 13. Combination Hypothesis Data Pre-processing
우선 집합가설들과 집합가설들 간의 대립 정보를 이용하여 조합한 전처리를 통해 조합가설들을 생성한다. 이 과정에서 조합가설 내의 집합가설들, 후보가설들, 관련성, 출처신뢰도, 일관성, 지식 정확도, 가설들의 임베딩 값들을 조합가설의 데이터 속성으로 가진다. 생성된 조합가설을 2개씩 조합하여 페어 형태의 조합가설 쌍 리스트를 생성하며, 우선순위를 판단하여 조합가설 쌍의 레이블 (d+ , d-)를 부여한다.
실험을 위한 모의 시나리오는 생성된 토픽 중에서 Topic ID top011과 top020을 활용하였다. 각각의 시나리오에서 조합가설들 및 pairwise comparison 데이터를 수집하여 진행하였으며, 각각의 모의 시나리오에서 가설 조합 쌍을 9:1 비율로 나누어 학습, 테스트에 사용하였다. 각각의 조합가설에 대한 세부사항은 Table. 2와 같다.
Table 2. Description of Combination Hypothesis Dataset
2. Pairwise Comparison Model
본 실험에서는 샴 네트워크를 기반으로 한 pairwise comparison 모델의 실험 결과를 서술한다. 본 실험에서는 데이터 분할을 통해 90%의 데이터를 학습에, 10%의 데이터를 테스트에 활용하여 모델 학습을 진행하였다. 3장에서 설명한 Siamese Neural Network를 사용하여, 실제 조합가설의 선호도를 맞추는 정확도를 평가지표로 활용하였다.
훈련 및 테스트 결과는 아래와 같다. Fig. 14, 15의 train/test loss curve를 참고하면 약 250 epoch을 거친 이후에는 train loss가 0.1 이하로 수렴한다는 것을 확인할 수 있고, 이를 통해 구현한 네트워크에서의 학습이 잘 동작하고 있음을 파악할 수 있다. 또한 Table. 3의 Train/Test 정확도 값이 97% 이상이 나온다는 점에서 본 모델이 조합가설의 우선순위 판별을 올바르게 파악하고 있음을 확인할 수 있다.
Fig. 14. Train/Test loss curve for Experiment with Top011 dataset
Fig. 15. Train/Test loss curve for Experiment with Top020 dataset
Table 3. Description of Combination Hypothesis Dataset
3. Score Refinement
Fig. 16은 정제 단계에 해당하는 샘플 코드 및 진행과정에 대한 결과값이다. 위 장에서의 Fig. 12와 같은 스코어값의 업데이트 과정을 거치면서 각 조합가설이 부여받는 점수의 값이 변화하게 되고, 이에 따라 가장 점수가 높은 10개 조합가설의 리스트도 학습이 진행됨에 따라 업데이트되고 있는 것을 확인할 수 있다.
Fig. 16. Output of Score Refinement Step
V. Conclusions
본 논문에서는 지휘관의 전장 상황 파악을 돕기 위해 전장 상황과 관련한 여러 가설들의 점수 및 랭킹을 매기는 방법을 제안하였다. 선행 연구를 통해 수집한 조합가설 및 그들 사이의 선호도 데이터를 이용하여 두 개의 가설이 주어졌을 때 우수한 조합가설을 선택하는 모델을 Siamese Neural Network를 통해 학습하였으며, 이를 바탕으로 각각의 조합가설에 대한 점수 부여 및 상위 조합가설들을 선별하는 랭킹 알고리즘을 제안하였다. 또한 구현 및 실험을 통해 제안한 모델이 조합가설 간의 우선순위를 제대로 학습함을 확인하였으며, 후처리 알고리즘이 조합가설의 점수를 단계적으로 업데이트함을 관찰하였다.
제안한 연구 내용이 미래에 발생할 복잡한 전장 상황에서 지휘관의 판단을 돕는 AI 국방 기술의 시작점이 될 것으로 기대한다. 후속 연구에서는 조합가설 데이터들의 실제 선호도 데이터를 수집하여 본 연구 결과와의 교차검증을 통해 알고리즘의 성능을 개선해나갈 예정이다. 또한 다른 접근법 대비 본 연구 결과의 우수성을 확인할 수 없었기에, 다른 베이스라인 알고리즘과의 비교실험을 진행할 예정이다.
ACKNOWLEDGEMENT
This work was supported by the Defense Acquisition Program Administration and the Defense Industry Technology Center(UC200018D).
참고문헌
- C.E. Lee, J.H. Son, H.S. Park, S.Y. Lee, S.J. Park, Y.T. Lee, "Technical Trends of AI Military Staff to Support Decision-Making of Commanders," Electronics and Telecommunications Trends, Vol. 36, No. 1, pp. 89-98, Feb. 2021. DOI: https://doi.org/10.22648/ETRI.2021.J.360110
- F. Barlos, A. Peeke et al. "Collection and Monitoring via Planning for Active Situational Scenarios (COMPASS) (Strategic Multi-Layer Assessment Report)," STRATEGIC TECHNOLOGY OFFICE, 2020. DOI: https://doi.org/10.2172/1592839
- DEFENSE ADVANCED RESEARCH PROJECTS DAGENCY, Active Interpretation of Disparate Alternatives, URL: https://www.darpa.mil/program/active-interpretation-of-disparate-alternatives
- Changhee Han, Jongkwan Lee, "A Methodology for Defense AI Command & Control Platform Construction," The Journal of Korean Institute of Communications and Information Sciences, Vol. 44, No. 4, pp. 774-781, Feb. 2019. DOI: http://dx.doi.org/10.7840/kics.2019.44.4.774
- Changhee Han, "A Methodology for Constructing Intelligent-Machine FDC Commander Using Decision-Making Tree," The Journal of Korea Institute of Communications and Information Sciences, Vol. 45, No. 2, pp. 355-363, Feb. 2020. DOI: https://doi.org/10.7840/kics.2020.45.2.355
- Cho, Eunji, Soyeon Jin, Yukyung Shin, and Woosin Lee. "A Virtual Battlefield Situation Dataset Generation for Battlefield Analysis Based on Artificial Intelligence." Journal of the Korea Society of Computer and Information 27, no. 6 (June 30, 2022): 33-42. DOI: http://doi.org/10.9708/jksci.2022.27.06.033
- Koch, Gregory, Richard Zemel, and Ruslan Salakhutdinov. "Siamese neural networks for one-shot image recognition." ICML deep learning workshop. Vol. 2. 2015. URL: http://www.cs.toronto.edu/~gkoch/files/msc-thesis.pdf
- Chen, Yuxin, and Changho Suh. "Spectral mle: Top-k rank aggregation from pairwise comparisons." International Conference on Machine Learning. PMLR, 2015. DOI: https://doi.org/10.48550/arXiv.1504.07218
- Chen, Jiaoyan, et al. "Owl2vec*: Embedding of owl ontologies." Machine Learning 110.7 (2021): 1813-1845. DOI: https://doi.org/10.1007/s10994-021-05997-6
- Negahban, S., Oh, S., and Shah, D. Rank centrality: Ranking from pair-wise comparisons. 2012. DOI: https://doi.org/10.48550/arXiv.1209.1688