The Transactions of the Korea Information Processing Society (정보처리학회 논문지)
Korea Information Processing Society
- Monthly
- /
- 3022-7011(eISSN)
Volume 13 Issue 10
-
최근 전 산업 분야에서 사물인터넷 (Internet of Things, IoT) 기술이 활용되면서 안전하고 편리한 펌웨어 업데이트 기술의 중요성이 커지고 있다. 그러나 종래의 FOTA (Firmware Over-The-Air) 기술은 단일 경로로 펌웨어를 업데이트하여 보안이 취약하고, 강력한 암호 기술을 활용할 수 없는 문제가 있다. 따라서 본 연구에서는 경량 IoT를 위한 안전한 FOTA (Secure FOTA, S-FOTA) 메커니즘과 혼잡한 채널 상태로 인해 유실되는 파일이 증가하여 원본 파일을 복구할 수 없는 경우를 고려한 ARQ (Automatic Repeat Request) 기반 적응형 S-FOTA 메커니즘을 제안하고, 종래의 방식과 보안성, 복잡도 및 전송 속도 측면에서 비교·분석한다. 실험 결과에 따르면 암호화 파일의 수가 40개인 S-FOTA는 공격 성공률을 최소 62.58%, 최대 99.99% 감소시켰으며, 암호화된 분할 파일의 수가 전체 분할 파일 수의 40%인 S-FOTA는 기존의 FOTA 대비 평균 소요 시간이 최소 996.39%, 최대 3374.99% 더 소요됨을 확인하였다. 또한 ARQ 기반 적응형 S-FOTA 메커니즘의 전송 속도는 기존의 S-FOTA 대비 최소 63.16%, 최대 2736.36% 더 높았으며, 기존의 ARQ 메커니즘 대비 최소 53.89%, 최대 70.89% 더 높았다.
-
디지털 워터마킹은 디지털 컨텐츠에 정보를 삽입하는 기술이다. 불법 복제 근절과 인공지능이 생성한 콘텐츠 식별 기술로 디지털 워터마킹이 주목받고 있지만, 여전히 다양한 상황에서 견고하지 못하다. 본 논문에서는 공격 탐지와 오류 정정 및 소유자 식별이 가능한 주파수 변환 기반의 계층적 워터마킹 기법을 제안한다. 제안 방식은 계층적 워터마킹에 공격 탐지 및 오류 정정 시그니처 삽입을 통해 비가시성을 유지하며 용량과 견고성 측면에서 종래 방법보다 향상된 성능을 보였다. 또한 오류정정부호 종류와 시그니처 삽입 횟수에 따른 이미지 품질과 오류정정 성능을 비교 평가하는 프레임워크를 제안하여, 오류정정부호가 없는 종래 모델과 해밍 부호 및 BCH 부호를 적용한 종래 모델의 시각적 품질과 오류정정 성능을 비교 평가하였다. 시그니처 삽입 횟수에 따른 품질을 비교한 결과에 따르면 삽입 횟수가 증가할수록 품질은 열화되나 공격 상황에 견고하였다. 그리고 오류정정부호 종류에 따른 품질과 오류 정정 능력을 분석한 결과에 따르면 BCH 부호보다 해밍 부호 사용 시 향상된 오류정정 성능을 보였으며, 종래 방식 대비 41.31% 향상된 시그니처 복원 성능을 보였다.
-
반려동물, 특히 고양이는 인간과의 상호작용에서 다양한 소리를 통해 감정을 표현하는 것으로 알려져 있다. 고양이의 소리는 그들이 느끼는 감정 상태를 반영하며, 이를 이해하고 해석하는 것은 반려동물과의 소통을 더욱 원활하게 하는 데 중요한 요소이다. 최근 인공지능 기술의 발전으로 감정 인식과 관련된 연구가 활발히 진행되고 있으며, 특히 딥러닝 모델을 활용한 음성 데이터 분석이 주목받고 있다. 본 연구는 이러한 배경에서 출발하여, 고양이의 소리를 감정별로 분류하고 생성하는 딥러닝 시스템을 개발하는 것을 목표로 한다. 분류 모델은 고양이 소리를 감정별로 정확하게 분류하기 위해 학습되며, 소리 생성 모델은 SampleRNN과 같은 딥러닝 기법을 활용하여 특정 감정을 표현하는 고양이 소리를 생성할 수 있도록 설계된다. 마지막으로, 학습된 두 모델을 통합하여 고양이 소리를 녹음하고 이를 감정별로 분류한 결과 및 사용자의 요구에 따른 고양이 소리를 생성하여 제공할 수 있는 시스템을 제안한다.
-
Joo Yong Shim;Jean Seong Bjorn Choe;Jong-Kook Kim 497
생성형 적대 신경망(GANs)은 보통 생성자와 판별자 사이의 두 플레이어 게임으로 설명된다. 여기서 생성자는 실제에 가까운 데이터를 생성하는 것을 목표로 하고, 판별자는 실제 데이터와 생성된 데이터를 구별하려고 한다. 하지만 이 방식은 종종 생성자가 데이터를 제한적으로 생성하여 데이터 분포의 다양성을 제대로 포착하지 못하는 모드 붕괴(mode collapse)로 이어질 수 있다, 이 논문에서는 이러한 모드 붕괴 문제를 완화하기 위한 새로운 훈련 시스템을 제안한다. 구체적으로, 기존의 이중 플레이어 게임을 다중 플레이어 게임으로 확장하고, 여러 GANs를 효과적으로 훈련시키기 위해 동료 평가(peer-evaluation) 방법을 제안한다. 동료 평가 과정에서는 각 GAN이 생성한 샘플들을 다른 플레이어들이 평가한다. 이는 외부 피드백을 제공하여 GAN이 모드 붕괴를 인식할 수 있는 추가적인 기준이 된다. 이러한 동료 평가 방법을 적용한 협력적이면서도 경쟁적인 다중 플레이어 게임 방식의 훈련은 생성자들이 데이터 분포의 더 넓은 범위를 탐색하고 포착하도록 돕는다. 이 논문에서는 여러 GANs를 효과적으로 훈련시키기 위한 알고리즘을 자세히 소개하고, 실험을 통해 그 성능을 검증한다. -
A-Ra Cho;Seung-Bae Yoo;Byeong-Hun Yun;Hyung-Ju Cho 505
코로나19로 인해 위생 관리의 필요성이 높아지면서 비대면 서비스의 중요성이 주목받고 있다. 의사를 표현하고 정보를 전달하는 도구인 손은 키보드, 마우스 등 컴퓨터 입력 장치를 대체할 수 있는 도구로 떠오르고 있다. 본 연구에서는 카메라를 통해 감지된 손동작을 이용하여 컴퓨터를 제어함으로써 무인 주문기를 사용할 때 발생하는 공중보건 문제를 해결하는 방법을 제안한다. 자주 사용되는 손 제스처, 특히 검지를 구부리는 동작을 식별하는 데 중점을 둔다. 이를 위해 미디어파이프(MediaPipe) 프레임워크와 장단기 기억(long short-term memory, LSTM) 모델을 사용하여 비접촉 입력 장치를 개발한다. 이러한 접근 방법은 3차원 공간에서 손동작을 식별할 수 있으며, 가상현실(virtual reality, VR)과 증강현실(augmented reality, AR) 분야에 적용할 수 있는 시나리오를 제공한다. 내비게이션 시스템, 무인 주문기 등 다양한 상황에 적용할 수 있는 방법을 제시하여 향상된 국민건강과 사용자 경험을 제공한다. -
인공지능 기술의 발전과 함께 딥러닝 기반의 오디오 딥페이크 기술이 크게 향상되었고, 이를 악용하여 다양한 범죄 활동이 이루어지고 있다. 오디오 딥페이크를 탐지하여 이러한 피해를 예방하기 위해 본 논문은 새로운 컨시스트(CoNSIST) 모델을 제안한다. 이 모델은 그래프 기반의 모델인 AASIST를 기반으로, 세 가지 추가적인 모델링 방법론을 적용하여 오디오 딥페이크 탐지를 한다. 세 가지 추가적인 모델링을 통해 특징 추출을 강화하고, 불필요한 작업을 제거하며, 다양한 정보를 통합하는 것을 목표로 한다. 최종 실험 결과, 컨시스트가 기존 오디오 딥페이크 탐지 모델들보다 더 우수한 성능을 보여 딥페이크의 악용을 방지하기 위해 더 나은 해결책을 제공한다.
-
본 연구는 인공지능(AI)과 인간이 창조한 예술 작품 사이의 기술적 요소와 아름다움에 있어 나타나는 차이점을 탐구하며, 이를 통해 AI 예술의 특성, 가능성, 한계를 평가하고 예술가의 역할에 대한 심층적 이해를 도모한다. 연구 결과, AI가 생성한 예술 작품은 인간 예술과 경쟁할 수 있는 수준의 기술적 완성도와 미학적 가치를 지니며 일반 대중 사이에서도 높은 평가를 받을 수 있음을 확인했다. 특히, 감정 전달과 인상에 있어서 AI는 인간과 유사한 수준의 예술적 감동을 제공할 수 있으나, 자연 풍경을 다룬 작품에서는 인간 예술가의 미묘한 감성과 기술이 AI를 능가하는 것으로 나타났다. 이는 AI가 예술 창작 분야에서 중요한 역할을 수행할 수 있음을 보여주면서도, 특정 장르에서의 한계를 드러낸다. 본 연구는 AI 예술의 사회적 수용과 예술계 내 위치에 대한 더 깊은 이해를 제공할 것으로 기대된다.
-
Ye Jin Jin;Chae Yun Seo;Ji Hoon Kong;R. Young Chul Kim 529
최근 AI 기술의 발전으로 다양한 분야에서 활용되고 있다. 그러나 AI의 동작 원리를 확인할 수 없어 생성물의 품질을 보장하기 어렵다. 따라서 본 연구에서는 대화형 AI 기술에 소프트웨어 공학의 요구공학을 접목하여 절차적 공정을 진행한다. 기존의 요구공학 연구는 문법 중심 분석 방식을 사용하여 비정형 요구사항의 의미적 측면을 충분히 해석하지 못하는 한계를 가진다. 이를 해결하기 위해, 우리는 촘스키의 구문 구조 분석 이론과 필모어의 의미역 이론의 통합을 제안한다. 또한, 우리는 이전 연구를 확장하여 다양한 문장 구조에서 사용되는 형용사 분석을 추가한다. 이는 만화 속 주인공에 대한 정확한 감정 분석이 가능하다. 분석 결과를 기반으로, 우리는 상태 다이어그램의 상태를 객체의 감정 상태로 적용한다. 우리는 객체의 상태 다이어그램의 감정 상태 기반으로 Three.js를 통해, 3D 객체 모델 생성과 와 상태를 표현시킨다. 이를 통해, 객체의 감정을 표현하기를 기대한다. -
Ha-Yoon Song;Jeon-Seong Kang;Beom-Joon Park;Junyoung Kim;Kwang-Woo Jeon;Junwon Yoon;Hyun-Joon Chung 537
인공지능과 머신러닝 기술의 급격한 발전은 다양한 산업 분야에 혁신을 일으키고 있으며, 특히 자연어 처리(NLP) 기술은 텍스트 데이터 분석 및 처리에 새로운 가능성을 제공하고 있다. 텍스트 분류 모델을 효과적으로 개발하려면 데이터 탐색, 전처리, 특징 추출, 모델 선택, 하이퍼파라미터 튜닝, 성능 평가 등의 복잡한 단계를 거쳐야 하며, 이는 많은 시간과 전문 지식을 요구한다. 자동화된 머신러닝(AutoML)은 이러한 과정을 자동화하여 비전문가도 고성능 모델을 쉽게 생성할 수 있도록 돕는다. 그러나 기존 AutoML 도구는 주로 정형 데이터에 특화되어 있어, 비정형 텍스트 데이터 처리에는 전처리와 특징 추출 과정에서 수작업이 필요하다. 본 연구에서는 이러한 한계를 해결하기 위해 텍스트 전처리, 단어 임베딩, 모델 학습 및 평가 과정을 자동화하는 웹 기반 AutoML 플랫폼을 개발하였다. 이 플랫폼은 사용자가 텍스트 데이터를 업로드하면 최적의 머신러닝 모델을 자동으로 생성하고 성능을 시각적으로 제공함으로써 텍스트 분류 작업의 효율성을 크게 향상시킨다. 다양한 텍스트 분류 데이터셋을 활용한 실험 결과, 제안된 플랫폼은 높은 정확도와 정밀도를 보였으며, 특히 Stacked Ensemble 모델 사용 시 우수한 성능을 나타냈다. 본 연구는 텍스트 분류 자동화를 통해 비전문가도 손쉽게 텍스트 데이터를 분석하고 활용할 수 있는 가능성을 제시하며, 향후 대규모 언어 모델(LLM)을 적용하여 성능을 더욱 향상시킬 계획이다. -
4차 산업혁명이 발전함에 따라 핵심기술인 AI, IoT, 빅데이터 등 다양한 기술을 활용한 해운물류 분야의 스마트화가 진행되고 있다. 특히 수집된 해양 빅데이터는 선박 운항 모니터링 분석, 온실가스 배출 평가 등 다양한 서비스를 제공하는데 큰 역할을 하고 있으며, 해운물류에서도 필수적으로 요구되고 있다. 이런 해양 빅데이터는 실제로 선박이 운항하며 수집되지만 시간적·환경적인 요인으로 인해 데이터가 손실하는 경우가 발생한다. 이는 근본적인 원인을 파악하여 보완하는 것도 중요하지만 수집된 데이터를 활용 및 분석하여 데이터를 생성하는 과정이 필요하다. 본 논문에서는 실증테스트를 통해 수집된 해상 운송 데이터를 활용하여 새로운 위치데이터, 속력 값 등을 반복적으로 생성하는 에뮬레이터를 개발한다. 위치데이터는 수집된 위치정보 사이에서 표준편차를 구하여 이를 활용하였으며, 속력 값은 생성된 위치데이터를 통해 추출하게 된다. 이렇게 생성된 데이터들은 실시간으로 데이터베이스에 삽입하여 누적된다. 에뮬레이터의 성능을 입증하기 위해 직접 수집한 5가지 항로를 활용하여 실험을 진행하였으며, 이를 통해 그 우수성을 입증하였다.
-
형태소 분석은 의미를 가지거나 문법적 기능을 하는 언어의 최소 단위인 형태소를 분리하고, 각 형태소의 품사를 결정하는 작업으로, 개체명 인식, 의존구문 분석 등과 같은 자연어 처리 작업에서 중요한 역할을 한다. 현대 자연어처리의 많은 부분은 딥러닝 기반 언어 모델에 의존하고 있으며, 딥러닝 기반 한국어 형태소 분석은 크게 시퀀스-투-시퀀스 방식과 순차적 레이블링 방식으로 나뉜다. 본 연구에서는 트랜스포머 인코더를 활용한 순차적 레이블링 방식으로 음절 단위 품사 태깅을 수행한 후, 기분석 사전을 통해 형태소 복원 및 품사 태깅을 진행하는 형태소 분석 방식을 제안한다. 또한, CBOW 방식을 사용하여 음절 단위 임베딩을 낮은 차원으로 추출함으로써 파라미터 수를 줄인 경량화 형태소 분석기 모델을 설계하였다. 제안된 모델은 낮은 파라미터 수와 빠른 추론 속도를 통해 자원이 제한된 환경에서도 효율적으로 활용될 수 있다.
-
Kim, Min Gyu;Seon Ji Ho;Jeong Se Jin;Kim Sang Hoon 559
본 논문은 경사면과 단차 등의 비평탄 지형 극복과 장애물 회피가 가능하도록 지능적인 센서 신호처리와 다양한 구동방식을 보유한 바퀴 구동형 소형 지능 로봇의 설계와 구현을 목적으로 한다. 비평탄 지형 극복을 위해 편심 기어 구조를 제안하였으며, 실시간 균형 유지를 위해 최적의 센서 신호처리를 적용하였고, 장애물 극복을 위해 LiDAR 센서를 활용한 장애물 인식 및 좁은 공간에서의 탈출이 가능한 전방위 구동 방식을 제안하고 설계하였다. 로봇의 지능적 요소를 구현하고 제어하기 위해 최적의 임베디드 시스템을 설계하고 구축하였다. -
Minwoo Kang;Jiwoo Shin;Seongmin Lee;Soungjun Yoon;Jinman Jung 568
치과 임플란트 수술에서 정확한 위치에 보철물을 식립하는 것이 중요하나 이는 치과의사의 판단에 의존하며, 다양한 요인에 의한 시야 방해로 인해 임플란트 수술의 오류가 발생할 수 있다. 본 논문에서는 사전 구강 스캔이나 3D 모델 생성 없이 2D 수술 영상을 통해 임플란트 식립 위치를 예측하는 2D 영상 기반 실시간 임플란트 식립 가이드 시스템을 제안한다. 수술 영상 초반 두 가지의 세그멘테이션 모델을 사용하여 각 치아 내 교합면과 절단면의 사전통계를 측정한다. 이후 하나의 세그멘테이션 모델을 사용하여 교합면과 절단면을 분리하고, 인접치의 치축과 치아길이, 식립될 보철물의 중심을 계산하여 임플란트 식립 위치를 예측하고 가이드한다. 실제 사람과 동일한 구강 구조를 가진 인체 치아 모형인 치아 팬텀을 활용하여 시스템을 설계 및 구현하였으며, 10장의 이미지에 대한 임플란트 식립 위치 가이드 알고리즘의 작동시간은 평균 12.14ms로 측정되어 실시간 영상에서의 적용이 가능함을 확인하였다. -
웹 브라우저 기반 고성능 이미지 프로세싱을 위해 JavaScript 언어는 속도가 느리고 GPU를 직접 활용할 수 없어서, 웹 플러그인 기술이나 서버기반 처리 방식이 사용되었다. 하지만 최신 웹 브라우저에서 더 이상 플러그인 기술들이 지원되지 않고, 서버 처리 방식은 사용자가 늘어날수록 운영 비용이 증가하는 문제가 발생하였다. 따라서 본 논문에서는 플러그인이나 서버 기반이 아닌 최신 웹 표준 기술인 WASM과 WebGPU를 활용하여 클라이언트 환경에서 고성능 이미지 프로세싱 알고리즘을 구현하였다. 최종 실험 결과 기존 Javascript에 비해 CPU와 GPU를 동시 활용하는 WASM+ WebGPU 기반의 코드에서 최대 10배 이상 실행 성능이 개선되었다.