• 제목/요약/키워드: information retrieval.

검색결과 3,667건 처리시간 0.03초

CBD 프로세스 지원을 위한 컴포넌트 저장소의 구축 (Construction of Component Repository for Supporting the CBD Process)

  • 차정은;김행곤
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권7호
    • /
    • pp.476-486
    • /
    • 2002
  • 컴포넌트 기반 개발(CBD : Component Based Development)은 비즈니스 시스템의 요구를 해결할 수 있는 최상의 전략적 방법으로 빠르게 확산되고 있다. 이는 CBD가 소프트웨어 컴포넌트의 조립을 통해 어플리케이션 개발이 가능한 새로운 패러다임으로서, 비즈니스 프로세스의 빠른 변화에 능동적으로 대처하며, 증가되는 생산성 향상의 요구를 충족시킬 수 있기 때문이다. 특히, 컴포넌트 저장소는 컴포넌트의 개발과 유통 그리고 재사용을 위해 가장 중요한 부분으로 컴포넌트 그 자체뿐 아니라 컴포넌트 개발의 각 단계로부터 생산된 결과물들을 저장하고 관리할 수 있다. 본 논문에서는 CBD 프로세스의 효과적인 지원을 위해 컴포넌트 저장소 구축을 중심으로 실제적인 적용 기술을 제시하고 이를 바탕으로 컴포넌트 저장소 관리 시스템(CRMS : Component Repository Management System)의 프로토터이핑을 개발한다. CRMS는 컴포넌트 아키텍쳐에 기반하여 다양한 컴포넌트의 형상을 관리하며, 어플리케이션 개발자들은 자신의 프로젝트에 이용하기 위한 컴포넌트를 검색하고 관련 이해 정보를 획득할 수 있다 본 논문을 통해 CBD 환경을 실제화 하는 공용 컴포넌트 저장소 구축으로의 실제적 접근을 제시함으로써 컴포넌트 개발을 지원하는 CBD 프로세스 및 컴포넌트의 저장소에 대한 선행 연구로 이용하고자 한다.

XGBoost와 교차검증을 이용한 품사부착말뭉치에서의 오류 탐지 (Detecting Errors in POS-Tagged Corpus on XGBoost and Cross Validation)

  • 최민석;김창현;박호민;천민아;윤호;남궁영;김재균;김재훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권7호
    • /
    • pp.221-228
    • /
    • 2020
  • 품사부착말뭉치는 품사정보를 부착한 말뭉치를 말하며 자연언어처리 분야에서 다양한 학습말뭉치로 사용된다. 학습말뭉치는 일반적으로 오류가 없다고 가정하지만, 실상은 다양한 오류를 포함하고 있으며, 이러한 오류들은 학습된 시스템의 성능을 저하시키는 요인이 된다. 이러한 문제를 다소 완화시키기 위해서 본 논문에서는 XGBoost와 교차 검증을 이용하여 이미 구축된 품사부착말뭉치로부터 오류를 탐지하는 방법을 제안한다. 제안된 방법은 먼저 오류가 포함된 품사부착말뭉치와 XGBoost를 사용해서 품사부착기를 학습하고, 교차검증을 이용해서 품사오류를 검출한다. 그러나 오류가 부착된 학습말뭉치가 존재하지 않으므로 일반적인 분류기로서 오류를 검출할 수 없다. 따라서 본 논문에서는 매개변수를 조절하면서 학습된 품사부착기의 출력을 비교함으로써 오류를 검출한다. 매개변수를 조절하기 위해서 본 논문에서는 작은 규모의 오류부착말뭉치를 이용한다. 이 말뭉치는 오류 검출 대상의 전체 말뭉치로부터 임의로 추출된 것을 전문가에 의해서 오류가 부착된 것이다. 본 논문에서는 성능 평가의 척도로 정보검색에서 널리 사용되는 정밀도와 재현율을 사용하였다. 또한 모집단의 모든 오류 후보를 수작업으로 확인할 수 없으므로 표본 집단과 모집단의 오류 분포를 비교하여 본 논문의 타당성을 보였다. 앞으로 의존구조부착 말뭉치와 의미역 부착말뭉치에서 적용할 계획이다.

스트리밍 프레임워크와 멀티미디어 데이타베이스와의 연동기법 (An Interconnection Method for Streaming Framework and Multimedia Database)

  • 이재욱;이승룡;이종원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권7호
    • /
    • pp.436-449
    • /
    • 2002
  • 본 논문은 실시간 멀티미디어 스트리밍 프레임워크과 멀티미디어 데이타베이스의 연동 모듈인 데이타베이스 커넥터를 소개한다. 스트리밍 시스템과 멀티미디어 데이타베이스를 연동하는 경우 스트리밍 중에도 재생중인 미디어에 관련된 정보들을 데이타베이스로부터 검색 및 재결합이 가능하여 다양한 멀티 미디어 데이타베이스 서비스를 제공받을 수 있다. 그러나, 현재 스트리밍 시스템과 데이타베이스와의 연동은 파일 시스템으로 구현되거나, 파일형태의 스트리밍 데이타와 컨텐츠를 다루는 메타 데이타가 분리되어 관리되는 관계형 데이타베이스에 국한되어 있어 다양한 멀티미디어 서비스를 제공하기에 부적합하다. 이런 제약점을 보완하기 위하여 본 논문에서는 스트리밍 프레임워크와 멀티미디어 데이타베이스가 동일한 호스트에 존재한다는 가정 하에 작동되는 IPC 기반의 데이타 베이스 커넥터를 제안한다. 제안된 데이터베이스 커넥터는 데이타베이스 기능을 사용할 수 있도록 읽기, 쓰기, 찾기, 재생 트랜잭션과, 트랜잭션 처리를 위한 인터페이스를 정의하였고, IPC 인터페이스 모듈을 플러그인 형태로 구현하여 본 논문에서 적용한 BeeHive와의 연동뿐 아니라 다른 다양한 멀티미디어 데이타베이스와 연동 시 바로 적용시킬 수 있는 확장성을 가지고 있다. 성능 분석 결과 제안된 IPC 기반 연동기법은 기존의 파일 방식의 연동기법과 비교하여 성능의 저하가 크지 않았다.

지능형 객체 인식 기술을 이용한 실시간 동영상 검색시스템 (Development of Real-time Video Search System Using the Intelligent Object Recognition Technology)

  • 장재영;강찬혁;윤재민;조재원;정지성;전종훈
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권6호
    • /
    • pp.85-91
    • /
    • 2020
  • 최근 범죄예방과 안전문제 등으로 CCTV와 같은 영상장비가 다양하게 활용되고 있다. 영상기기들은 대부분 24시간 작동되기 때문에 경비 인력을 절감할 수 있지만, 녹화된 영상에서 특정 인물과 같은 객체를 검색하는 업무는 여전히 수동으로 이루어지고 있어, 실시간 검색이 요구되는 상황에서는 정확하고 빠른 대처가 미흡하다. 본 논문에서는 최신 딥러닝 기술과 OpenCV 라이브러리를 이용하여 사용자의 의해 입력된 의상정보를 바탕으로 특정인물을 영상에서 빠르게 검색하고, 그 결과를 실시간으로 전송하는 기술을 제안한다. 개발된 시스템은 YOLO 라이브러리를 이용하여 실시간으로 인물객체를 탐지한 후, 딥러닝 기술을 이용하여 인간의 의상을 상/하의로 구분하고 OpenCV 라이브러리를 통해 색을 검출하여 특정 인물 객체를 자동으로 인식하도록 구현하였다. 본 논문에서 개발한 시스템은 특정 의상을 갖춘 인물객체를 정확하고 빠르게 인식할 뿐만 아니라 기타 객체 인식에도 활용할 수 있는 확장성을 갖추고 있어 다양한 용도의 영상감시시스템에 활용될 수 있을 것으로 기대된다.

컴퓨팅 리소스 관리를 위한 표준 메타데이터 스키마 설계 (Design of Standard Metadata Schema for Computing Resource Management)

  • 이미경;조민희;송사광;임형준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.433-435
    • /
    • 2022
  • 본 논문에서는 국가연구데이터커먼즈에서 연구데이터 분석·활용에 사용되는 컴퓨팅 리소스를 등록, 검색, 관리하기 위한 컴퓨팅 리소스 표준 메타데이터 스키마 설계 방안에 대해 소개한다. 국가연구데이터커먼즈는 연구데이터 공유·활용 극대화를 위한 연구데이터와 컴퓨팅 리소스 연합 활용 체계이다. 컴퓨팅 리소스는 연구 전 과정에서 사용하는 연구데이터를 분석·활용하는데 필요한 분석 인프라, 분석 소프트웨어 등 컴퓨팅 환경의 모든 리소스들을 말한다. KRDC 컴퓨팅 리소스 관리를 위한 표준 메타데이터 스키마는 컴퓨팅 리소스 관리를 위한 공통 필수 속성과 각 컴퓨팅 리소스 특징에 따른 속성을 고려하여 설계하였다. 컴퓨팅 리소스 관리를 위한 표준 메타데이터 스키마는 컴퓨팅 리소스 메타데이터 스키마와 컴퓨팅 리소스 제공자 메타데이터 스키마로 구성된다. 또한, 컴퓨팅 리소스와 제공자의 메타데이터 스키마는 성격에 따라 서비스 스키마와 시스템 스키마 그룹으로 구분하여 설계하였다. 표준 메타데이터 스키마는 KRDC 프레임워크를 통해 컴퓨팅 리소스 제공자와 컴퓨팅 리소스 사용자를 위한 컴퓨팅 리소스 등록, 카탈로그 검색, 컴퓨팅 리소스 관리, 워크플로우 서비스에 사용되며, 다양한 컴퓨팅 리소스 연계를 위해 확장 가능한 형태로 설계되었다.

  • PDF

NATM 터널 공정리스크 데이터베이스 구축 및 리스크 분류체계 개발 (Establishment of Risk Database and Development of Risk Classification System for NATM Tunnel)

  • 김현비;바타갈래 위누리 키만디가 가루나라내;김병수
    • 한국건설관리학회논문집
    • /
    • 제25권1호
    • /
    • pp.32-41
    • /
    • 2024
  • 건설산업은 안전사고뿐 아니라 공기지연, 원가상승, 환경오염 등의 여러 복합적인 리스크가 발생하며 이를 해결하기 위한 관리기술이 필요하다. 그 중에서 프로젝트에 직접적인 영향을 미치는 공정리스크의 관리는 그 중요성에 비해 관련정보가 부족한 실정이다. 본 연구는 각 프로젝트마다 상이한 분류체계 사용으로 인한 리스크 정보검색의 어려움을 해소하기 위하여 MATM 터널 공정리스크분류체계를 개발하고자 하였다. 리스크수집은 기존 문헌검토와 Experience Mining 기법을 사용하였고 DB구축은 자연어처리 개념을 활용하였다. 분류체계의 구조는 자료의 호환성을 고려하여 기존 WBS 구조를 채택하였고, WBS의 공종과 연결된 RBS를 구축하였다. 연구결과 공종별 리스크를 쉽게 파악하고 리스크에 연결된 리스크특성과 리스크요인이 직관적으로 드러나는 리스크분류체계가 완성되었다. 구축된 분류체계의 활용성 검증결과 사용자의 키워드 입력으로 공종별 리스크와 리스크요인이 쉽게 식별되어 분류체계는 유효한 것으로 나타났다. 본 연구를 통해 NATM터널 계획 및 설계 시 작업공종에 따르는 리스크를 미리 식별하고 그 요인에 맞는 대응방안을 수립하여 비용과 공사기간의 증가를 방지하는데 기여할 수 있을 것으로 기대된다.

블라인드 방식의 리듬 음원 분리 (Blind Rhythmic Source Separation)

  • 김민제;유지호;강경옥;최승진
    • 한국음향학회지
    • /
    • 제28권8호
    • /
    • pp.697-705
    • /
    • 2009
  • 본 논문에서는 단일 채널 다성 음악에서 리듬 악기 신호를 블라인드 (blind) 방식으로 추출하는 방법을 제안한다. 상업적으로 판매되는 음악 신호는 대부분 2개 이하만의 혼합된 채널 형태로 사용자에게 제공되는 반면, 그 혼합 채널 신호에는 각각 가창 음원 (vocal)을 비롯한 많은 종류의 악기가 포함되어 있는 형태이다. 따라서, 혼합 신호의 개수가 음원 개수와 같거나 더 많은 상황을 가정하는 기존의 음원 분리 방법처럼, 혼합 환경이나 신호의 통계적 특성을 모델링하는 것 보다는, 특정 음원의 고유 특성을 활용하는 것이 이처럼 적은 개수의 혼합 신호만을 가지고 있는 환경 (underdetermined)에 더욱 적합하다. 본 논문에서는 다른 화성 악기와 혼합되어 있는 상창에서 리듬 악기 음원만을 추출하는 것을 목표로 한다. 비음수 행렬 인수분해 (NMF: Nonnegative Matrix Factorization)의 변형된 알고리즘인 비음수 행렬의 부분적 공동 분해 (NMPCF: Nonnegative Matrix Partial Co-Factorization)가 입력 행렬의 시간적인 속성과 주파수적인 속성에서 다양한 관계성을 분석하기 위해 활용된다. 또한 특정 시간 단위로 입력 신호를 파편화 (segmentation)하고, 파편들에서 반복적으로 발생하는 성분을 리듬 악기가 공통적으로 포함하고 있는 특성이라고 가정한다. 본 논문에서 제안하는 방법은 일반적으로 받아들여질 수 있을 정도의 성능을 보여주지만, 기본적으로는 사전 정보를 활용하는 타악기 음원 분리 방식보다 우수하지는 않다. 그러나 블라인드 방식의 특성상, 사전 정보를 획득한기에 용이하지 않은 경우, 또는 사전 정보와 현격히 다른 리듬 악기가 연주되는 경우 등에 보다 유연하게 대응할 수 있다.

오디오 포렌식을 위한 소리 데이터의 요소 기술 식별 연구 (A Study on Elemental Technology Identification of Sound Data for Audio Forensics)

  • 유혜진;박아현;정성균;정두원
    • 정보보호학회논문지
    • /
    • 제34권1호
    • /
    • pp.115-127
    • /
    • 2024
  • 최근 디지털 오디오 매체의 증가로 인해 소리 데이터의 규모와 다양성이 크게 확대되었으며, 이로 인해 디지털 포렌식 과정에서 소리 데이터 분석의 중요도가 증가하였다. 하지만 소리 데이터 분석에 대한 표준화된 절차나 가이드 라인이 부족하여 분석 결과의 일관성과 신뢰성에 문제가 발생하고 있다. 디지털 환경은 다양한 오디오 형식과 녹음 조건을 포함하고 있지만, 현재 오디오 포렌식 방법론은 이러한 다양성을 충분히 반영하지 못하고있다. 이에 본 연구에서는 모든 상황에서 효과적인 분석을 수행할 수 있도록 Life-Cycle 기반 소리 데이터 요소기술을 식별하여 소리 데이터 분석의 전반적인 가이드라인을 제시하였다. 이와 더불어, 식별한 요소 기술을 소리 데이터를 대상으로 하는 디지털 포렌식 기술 개발에 활용하기 위해 분석을 진행하였다. 본 연구에서 제시한 Life-Cycle별 소리 데이터 요소 기술 식별 체계의 효과성을 입증하기 위하여 소리 데이터 기반으로 응급상황을 검색할 수 있는 기술을 개발하는 과정에 대한 사례 연구를 제시하였다. 해당 사례 연구를 통해 소리 데이터를 대상으로 하는 디지털 포렌식 기술 개발 과정에서 Life-Cycle 기반으로 식별한 요소 기술이 데이터 분석의 질과 일관성을 보장하게 하고 효율적인 소리 데이터 분석을 가능하게 함을 확인하였다.

Sentinel-1 레이더 식생지수와 AutoML을 이용한 Sentinel-2 NDVI 결측화소 복원 (Gap-Filling of Sentinel-2 NDVI Using Sentinel-1 Radar Vegetation Indices and AutoML)

  • 윤유정;강종구;김서연;정예민;최소연;임윤교;서영민;원명수;천정화;김경민;장근창;임중빈;이양원
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1341-1352
    • /
    • 2023
  • 위성영상 기반의 정규식생지수(normalized difference vegetation index, NDVI)는 넓은 영역에서 주기적인 정보를 수집할 수 있어 산림 및 농업 모니터링에 주로 사용된다. 그러나 광학센서 기반 식생지수는 구름 등의 영향으로 일부 지역에서 결측을 가지기 때문에, 본 연구는 전천후 및 주야에 관계없이 관측 가능한 Sentinel-1의 합성 개구 레이더(synthetic aperture radar, SAR) 영상을 활용하여 Sentinel-2 NDVI 결측값을 복원하는 모델을 개발하였다. 이는 광학적으로 관측이 어려운 구름 조건이나 야간에도 NDVI를 추정할 수 있는 잠재력을 보여준다. Automated machine learning (AutoML)을 활용한 비선형 결측복원모델의 5폴드(fold) 교차검증 결과, 절대오차 7.214E-05, 상관계수 0.878의 NDVI 복원 성능을 보였다. 이를 통해 시공간 연속적인 NDVI 생산 방법론을 발전시켜, 전천후 식생 모니터링에 필요한 정보 생산에 기여할 수 있을 것으로 기대된다.

GEMS 위성관측에 기반한 지면반사도 산출 시에 오차 유발 변수에 대한 민감도 실험 (Sensitivity Experiment of Surface Reflectance to Error-inducing Variables Based on the GEMS Satellite Observations)

  • 신희우;유정문
    • 한국지구과학회지
    • /
    • 제39권1호
    • /
    • pp.53-66
    • /
    • 2018
  • 지면반사도 정보는 열평형 및 환경/기후 모니터링에 중요하다. 본 연구에서는 정지궤도위성의 Geostationary Environment Monitoring Spectrometer (GEMS) 관측에서 300-500 nm 파장 영역의 지면반사도 산출 시에 오차 유발 요소에 대한 민감도를 조사하였다. 장차 GEMS 지면반사도 산출 시에 오차 분석을 위하여 극궤도 위성의 MODerate resolution Imaging Spectroradiometer (MODIS; 공간 해상도 $1km{\times}1km$) 자료 및 Ozone Mapping Instrument (OMI; $12km{\times}24km$) 자료 그리고 복사전달모델 수치실험도 분석에 사용하였다. 본 연구에서 오차 유발 요소는 구름, 레일리 산란, 에어로졸, 오존 그리고 지면 특성이다. GEMS 저해상도($8km{\times}7km$)에서의 구름 탐지율은 MODIS 대비 약 79%이었으나, GEMS 화소의 운량이 40% 이하에서는 상대적으로 낮았다. 이러한 경향은 구름 이외의 다른 효과(에어로졸, 지면 특성)로 인하여 주로 발생하였다. RGB 영상과 복사전달모델 계산을 기초로 조사된 레일리 산란 효과는 육지에 비하여 해양 지역에서 뚜렷하였다. 지면반사도가 0.2보다 작은 경우에 위성관측 대기상단 반사도는 에어로졸 양에 비례하였으나, 0.2보다 큰 경우에는 그 반대 경향을 보였다. 또한 에어로졸 양에 의한 지면반사도 산출 오차는 자외선 영역에서 파장에 따라 급격하게 증가하였으나, 가시광선에서는 일정하거나 다소 감소하였다. 오존 흡수는 자외선 영역(328-354 nm) 중 328 nm에서 가장 크게 나타났다. 지면반사도가 0.15인 육지 경우에 음의 오존전량 아노말리(-100 DU)로 인한 지면반사도 산출 오차는 +0.1이었다. 본 연구는 GEMS 위성관측을 이용한 지면반사도 원격탐사의 정확도를 높이는데 기여할 수 있다.