• 제목/요약/키워드: information retrieval method

검색결과 1,227건 처리시간 0.029초

연관 태그의 군집화를 위한 클러스터링 기법 비교 연구 (A Comparative Study on Clustering Methods for Grouping Related Tags)

  • 한승희
    • 한국문헌정보학회지
    • /
    • 제43권3호
    • /
    • pp.399-416
    • /
    • 2009
  • 본 연구에서는 태그 공간에서 정보의 효율적 탐색을 위해 이용자에게 제공될 수 있는 연관 태그 클러스터의 생성을 위해 다양한 유사계수와 클러스터링 기법을 적용한 후 그 결과를 평가하고 비교 분석함으로써 연관 태그의 클러스터링에 가장 적합한 클러스터링 알고리즘을 확인하고자 하였다. Delicious에서 임의의 태그 10개를 대상으로 각각 300개의 문서에서 추출한 연관 태그를 대상으로 태그쌍 간의 연관성을 측정한 후 계층적 기법과 비계층적 기법을 적용하여 생성된 클러스터를 대상으로 클러스터 적합도를 측정한 결과, 일반적으로 용어 클러스터링에서 널리 활용되는 것으로 알려진 워드 기법이 코사인 유사계수와 결합했을 때 거의 모든 실험 대상에 대해 유사한 경향을 보이면서 가장 우수한 성능을 나타내는 것으로 나타났다. 연관 태그 클러스터는 정보관리 측면에서 유사한 합목적성을 갖는 태그끼리 군집을 이루면서 용어의 중의성을 해소함으로써 태그 공간에서의 이용자의 정보 탐색에 유용하게 활용될 것이다.

Parallel Computing on Intensity Offset Tracking Using Synthetic Aperture Radar for Retrieval of Glacier Velocity

  • Hong, Sang-Hoon
    • 대한원격탐사학회지
    • /
    • 제35권1호
    • /
    • pp.29-37
    • /
    • 2019
  • Synthetic Aperture Radar (SAR) observations are powerful tools to monitor surface's displacement very accurately, induced by earthquake, volcano, ground subsidence, glacier movement, etc. Especially, radar interferometry (InSAR) which utilizes phase information related to distance from sensor to target, can generate displacement map in line-of-sight direction with accuracy of a few cm or mm. Due to decorrelation effect, however, degradation of coherence in the InSAR application often prohibit from construction of differential interferogram. Offset tracking method is an alternative approach to make a two-dimensional displacement map using intensity information instead of the phase. However, there is limitation in that the offset tracking requires very intensive computation power and time. In this paper, efficiency of parallel computing has been investigated using high performance computer for estimation of glacier velocity. Two TanDEM-X SAR observations which were acquired on September 15, 2013 and September 26, 2013 over the Narsap Sermia in Southwestern Greenland were collected. Atotal of 56 of 2.4 GHz Intel Xeon processors(28 physical processors with hyperthreading) by operating with linux environment were utilized. The Gamma software was used for application of offset tracking by adjustment of the number of processors for the OpenMP parallel computing. The processing times of the offset tracking at the 256 by 256 pixels of window patch size at single and 56 cores are; 26,344 sec and 2,055 sec, respectively. It is impressive that the processing time could be reduced significantly about thirteen times (12.81) at the 56 cores usage. However, the parallel computing using all the processors prevent other background operations or functions. Except the offset tracking processing, optimum number of processors need to be evaluated for computing efficiency.

새로운 시대의 교육에서 AI 교육 로봇의 응용 효과에 대한 메타 분석 (Meta-analysis of the Application Effect of AI Educational Robots in Teaching in the New Period)

  • 추이지엔동;송승근
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.52-54
    • /
    • 2021
  • 인공 지능 시대가 도래함에 따라, 로봇 교육과 그 역량 강화에 대한 교육은 전 세계적으로 널리 적용되고 적용되었습니다. 본 연구의 목적 : 학생 교육 및 교육에서 AI 교육 로봇의 응용 효과를 체계적으로 평가; 본 연구의 방법 : 컴퓨터를 사용하여 "Web of Science", "CNKI", "ERIC", "IEEE"와 같은 검색 도구에서 관련 교육을 검색하십시오. 로봇 티칭과 전통적인 티칭의 효과에 대한 비교 연구 검색 시간은 2000 년 1 월부터 2020 년 1 월까지입니다. 포괄적인 MetaAnalysis 2.0을 메타 분석에 사용했습니다. 본 연구 결과 : 31 개의 유효한 연구 문헌에 대한 정량 분석과 메타 분석이 AI 교육 로봇에 미치는 영향에 대한 객관적인 평가 분석 결과 AI 교육 로봇이 학생 학습 효과에 미치는 효과는 0.465임 이는 교육용 로봇이 학생의 학습 효과에 어느 정도 긍정적인 영향을 미침을 나타냅니다. 이 연구의 결론 : 학생 교육 및 교육에서 AI 교육 로봇의 적용 효과는 전통적인 교육 방법보다 우수하며 학생 학습을보다 효과적으로 홍보 할 수 있습니다.

  • PDF

검색 속도와 메모리 효율 최적화를 위한 메타데이터 기반 데이터 구조 분석 (Metadata-Based Data Structure Analysis to Optimize Search Speed and Memory Efficiency)

  • 김세연;임영훈
    • 정보처리학회 논문지
    • /
    • 제13권7호
    • /
    • pp.311-318
    • /
    • 2024
  • 인공지능과 인터넷의 발전으로 인한 데이터의 증가로 데이터 관리의 중요성이 부각되고 있는 상황에서, 데이터 검색과 메모리 공간의 효율적 활용이 매우 중요한 시대가 도래하였다. 본 연구에서는 메타데이터를 기반으로 데이터 구조를 분석하여 검색 속도와 메모리 효율을 최적화하는 방안을 연구한다. 연구방법으로는 사진 이미지의 메타데이터를 활용하여 배열, 연결리스트, 딕셔너리, 이진 트리, 그래프의 데이터 구조에 대한 성능을 시간적, 공간적 복잡도를 중심으로 비교하고 분석하였다. 실험을 통해 대규모의 이미지 데이터를 다루는 상황에서 딕셔너리 구조는 수집속도에서, 그래프 구조는 검색 속도에서 가장 우수한 성능을 보여주는 것을 확인할 수 있었다. 본 논문의 결과는 이미지 데이터 검색 속도와 메모리 효율을 최적화하기 위한 데이터 구조를 선택하는데 실용적인 가이드라인을 제시할 것으로 기대한다.

MPEG-7 시각 정보 기술자의 특성을 반영한 효율적인 멀티미디어 데이타 비트맵 인덱싱 방법 (An Efficient Bitmap Indexing Method for Multimedia Data Reflecting the Characteristics of MPEG-7 Visual Descriptors)

  • 정진국;낭종호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권1호
    • /
    • pp.9-20
    • /
    • 2005
  • 최근 멀티미디어 정보를 기술하기 위한 표준인 MPEG-7이 제안되어 이미지/동영상 검색 시스템과 간은 응용분야에서 사용되기 시작하였다. 그러나 MPEG-7 시각 정보 기술자들은 대부분 고차원으로 표현이 되고, 고차원에서 발생되는 문제인 "Curse of dimensionality" 때문에 기존의 인덱싱 방법(예를 들면 트리 구조를 이용하는 다차원 인덱싱 방법, 차원을 줄이는 방법, 양자화 등의 압축 기법을 이용하는 방법 등)으로는 효율적인 검색을 할 수 없다. 본 논문에서는 MPEG-7 시각 정보 기술자들의 특징을 반영한 효율적인 인덱싱 방법을 제안한다. 제안된 방법에서는 기술자를 속성 히스토그램으로 변형하고 히스토그램의 자 빈 값을 이진 형태로 표현하여 비트열을 생성하며, 이러한 비트열들을 이용하여 비트맵 인덱스를 구성한다. 질의 오브젝트가 입력되면 비트맵 인덱스를 이용하여 결과에 포함될 가능성이 있는 후보 오브젝트 리스트를 생성하게 되는데 즉, 각 오브젝트의 인덱스와 질의 오브젝트의 비트열에 대한 XOR(Exclusive OR) 연산을 수행하여서 후보 오브젝트 리스트를 생성한다. 그리고 이 리스트에 있는 오브젝트들에 대해서만 L1-norm과 같은, 기술자를 위해 사용되는 비교 연산식을 수행하여 최종 결과 오브젝트들을 사용자에게 보여주게 된다. 본 논문에서 제안하는 알고리즘은 단순한 비트 연산을 통해 검색 결과에 포함될 가능성이 있는 오브젝트들을 추출해낼 수 있기 때문에 빠른 시간 내에 검색을 마칠 수 있도록 해준다. 실험에 의하면 제안한 방법을 이용하는 경우, 90% 이상의 정확도를 유지하면서 검색 시간에서는 순차 검색에 비해 15배 이상의 속도 향상을 보임을 알 수 있었다.

논문 원문을 이용한 동명 저자 자동 군집화 (Automatic Clustering of Same-Name Authors Using Full-text of Articles)

  • 강인수;정한민;이승우;김평;구희관;이미경;구남앙;성원경
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.652-656
    • /
    • 2006
  • 대용량 과학 기술 문헌의 탐색 및 검색에 있어서 저자, 저자 소속 기관, 게재지 등에 대해 고유 식별자에 기반한 표현의 필요성이 증가하고 있다. 특히, 과학 기술 문헌의 저자가 단순히 이름으로 표현될 경우, 동일명을 가진 서로 다른 저자들에 대한 구분은 사용자의 검색 부담을 가중시키게 된다. 이러한 동명이인의 문제를 해결하기 위한 기존의 접근법들은 공저자 정보, 논문 제목 등의 서지 정보에 의존하는 공통점을 지닌다. 그러나, 기존의 방법들은 공저자가 없거나 논문 제목 간의 공통 어휘가 발견되지 않을 경우 어려움을 겪게 된다. 본 연구에서는, 동명저자 문제 해소를 위한 기존의 접근법을 보완하기 위해, 동명저자들의 논문 원문의 내용에 기반한 문서 군집화 방법을 사용한다. 국내 학술대회 발표 논문집을 대상으로 한 실험에서 제안한 방법이 기존의 서지정보에 기반한 해법의 단점을 보완할 수 있다는 가능성을 보였다.

  • PDF

제품 설계 정보 재사용을 위한 그래프 기반의 부품 영상 정보와 설계 정보의 병합 (Integration of Component Image Information and Design Information by Graph to Support Product Design Information Reuse)

  • 이형재;양형정;김경윤;김수형;김선희
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.1017-1026
    • /
    • 2006
  • 최근에는 제품 개발의 효율성 증대를 위해서 다양한 분야의 전문가들이 참여하는 분산된 협업적 개발 환경이 필수적으로 인식되고 있으며 이에 따른 제품 설계 정보의 재사용 문제가 새롭게 부각되고 있다. 본 논문에서는 제품 설계 정보의 재사용을 위해 멀티미디어 기기에서 획득된 제품 영상을 부품 단위로 분할하여 속성 관계 그래프를 생성하고 이를 통해 제품 설계 정보를 검색하는 시스템을 제안한다. 본 논문에서 제안한 시스템은 라벨링 방법으로 제품 영상을 분할하고, 각 분할 영역의 속성과 영역간의 관계를 표현하는 속성 관계 그래프를 생성한다. 속성 관계 그래프는 제품 설계 정보를 추가하여 확장함으로써 영상 검색을 통한 제품 설계 정보의 재사용이 가능하다. 본 시스템의 주요 이점은 다음과 같다. 첫째, 주변 장치로부터 쉽게 획득할 수 있는 멀티미디어 영상을 이용하므로 특정 설계 툴에 종속적이지 않다. 둘째, 비율을 이용한 특징 벡터에 의해 다양한 크기의 유사 부품을 포함하는 영상의 검색이 가능하다. 셋째, 분할된 각 부품의 영역에 대한 다양한 영상 정보와 그들의 관계를 적용하기 때문에 검색 능력이 뛰어나다.

차등흡수분광기술을 이용한 지상기반 Pandora 관측으로부터의 대기 중 이산화질소 칼럼농도 산출 (Retrieval of Nitrogen Dioxide Column Density from Ground-based Pandora Measurement using the Differential Optical Absorption Spectroscopy Method)

  • 양지원;홍현기;최원이;박준성;김대원;강형우;이한림;김준
    • 대한원격탐사학회지
    • /
    • 제33권6_1호
    • /
    • pp.981-992
    • /
    • 2017
  • 본 연구에서는 처음으로 차등흡수분광기술(Differential Optical Absorption Spectroscopy, DOAS) 중 광학 두께 피팅(optical density fitting) 방법을 이용하여 지상기반 원격 측정 장비인 Pandora의 복사휘도 자료로부터 2014년 5월부터 12월 사이 서울에서의 대류권 이산화질소 연직칼럼농도를 산출하였다. 본 연구에서는 Pandora로부터 산출된 대류권 이산화질소 연직칼럼농도와 Aura 위성의 OMI (Ozone Monitoring Instrument) 센서로부터 산출된 대류권 이산화질소 연직칼럼농도를 비교하였다. Pandora로 부터 산출된 대류권 이산화질소 연직칼럼농도와 OMI 센서로부터 산출된 대류권 이산화질소 연직칼럼농도 사이의 상관계수(Correlation coefficient, R)는 0.55로 나타났다. 현장 측정 장비로부터 측정된 지표 이산화질소 혼합비와의 비교를 위해 AIRS (Atmospheric Infrared Sounder) 관측 자료를 이용하여 Pandora와 OMI센서로부터 산출된 대류권 이산화질소 연직칼럼농도를 행성경계층 내 이산화질소 혼합비로 변환하였다. 현장 측정 자료의 지표 이산화질소 혼합비는 5.5 ppbv에서 61.5 ppbv의 범위로 분포하였으며 Pandora와 OMI 센서로부터 산출된 행성경계층 내 이산화질소 혼합비는 각각 2.1 ppbv에서 44.2 ppbv, 0.9 ppbv에서 11.6 ppbv의 범위로 분포하였다. Pandora로부터 산출된 행성경계층 내 이산화질소 혼합비는 현장 측정 장비로부터 측정된 지표 이산화질소 혼합비와 비교적 비슷한 범위로 분포하였으나, OMI센서로부터 측정된 지표 이산화질소 혼합비는 현장 측정 장비와 Pandora의 이산화질소 혼합비에 비해 좁은 범위로 분포하였다. 현장 측정 장비로부터 측정된 지표 이산화질소의 혼합비와 Pandora로부터 산출된 행성경계층 내 이산화질소 혼합비 사이의 상관관계(R = 0.50)는 현장 측정 장비로부터 측정된 지표 이산화질소의 혼합비와 OMI로부터 산출된 행성경계층 내 이산화질소 혼합비 사이의 상관관계(R = 0.36)보다 좋은 것으로 나타났다. 이는 위성 기반 원격 측정 장비인 OMI센서는 지상 기반 원격 측정 장비인 Pandora 장비와 현장 측정 장비에 비하여 높은 고도에서 측정함으로써 지표 부근에 이산화질소에 대한 민감도가 떨어지기 때문인 것으로 생각된다.

전자 카탈로그에 대한 효율적인 색인어 통계 정보 관리 방법 (Efficient Management of Statistical Information of Keywords on E-Catalogs)

  • 이동주;황인범;이상구
    • 한국전자거래학회지
    • /
    • 제14권4호
    • /
    • pp.1-17
    • /
    • 2009
  • 전자 카탈로그는 상품이나 서비스 정보를 저장하고 있는 전자 문서로, 전자 상거래에서 가장 중요한 자료 중 하나이다. 전자 카탈로그는 지속적으로 추가, 수정 혹은 삭제되면서 최신의 상태로 유지되게 되는데, 전자 카탈로그의 양이 많아지면서 중복이 발생하고, 부적합한 분류에 할당되는 등, 품질 유지 문제가 발생한다. 검색, 중복확인, 자동분류는 카탈로그 품질 관리를 위해 중요한 기능들인데, 이 기능을 구현하기 위해서 카탈로그에서 추출된 색인어들의 통계 정보를 활용한 확률 모델들이 제시되었다. 그러나 이들은 서로 독립적으로 다루어 졌기에, 카탈로그 관리 시스템이라 는 하나의 시스템에서 구현될 수 있음에도 불구하고, 각 모델들이 공유하는 데이터와 이를 관리하기 위한 데이터 관리 기법에 관한 연구는 미흡하였다. 따라서 본 논문에서는 세 기능을 위한 확률모델을 정리하고, 이를 관계형 데이터베이스 상에서 구현하고, 통계 정보를 효율적으로 관리하는 방법을 제시한다. 특히, 실체화 뷰를 이용하여 불필요한 응용의 개발 비용과 데이터 무결성 저해요인을 제거하였다. 다량의 실제 전자 카탈로그 데이터베이스에 대한 실험을 통해 관계형 데이터 베이스를 이용한 구현이 속도와 정확성에 있어 실용성이 있음을 보였고, 응용을 통한 통계 정보갱신 방법과의 비교를 통해 실체화 뷰를 활용한 통계 정보 관리 기법의 효용성을 보였다.

  • PDF

실시간 웹 크롤링 분산 모니터링 시스템 설계 및 구현 (Design and Implemention of Real-time web Crawling distributed monitoring system)

  • 김영아;김계희;김현주;김창근
    • 융합정보논문지
    • /
    • 제9권1호
    • /
    • pp.45-53
    • /
    • 2019
  • 급변하는 정보화 시대에서 웹사이트에 서비스되는 정보 과잉에 대한 문제들을 접하곤 한다. 정보가 많아도 쓸모 있는 정보는 없고, 필요한 정보를 선택하는데 불필요한 시간이 많이 소비 된다. 검색 엔진과 같은 여러 사이트에서는 데이터의 최신 상태 유지를 위해 웹 크롤링을 한다. 웹 크롤링은 대부분 방문한 사이트의 모든 페이지의 복사본을 생성하는 데 사용되며 검색 엔진은 이렇게 생성된 페이지를 더욱 빠른 검색을 위해 인덱싱 한다. 많은 데이터 중에 정보가 실시간으로 변경되는 도매정보, 주문정보 등의 제한된 웹 데이터 수집은 일반적인 주제 중심의 웹 데이터 수집으로 무리가 있다. 현재 제한적 웹 정보를 실시간으로 수집하고 저장하는 방법에 대한 대안이 제시되고 있지 않다. 본 논문에서는 제한된 웹 사이트의 정보를 수집하고, 데이터의 상세분석을 통한 수집 시간 예측과 분류 작업을 통해 병렬 시스템에 저장하는 웹 크롤링 분산 모니터링 시스템(R-WCMS)을 제안한다. 실험 결과 웹 사이트 정보 검색을 제안모델에 적용하여 15-17% 시간이 감소됨을 입증했다.