• 제목/요약/키워드: 의미 기반 정보 추출

검색결과 676건 처리시간 0.028초

하천정비기본계획 CAD 형식 단면측량자료 자동 추출 및 하천공간 데이터베이스 업로딩과 HEC-RAS 지원을 위한 RAUT 툴 개발 (RAUT: An End-to-End Tool for Automated Parsing and Uploading River Cross-sectional Survey in AutoCAD format to River Information System for Supporting HEC-RAS Operation)

  • 김경동;유호준;김동수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.75-75
    • /
    • 2020
  • 하천법에 의거하여 국내 하천들에는 상당한 국가예산으로 하천정비기본계획이 5-10년 주기로 수립되고 있으며, 홍수위 계산을 위한 HEC-RAS 모의에 필요한 하천단면 등 다양한 하천측량이 실시되고 있다. 그러나, 하천측량자료들은 하천관리지리정보시스템(RIMGIS)에 pdf 보고서 형태로만 제공되고, 원자료는 CAD 형식으로 하천정비계획을 수행한 설계사 등이 분산 소유하고 있어 관리부재로 망실의 우려도 있어, 다른 용도로의 활용성이 상당히 저하되어 있는 실정이다. 그리고, 측량된 CAD 형식의 단면자료 등을 HEC-RAS에 활용할 때, 'Dream'과 같은 툴을 활용하나 거의 수작업에 가까운 시간과 비용이 소요되는 현실에 있다. 본 연구에서는 이러한 문제들을 해결할 수 있는 툴인 RAUT(River information Auto Upload Tool)를 개발하였다., RAUT 툴은 첫째, 실무에서 하천기본계획 수립 시 활용되는 HEC-RAS 1차원 모형의 입력자료를 CAD 측량자료를 직접수기로 입력 및 모의를 실시하는 복잡한 단계를 자동화시키고자 하였다. 둘째, 하천공간정보인 CAD측량 자료를 직접 읽어 표준 데이터 모델 (Arc River)기반 하천공간정보 DB에 자동 업도드하여 전국단위의 하천정비계획의 하천측량자료 관리가 가능하게 할 수 있다. 즉, 만약 RIMGIS가 RAUT와 같은 툴을 사용하면 하천단면과 같은 전국단위 하천측량 자료를 체계적으로 관리할 수 있게 된다는 의미이다. 개발한 RAUT는 제주도 한천유역을 대상으로 하천정비기본계획의 하천공간정보 CAD자료를 읽어들여 mySQL기반 공간 DB로 구축하고, 구축된 DB로부터 HEC-RAS 1차원 모의 실시하기 위한 지형자료를 자동으로 생성시키는 과정을 시범적으로 구현하였다.

  • PDF

항공 LiDAR 데이터를 이용한 건물추출과 상부구조물 특성분석 및 모델링 (Utilizing Airborne LiDAR Data for Building Extraction and Superstructure Analysis for Modeling)

  • 정형섭;임새봄;이동천
    • 한국측량학회지
    • /
    • 제26권3호
    • /
    • pp.227-239
    • /
    • 2008
  • 항공 레이저 스캐닝(ALS) 시스템으로부터 획득한 LiDAR 데이터를 미용하여 3차원 객체 모델링과 지형도 제작을 위해서는 데이터의 기하학적 및 의미적인 분할과 같은 체계적인 데이터 처리가 선행되어야 한다. ALS로 부터 활용 가능한 LiDAR 데이터를 획득하기 위해서는 GPS, INS 및 레이저 스캐너 데이터의 통합이 필수적이다. 본 연구에서는 건물추출과 지붕 구조물 분할을 위해서 LiDAR 데이터를 영상화하여 디지털 영상처리 기법을 적용하였다. 영상화된 데이터를 사용하는 주요 장점 중 하나는 기존의 다양한 영상처리 알고리즘을 사용할 수 있다는 점이다. 격자화 및 정량화를 거치는 영상화 과정에서 원시 LiDAR 데이터가 한정된 밝기값으로 변환되므로 평활화 및 상세 정보의 손실이 발생될 수 있지만. 평활화된 데이터는 표면분할과 모델링에 오히려 적합하다. 건물의 경계선은 윤곽선 추출 연산자를 이용하여 정확하게 추출하였으며, 건물 모양에 적합하도록 규격화하였다. 건물 지붕의 구조물의 분할은 영역확산을 기반으로 수행하였다. 이 결과 다양한 디지털 영상처리 기법을 복합적으로 적용하여 건물추출과 지붕 구조물의 면분할이 가능함을 보여주었다. 또한 지붕의 형태를 재현하기 위한 특성정보 추출에 관한 개념적 방법을 제안하였다. 지붕 데이터를 분할하고 모델링을 위해 통계적 및 기하적 특성을 이용하였으며. 제안한 방법에 의한 시뮬레이션 결과는 지붕면을 분할하고 모델링하는데 가능함을 보여주고 있다.

의미기반 인덱스 추출과 퍼지검색 모델에 관한 연구 (A Study on Semantic Based Indexing and Fuzzy Relevance Model)

  • Kang, Bo-Yeong;Kim, Dae-Won;Gu, Sang-Ok;Lee, Sang-Jo
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.238-240
    • /
    • 2002
  • If there is an Information Retrieval system which comprehends the semantic content of documents and knows the preference of users. the system can search the information better on the Internet, or improve the IR performance. Therefore we propose the IR model which combines semantic based indexing and fuzzy relevance model. In addition to the statistical approach, we chose the semantic approach in indexing, lexical chains, because we assume it would improve the performance of the index term extraction. Furthermore, we combined the semantic based indexing with the fuzzy model, which finds out the exact relevance of the user preference and index terms. The proposed system works as follows: First, the presented system indexes documents by the efficient index term extraction method using lexical chains. And then, if a user tends to retrieve the information from the indexed document collection, the extended IR model calculates and ranks the relevance of user query. user preference and index terms by some metrics. When we experimented each module, semantic based indexing and extended fuzzy model. it gave noticeable results. The combination of these modules is expected to improve the information retrieval performance.

  • PDF

k-최근점 학습에 기반한 타동사-목적어 연어 사전의 최적화 (Optimization of Transitive Verb-Objective Collocation Dictionary based on k-nearest Neighbor Learning)

  • 김유섭;장병탁;김영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권3호
    • /
    • pp.302-313
    • /
    • 2000
  • 영한 기계번역에서 영어 문장의 동사구를 한국어로 정확하게 번역하기 위해서는 일반적으로 타동사와 목적어의 연어 관계를 이용한다. 본 논문에서는 k-최근점(k-nearest neighbor) 학습을 연어 관계에 적용하여 동사 번역을 선택하는 알고리즘을 제시하였는데 k-최근점 학습을 위해서 워드넷에서의 의미거리를 정의하여 사용하였다. 그리고 실시간 번역 시스템에 사용될 사전을 구성하기 위하여, 말뭉치로부터 타동사-목적어 쌍을 추출하여 학습예제를 구축하고, 이 예제의 크기를 번역률과 연관시켜 최적화시키는 알고리즘을 제시한다. 본 논문에서는 위의 알고리즘들을 사용하여 동사 'build'의 번역률을 약 90%로 유지하면서 사전의 크기를 최적화하였다.

  • PDF

MR 영상을 위한 효율적인 영역분할기반 웨이블렛 압축기법 (An Efficient Segmentation-based Wavelet Compression Method for MR Image)

  • 문남수;이승준;송준석;김종효;이충웅
    • 대한의용생체공학회:의공학회지
    • /
    • 제18권4호
    • /
    • pp.339-348
    • /
    • 1997
  • 본 논문에서는 일반적으로 잡음이 있는 MR 영상의 배경 영역을 영역분활 알고리듬으로 제거하고 이영역분할의 정보를 손실 부호화에 이용함으로써 데이터의 압축 효율을 높이는 방법을 제안한다. 영역분할 알고리듬은 여역의특성 추출을 위해 전해상도 웨이블렛 변화(full-resolution wavelet transform)을 이용하며, 얻은 특성등의 분류를 위해 Kohonen self-organizing map을 사용한다. 웨이블렛 변환을 이용한 부호기에서는 영역분활 결과 진단에 의미없는 부분으로 판단된 영역은 부호화 하지 않음으로써 압축효율을 향상시킨다. 제안한 알고리듬으로 MR영상들을 부호화한 결과, 영역분할 정보를 이용하지 않을 경우보다 평균적으로 약 15%정도의 비트율의 절약을 가져올 수 있었으며, 같은 압축률일 경우에는 복원된 영상이 JPEG에서보다 좋은 화질을 나타내었다.

  • PDF

심음 기반의 심장질환 분류를 위한 새로운 시간영역 특징 (New Temporal Features for Cardiac Disorder Classification by Heart Sound)

  • 곽철;권오욱
    • 한국음향학회지
    • /
    • 제29권2호
    • /
    • pp.133-140
    • /
    • 2010
  • 연속 심음신호로부터 추출한 새로운 시간영역에서의 특징들을 추가하여 심장질환 분류의 성능을 개선한다. 기존에 사용되고 있는 켑스트럼 영역 특징인 멜주파수 켑스트럼 계수 (MFCC)에 심음 포락선, 심잡음 확률벡터, 심잡음 진폭값 변동으로 구성된 새로운 3종류의 시간영역 특징을 추가한다. 심장 질환 분류 및 검출 실험에서, 시간영역 특징의 분류 정확도에 대한 기여도를 평가하고 순차적 특징선택 방식을 이용하여 시간영역 특징을 선택한다. 선택된 특징들은 다층 퍼셉트론(MLP), support rector machine (SVM), extreme learning machine (ELM)와 같은 신경회로망 패턴 분류기에 대하여 의미있고 일관되게 분류 정확도를 개선함을 보여준다.

데이터마이닝 기술을 이용한 한국과학기술인용색인DB 활용 방안 연구 (A Study on Utilization of Korea Science Citation Database(KSCD) Based on Data Mining Techniques)

  • 박종현;최선희;김병규
    • 정보관리연구
    • /
    • 제43권4호
    • /
    • pp.191-210
    • /
    • 2012
  • 한국과학기술정보연구원(KISTI)에서는 대량의 학술 정보들을 분류하여 저장하고 관리하기 위한 한국과학기술 인용색인 데이터베이스(KSCD)를 구축한 바 있다. 그러나 학술인용색인데이터들은 그 특성상 단순히 저장만을 위한 자료가 아니다. 즉, 저장된 데이터를 기반으로 사용자들에게 어떠한 서비스를 어떻게 제공할 것인지는 KSCD의 활용 측면에서 매우 중요한 문제이다. 예를 들어 사용자는 단순히 특정 저자가 기술한 학술 자료들을 검색하기를 원할 수도 있지만, 필요에 따라 해당 저자와 유사한 연구를 수행하는 저자들을 검색하기를 원할 것이다. 그러나 단순히 저장된 데이터만으로 이러한 서비스를 제공하기는 어렵다. 그러므로 본 논문에서는 한국과학기술인용색인 데이터베이스(KSCD)를 향후 어떻게 활용할 수 있는가에 대한 해답을 찾기 위해서는 국내외에서 현재 어떠한 서비스들을 제공하고 있는지 살펴보고 이와 관련하여 어떤 방향으로 연구가 진행해야 하는지를 모색한다. 특별히 데이터 마이닝 기술은 다양한 형태의 데이터로부터 데이터 속에 내포되어있는 특징(Feature)들을 추출하고 새로운 데이터 모델을 발견하여 의미 있는 정보를 추출해 내어 결국은 사용자의 의사 결정에 도움을 주는 것을 그 목적으로 한다. 즉 데이터에 숨겨진 패턴과 관계를 찾아내어 유용한 정보를 발견해 내는 것이다. 그러므로 본 논문에서는 이러한 데이터마이닝 기법을 학술인용색인데이터에 적용하여 제공할 수 있는 서비스들이 무엇이 있는지 논의한다.

C-ITS 기반 PVD를 활용한 차량 내 경고정보의 운전자 주행행태 영향 분석 (A Study to Evaluate the Impact of In-Vehicle Warning Information on Driving Behavior Using C-ITS Based PVD)

  • 김탁영;김호선;강경표;김승범
    • 한국ITS학회 논문지
    • /
    • 제21권5호
    • /
    • pp.28-41
    • /
    • 2022
  • C-ITS(Cooperative-Intelligent Transportation System)는 차량과 차량 또는 차량과 인프라 간의 양방향 무선통신 기술을 기반으로 전방의 교통상황 정보를 제공하는 기술 및 시스템을 의미한다. C-ITS 환경에서는 Vehicle-to-Everything(V2X) 기반의 경고 정보를 제공함으로써 운전자로 하여금 감속을 유도하고, 급격한 감속과 가속을 지양하도록 하여 주행행태를 안정적으로 개선시킬 수 있을 것으로 추측된다. 본 연구는 서울시 C-ITS 기반의 경고 정보의 개별적인 효과를 검증하기 위해 경고정보에 대한 순응여부를 판단할 수 있는 방법론을 개발하였으며 추가로 주행안전성 변화를 분석하여 경고정보의 효과를 정량적으로 평가해 보고자 한다. 순응여부는 정보 제공 유무로 구별되는 사전 PVD (Probe Vehicle Data)와 사후 PVD의 속도 분포를 추출하여 비교하였으며, 주행안전성 평가는 Jerk와 가속소음을 계산하여 분석을 수행하였다. 정량적 분석을 위해서 서울 C-ITS 사업기간동안 수집되었던 PVD와 부족한 데이터 수집을 보완하고자 DTG (Digital Tacho Graph) 데이터를 추가 수집하여 활용하였다. 순응도 분석결과 충분한 유효샘플이 수집된 경고정보에 대해 운전자는 감속운행행태를 보였으며, Jerk와 가속소음과 같은 주행안전성 지표를 산출하여 분석한 결과 경고정보 제공으로 인해 주행안전성이 개선되었음을 알 수 있었다.

Bidirectional LSTM CRF 기반의 개체명 인식을 위한 단어 표상의 확장 (Expansion of Word Representation for Named Entity Recognition Based on Bidirectional LSTM CRFs)

  • 유홍연;고영중
    • 정보과학회 논문지
    • /
    • 제44권3호
    • /
    • pp.306-313
    • /
    • 2017
  • 개체명 인식이란 문서 내에서 인명, 기관명, 지명, 시간, 날짜 등 고유한 의미를 가지는 개체명을 추출하여 그 종류를 결정하는 것을 말한다. 최근 개체명 인식 연구에서 가장 우수한 성능을 보여주고 있는 모델은 Bidirectional LSTM CRFs 모델이다. 이러한 LSTM 기반의 딥 러닝 모델은 입력이 되는 단어 표상에 의존적이다. 따라서 입력이 되는 단어를 잘 표현하기 위하여 단어 표상을 확장하는 방법에 대한 연구가 많이 진행되어지고 있다. 본 논문에서는 한국어 개체명 인식을 위하여 Bidirectional LSTM CRFs모델을 사용하고, 그 입력으로 사용되는 단어 표상을 확장하기 위해 사전 학습된 단어 임베딩 벡터, 품사 임베딩 벡터, 음절 기반에서 확장된 단어 임베딩 벡터, 그리고 개체명 사전 자질 벡터를 사용한다. 최종 단어 표상 확장 결과 사전 학습된 단어 임베딩 벡터만 사용한 것 보다 8.05%p의 성능 향상을 보였다.

시맨틱 기술을 활용한 RESTful 웹서비스의 검색 기법 개발 (Development of Search Method using Semantic technologies about RESTful Web Services)

  • 차승준;최윤정;이규철
    • 한국공간정보시스템학회 논문지
    • /
    • 제12권1호
    • /
    • pp.100-104
    • /
    • 2010
  • 최근 웹 2.0의 등장과 함께 플랫폼으로의 웹이 강조되면서, SOAP 기반의 웹서비스에 비해 RESTful 웹서비스가 크게 증가하고 있다. 하지만 서비스들은 이미 많이 존재하며 빠르게 증가하기 때문에 키워드를 기반으로 사용자가 원하는 서비스를 정확하게 찾는 것은 어렵다. 본 논문에서는 이러한 문제를 해결하기 위해서 시맨틱을 활용한 RESTful 웹서비스 검색 기법을 개발하였다. 이를 위해 우선 OpenAPI 통합 검색 시스템을 바탕으로 시맨틱을 활용하기 위한 시스템 구조를 구성하고, 시맨틱 검색을 위한 기술 형식을 모델링하였다. 이를 바탕으로 의미 마크업(태깅, 시맨틱 어노테이션)을 수행하여, 추출된 결과인 RDF 문서를 서비스 저장소에 저장하여 이를 바탕으로 검색을 수행한다. 온톨로지를 활용하여 입력받은 키워드를 확장하고, 이를 바탕으로 검색을 수행하여 사용자에게 유사도 기반의 키워드 검색 기법에서의 검색 결과보다 확장 / 정제된 검색 결과를 제공한다.