• 제목/요약/키워드: Automatic Data Extraction

검색결과 310건 처리시간 0.031초

RSS와 OLAP 큐브를 이용한 FOAF의 동적 관리 기법 (A Dynamic Management Method for FOAF Using RSS and OLAP cube)

  • 손종수;정인정
    • 지능정보연구
    • /
    • 제17권2호
    • /
    • pp.39-60
    • /
    • 2011
  • 웹 2.0 기술이 소개된 이후 소셜 네트워크 서비스는 미래 정보기술의 기초로서 중요하게 인식되고 있다. 이에, 웹2.0 환경에서 소셜 네트워크를 구축하기 위하여 온톨로지 기반의 사용자 프로필 기술 도구인 FOAF를 활용하기 위한 다양한 연구가 이뤄지고 있다. 그러나 FOAF를 이용하여 소셜 네트워크를 생성 및 관리하는 대부분의 방법은 시간의 흐름에 따라 변화하는 사용자의 소셜 네트워크를 자동적으로 반영하기 어려운 단점이 있으며 다양한 소셜 미디어 서비스가 제공되는 환경에서는 FOAF를 동적으로 관리하기가 쉽지 않다. 따라서 본 논문에서는 기존 FOAF를 이용한 소셜 네트워크 추출방법의 한계를 극복하기 위하여 사용자 프로파일 기술 언어인 FOAF와 웹 저작물 출판 매커니즘인 RSS를 OLAP 시스템에 적용시켜 동적으로 FOAF를 갱신하고 관리하기 위한 방법을 제안한다. 본 논문에서 제안하는 방법은 수집한 FOAF와 RSS 파일들을 스타스키마로 설계된 데이터베이스에 넣어 OLAP 큐브를 생성한다. 그리고 OLAP 연산을 이용하여 사용자의 연결관계를 분석하고 FOAF에 그 결과를 반영한다. 본 논문에서 제안하는 방법은 이기종 분산처리 환경 하에서 데이터의 상호호환성을 보장할 뿐만 아니라 시간의 흐름에 따른 사용자의 관심 및 이슈 등의 변화를 효과적으로 반영한다.

기본의미등록기의 RDF/OWL 연계방안에 관한 연구 (Designing Schemes to Associate Basic Semantics Register with RDF/OWL)

  • 오삼균
    • 정보관리학회지
    • /
    • 제20권3호
    • /
    • pp.241-259
    • /
    • 2003
  • 기본의미등록기(BSR)는 전자상거래 및 EDI 관련 시스템 사이의 상호연동을 가능하게 하기 위한 등록기이다. XML 기반 BSR 등록개체들의 구조정보나 다양한 관계의 자동추출은 현재 불가능하다. 이 연구에서는 BSR에 등록되는 정보를 자원기술-프레임웍(RDF)과 웹온톨로지언어(OWL)에 기반하는 기계가독형으로 정의한 대표적인 예를 제시하고 결론적으로 5개의 기본 권고안을 도출하였다. 즉 BSR 컴포넌트 소속의 클래스 정의에서 동의어의 표현에는 OWL의 'sameAs', 유사어 표현에는 OWL의 'equivalenlClass', BSR 개념들 간의 상.하 관계 표현은 RDF 스키마의 'subClassOF', BSR의 의미단위(BSU)에 관한 정의는 RDF 스키마의 'label', 인스턴스 용례에 관한 설명은 RDF 스키마의 'comment', 각 BSU의 클래스 소속에 관한 정의는 RDF 스키마의 'domain', BSU가 취할 수 있는 데이터유형에 대한 정의는 RDF 스키마의 'range'등을 적용하며, 나아가 BSR 데이터요소의 정의에 XML 스키마의 데이터 유형을 접목시키고 BSU들 간의 상.하 관계 표현에 RDF 스키마의 'subPropertyOF'를 적용할 것을 추천하였다.

예보인자의 효과적 추출을 위한 다항식 방사형 기저 함수 신경회로망 기반 초단기 강수예측 분류기의 설계 (Design of Very Short-term Precipitation Forecasting Classifier Based on Polynomial Radial Basis Function Neural Networks for the Effective Extraction of Predictive Factors)

  • 김현명;오성권;김현기
    • 전기학회논문지
    • /
    • 제64권1호
    • /
    • pp.128-135
    • /
    • 2015
  • In this study, we develop the very short-term precipitation forecasting model as well as classifier based on polynomial radial basis function neural networks by using AWS(Automatic Weather Station) and KLAPS(Korea Local Analysis and Prediction System) meteorological data. The polynomial-based radial basis function neural networks is designed to realize precipitation forecasting model as well as classifier. The structure of the proposed RBFNNs consists of three modules such as condition, conclusion, and inference phase. The input space of the condition phase is divided by using Fuzzy C-means(FCM) and the local area of the conclusion phase is represented as four types of polynomial functions. The coefficients of connection weights are estimated by weighted least square estimation(WLSE) for modeling as well as least square estimation(LSE) method for classifier. The final output of the inference phase is obtained through fuzzy inference method. The essential parameters of the proposed model and classifier such ad input variable, polynomial order type, the number of rules, and fuzzification coefficient are optimized by means of Particle Swarm Optimization(PSO) and Differential Evolution(DE). The performance of the proposed precipitation forecasting system is evaluated by using KLAPS meteorological data.

자동 선구조 추출 알고리즘을 이용한 경북 의성지역의 선구조 분석 (Lineament analysis in the euiseong area using automatic lineament extraction algorithm)

  • 김상완
    • 자원환경지질
    • /
    • 제32권1호
    • /
    • pp.19-31
    • /
    • 1999
  • In this study, we have estimated lineaments in the Euiseong area, Kyungbuk Province, from Landsat TM by applying the algorithm developed by Kim and Won et al. which can effectively reduce the look direction bias associated with the Sun's azimuth angle. Fratures over the study area were also mapped in the field at 57 selected sites to compare them with the results from the satellite image. The trends of lineaments estimated from the Landsat TM images are characterized as $N50^{\circ}$~70W, NS~$N10^{\circ}$W, and $N10^{\circ}$~$60^{\circ}$E trends. The spatial distribution of lineaments is also studied using a circular grid, and the results show that the area can be divided into two domains : domain A in which NS~$N20^{\circ}$E direction is dominant, and domain B in which west-north-west direction is prominent. The trends of lineaments can also be classified into seven groups. Among them, only C, D and G trends are found to be dominant based upon Donnelly's nearest neighbor analysis and correlations of lineament desities. In the color composite image produced by overlaying the lineament density map of these C-, D-, and G-trends, G-trend is shown to be developed in the whole study area while the eastern part of the area is dominated by D-trend. C-trend develops extensively over the whole are except the southeastern part. The orientation of fractures measured at 35 points in the field shows major trends of NS~$N30^{\circ}$E, $N50^{\circ}$~$80^{\circ}$W, and N80$^{\circ}$E~EW, which agree relatively well with the lineaments estimated form the satellite image. The rose diagram analysis fo field data shows that WNW-ESE trending discontinuities are developed in the whole area while discontinuities of NS~$N20^{\circ}$E are develped only in the estern part, which also coincide with the result from the satellite image. The combined results of lineaments from the satellite image and fracture orientation of field data at 22 points including 18 minor faults in Sindong Group imply that the WNW-ESE trend is so prominent that Gumchun and Gaum faults are possibly extended up to the lower Sindong Group in the study area.

  • PDF

Mountain Clustering 기반 퍼지 RBF 뉴럴네트워크의 동정 (Identification of Fuzzy-Radial Basis Function Neural Network Based on Mountain Clustering)

  • 최정내;오성권;김현기
    • 한국정보전자통신기술학회논문지
    • /
    • 제1권3호
    • /
    • pp.69-76
    • /
    • 2008
  • 본 논문에서는 Mountain clustering 알고리즘을 이용한 Fuzzy Radial Basis Function Neural Network(FRBFNN)의 규칙 수를 자동생성 방법을 제시한다. FRBFNN은 기존 RBFNN에서 가우시안이나 타원형 형태의 특정 RBF를 사용하는 구조와 달리 클러스터의 중심값과의 거리에 기반을 둔 멤버쉽함수를 사용하여 전반부의 공간 분할 및 활성화 레벨을 결정한다. 또한 분할된 로컬영역에서의 입출력 특성을 나타내는 퍼지규칙의 후반부로서 고차 다항식을 고려하였다. 본 논문에서는 데이터의 밀집도에 기반을 두어 클러스터링을 수행하는 Mountain clustering 알고리즘을 사용하여 적합한 퍼지 규칙(클러스터)의 수와 클러스터의 중심값을 자동적으로 생성하는 방법을 제안한다. Mountain clustering으로부터 구해진 클러스터의 중심은 멤버쉽 값을 결정하는데 사용되며, Weighted Least Square Estimator (WLSE) 알고리즘을 사용하여 후반부 다항식의 계수를 추정한다. 제안된 알고리즘은 비선형 함수 모델링에 적용하여 성능의 우수성과 알고리즘의 타당성을 보인다.

  • PDF

사례 기반 지능형 수출통제 시스템 : 설계와 평가 (Export Control System based on Case Based Reasoning: Design and Evaluation)

  • 홍원의;김의현;조신희;김산성;이문용;신동훈
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.109-131
    • /
    • 2014
  • 최근 전 세계적인 원전 설비의 수요 증가로 원자력 전략물자 취급의 중요성이 높아지는 가운데, 국외 수출을 위한 원전 관련 물품 및 기술의 신청 또한 급증하는 추세이다. 전략물자 사전판정 업무는 통상 원자력 물자 관리에 해박한 전문가의 경험 및 지식에 근거하여 수행되어 왔지만, 급증하는 수요에 상응하는 전문 인력의 공급이 부족한 실정이다. 이러한 문제를 극복하기 위하여, 본 연구진은 전략물자 수출 통제를 위한 사례 기반 지능형 수출 통제 시스템을 설계 및 개발하였다. 이 시스템은 현장 전문가의 전담 업무이던 신규 사례에 대한 전략물자 사전판정 과정 업무의 주요 맥락을 자동화 하여 전문가 및 관계 기관이 감당해야 할 업무 부담을 줄이며, 빠르고 정확한 판정을 돕는 의사결정 지원 시스템의 역할을 맡는다. 개발된 시스템은 사례 기반 추론 (Case Based Reasoning) 방식에 기반을 두어 설계되었는데, 이는 과거 사례의 특성을 활용하여 신규 사례의 해법을 유추하는 추론 방법이다. 본 연구에서는 자연어로 작성된 전자문서 처리에 널리 사용되는 텍스트 마이닝 분석 기법을 원자력 분야에 특화된 형태로 응용하여 전략물자 수출통제 시스템을 설계하였다. 시스템 설계의 근거로 선행 연구에서 제안된 반자동식 핵심어 추출 방안의 성능을 보다 엄밀히 검증하였고, 추출된 핵심어로 신규 사례와 유사한 과거 사례를 추출하는 알고리즘을 제안하였다. 제안된 방안은 텍스트 마이닝 분야의 TF-IDF 방법 및 코사인 유사도 점수를 활용한 결과(${\alpha}$)와 원자력 분야에서 통용되는 개념적 지식을 계통으로 분류하여 도출한 결과(${\beta}$)를 조합하여 최종 결과 (${\gamma}$) 를 생성하게 된다. 세부 요소 기술의 성능 검증은 임상 데이터를 활용한 실험 및 실무 전문가의 의견수렴을 통해 이루어졌다. 개발된 시스템은 사전판정 전문 인력을 다수 양성하는 데 드는 비용을 절감하는 데 일조할 것이며, 지식서비스 산업의 의미 있는 응용 사례로서 관련 산업의 성장에 기여할 수 있을 것으로 보인다.

점진적 EM 알고리즘에 의한 잠재토픽모델의 학습 속도 향상 (Accelerated Loarning of Latent Topic Models by Incremental EM Algorithm)

  • 장정호;이종우;엄재홍
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권12호
    • /
    • pp.1045-1055
    • /
    • 2007
  • 잠재토픽모델(latent topic model)은 데이타에 내재된 특징적 패턴이나 데이타 정의 자질들 간의 상호 관련성을 확률적으로 모델링하고 자동 추출하는 모델로서 최근 텍스트 문서로부터의 의미 자질 자동 추출, 이미지를 비롯한 멀티미디어 데이타 분석, 생물정보학 분야 등에서 많이 응용되고 있다. 이러한 잠재토픽모델의 대규모 데이타에 대한 적용 시 그 효과 증대를 위한 중요한 이슈 중의 하나는 모델의 효율적 학습에 관한 것이다. 본 논문에서는 대표적 잠재토픽모델 중의 하나인 PLSA (probabilistic latent semantic analysis) 기법을 대상으로 점진적 EM 알고리즘을 활용한, 기본 EM 알고리즘 기반의 기존 학습에 대한 학습속도 증진 기법을 제안한다. 점진적 EM 알고리즘은 토픽 추론 시 전체 데이타에 대한 일괄적 E-step 대신에 일부 데이타에 대한 일련의 부분적 E-step을 수행하는 특징이 있으며 이전 데이터 일부에 대한 학습 결과를 바로 다음 데이타 학습에 반영함으로써 모델 학습의 가속화를 기대할 수 있다. 또한 이론적인 측면에서 지역해로의 수렴성이 보장되고 기존 알고리즘의 큰 수정 없이 구현이 용이하다는 장점이 있다. 논문에서는 해당 알고리즘의 기본적인 응용과 더불어 실제 적용과정 상에서의 가능한 데이터 분할법들을 제시하고 모델 학습 속도 개선 면에서의 성능을 실험적으로 비교 분석한다. 실세계 뉴스 문서 데이타에 대한 실험을 통해, 제안하는 기법이 기존 PLSA 학습 기법에 비해 유의미한 수준에서 학습 속도 증진을 달성할 수 있음을 보이며 추가적으로 모델의 병렬 학습 기법과의 조합을 통한 실험 결과를 간략히 제시한다.

갯벌지역 고해상도 지형정보 구축을 위한 항공 라이다와 UAV 데이터 통합 활용에 관한 연구 (A Study on the Integration of Airborne LiDAR and UAV Data for High-resolution Topographic Information Construction of Tidal Flat)

  • 김혜진;이재빈;김용일
    • 한국측량학회지
    • /
    • 제38권4호
    • /
    • pp.345-352
    • /
    • 2020
  • 갯벌의 보존과 복원 및 안전사고 예방을 위해서, 갯골의 정확한 위치와 형상을 포함하는 갯벌 지형정보 구축이 필요하다. 현장 측량이 어려운 갯벌 지역에 대해, 항공 라이다 측량은 넓은 지역에 대한 정확한 위치정보 데이터의 취득이 가능하며, UAV (Unmanned Aerial Vehicle) 측량은 상대적으로 공간해상력이 우수한 데이터를 경제적으로 제공할 수 있다. 본 연구에서는 효과적인 갯벌 지형정보 구축을 위하여 항공 라이다와 UAV 포인트 클라우드 간의 데이터 통합을 수행하고, 갯골의 세부 지형을 갱신하는 방법을 제안하였다. 이를 위해 ICP (Iterative Closest Point) 알고리즘을 활용하여 두 이종 데이터를 자동 정합하고, 지면 필터링 기법인 CSF (Cloth Simulation Filtering)를 활용하여 갯골을 추출한 후, 갯골 영역에 대한 고점밀도 UAV 데이터와 평평한 지면에 대한 항공 라이다 데이터를 통합하였다. 통합된 데이터로부터 DEM (Digital Elevation Model) 및 갯골의 영역과 깊이 정보를 생성하여 대축척 갯벌 지도 제작을 위한 고해상도 지형정보를 구축하였다. 연구결과, 제안한 방법을 통해 GCP (Ground Control Point) 없이 UAV 데이터를 기하보정하고, 갯골의 세부 지형정보를 포함하면서 데이터 용량은 상대적으로 작은 통합 데이터를 생성할 수 있었다.

분석 CRM 실무자의 자연어 질의 처리를 위한 기업 데이터베이스 구성요소 인덱싱 방법론 (A PageRank based Data Indexing Method for Designing Natural Language Interface to CRM Databases)

  • 박성혁;황경서;이동원
    • CRM연구
    • /
    • 제2권2호
    • /
    • pp.53-70
    • /
    • 2009
  • 분석 CRM 영역에서는 고객 데이터 분석을 통하여 고객 행동과 관련된 통찰력을 얻는 것이 중요하다. 이러한 분석 과정에서, 사용자 스스로 기업 데이터베이스에서 대용량 고객 이력 데이터를 조회하고 추출하기 위해서는 SQL 을 사용하여 자유롭게 질의구문을 작성할 수 있어야 한다. 그런데 일반 사용자들이 이러한 업무를 수행하고자 할 때, 기업 데이터베이스 구성 요소에 대한 전문적인 지식이 부족하기 때문에 정보 탐색에 있어서 어려움을 겪는다. 이를 해결하기 위한 방안으로 본 연구에서는 사용자가 제공하는 자연어 수준의 질의를 분석하고, 데이터베이스를 구성하는 값을 중심으로 올바른 질의 결과를 제공하기 위한 데이터베이스 구성요소 인덱싱 방법론을 제안한다. 구체적으로 기업 데이터베이스를 구성하는 세 가지 요소인 관계, 속성, 값에 대한 정보를 읽어 들여 요약 정보에 대한 인덱스를 구성한 다음 사용자의 자연어 질의에서 분석된 의미 단위 별로 데이터베이스 요약 정보와 연결해주는 TableRank 기법을 소개한다. 실험용 데이터베이스를 대상으로 테스트를 수행한 결과, 사용자의 자연어 질의 결과가 데이터베이스를 구성하는 값 정보와 연결되는 것이 관찰되었다. 논문의 후반부에서는 자연어 질의를 자동적으로 처리하기 위한 선행 모듈 개발의 시사점을 정리하고, 향후 기업 데이터베이스 자동 검색 시스템으로 발전하기 위한 방안에 대해서도 설명한다.

  • PDF

국가토지피복도와 무감독분류를 이용한 초기 훈련자료 자동추출과 토지피복지도 갱신 (Automatic Extraction of Initial Training Data Using National Land Cover Map and Unsupervised Classification and Updating Land Cover Map)

  • 이승기;최석근;노신택;임노열;최주원
    • 한국측량학회지
    • /
    • 제33권4호
    • /
    • pp.267-275
    • /
    • 2015
  • 토지피복지도는 환경, 군사, 의사결정 등 다양한 분야에서 널리 사용되고 있다. 본 연구에서는 단일 위성영상과 환경부에서 제공하는 국가토지피복도를 이용하여 훈련자료를 자동으로 추출하고, 이를 활용하여 피복을 분류하는 방법을 제안하였다. 이를 위하여 초기 훈련자료는 무감독분류인 ISODATA와 기존 토지피복도를 이용하였으며, 무감독 분류 사용시 각 클래스별 분류 선정과 클래스 명명, 감독분류에서 훈련자료 선정 등의 문제점을 해결하기 위하여 기존 토지피복도의 클래스 정보를 활용하여 자동으로 클래스를 분류하고 명명하였다. 추출된 초기 훈련자료는 대상 위성영상의 토지피복분류를 위하여 MLC의 훈련자료를 활용하였고, 피복분류의 정확도 향상을 위하여 반복방법을 적용하여 훈련자료를 갱신하였으며 최종적으로 토지피복지도를 추출하였다. 또한, 화소분류방법에서 발생하는 salt and pepper를 감소시키기 위하여 각 반복단계별 MRF를 적용하여 분류정확도를 향상시켰다. 본 연구에서 제안된 방법을 대상지역에 적용한 결과 효과적으로 토지피복지도를 생성할 수 있음을 정량적, 시각적으로 확인하였다.