• 제목/요약/키워드: Information resources entity

검색결과 47건 처리시간 0.025초

언어자원 자동 구축을 위한 위키피디아 콘텐츠 활용 방안 연구 (A Study on Utilization of Wikipedia Contents for Automatic Construction of Linguistic Resources)

  • 류철중;김용;윤보현
    • 디지털융복합연구
    • /
    • 제13권5호
    • /
    • pp.187-194
    • /
    • 2015
  • 급변하는 자연언어를 기계가 이해할 수 있도록 하기 위해서는 다양한 언어지식자원(linguistic knowledge resources)의 구축이 필수적으로 수반된다. 본 논문에서는 온라인 콘텐츠의 특성을 활용해 언어지식자원을 자동으로 구축함으로써 지속적으로 확장 가능한 방법을 고안하고자 한다. 특히 언어분석 과정에서 가장 활용도가 높은 개체명(NE: Named Entity) 사전을 자동으로 구축, 확장하는데 주안점을 둔다. 이를 위해 본 논문에서는 개체명 사전 구축대상문서로 위키피디아(Wikipedia)를 선정, 그 특성을 파악하기 위해 다양한 통계 분석을 수행하였다. 이에 기반하여 위키피디아 콘텐츠가 갖는 구문적 특성과 구조 정보 등의 메타데이터를 활용하여 개체명 사전을 구축, 확장하는 방법을 제안한다.

생의학 분야 학술 논문에서의 개체명 인식 및 관계 추출을 위한 언어 자원 수집 및 통합적 구조화 방안 연구 (A Study on Collecting and Structuring Language Resource for Named Entity Recognition and Relation Extraction from Biomedical Abstracts)

  • 강슬기;최윤수;최성필
    • 한국문헌정보학회지
    • /
    • 제51권4호
    • /
    • pp.227-248
    • /
    • 2017
  • 본 논문에서는 급격히 증가하는 생의학 분야 비정형 텍스트에서 핵심적 내용을 추출할 수 있는 기계학습 기반 정보 추출시스템을 구축하기 위한 언어자원 수집 및 통합적 구조화 방안을 제안한다. 제안된 방법은 정보 추출 시스템을 크게 개체명 인식과 개체명 간 관계 추출 시스템으로 구분하고, 각각의 시스템에 적합한 학습데이터를 구성하기 위해 생의학 분야 개체명 사전과 학습 집합을 수집한다. 그리고 수집된 해당 자원들의 특성을 분석하여 개체 구별을 위해 필수적으로 포함시켜야 할 항목들을 도출하고 이를 통해 시스템 학습과정에서 사용될 학습 데이터를 구성하기 위한 항목을 선정한다. 이와 같이 선정된 학습데이터의 구성 내용에 따라 수집된 자원들을 가공하여 학습 데이터를 구축한다. 본 연구에서는 생의학 분야의 하위 분야인 유전자, 단백질, 질병, 약물 4개 분야에 대한 개체명 사전과 학습 집합을 수집하여 각각을 학습 데이터로 구축하였으며, 개체명 사전을 통해 구축된 개체명 인식용 학습 데이터를 대상으로 개체명 수용 범위를 측정하기 위한 검증 과정을 수행하였다.

기업의 정보자원관리(情報資源管理)를 위한 정보(情報) 매핑 (Information Mapping for Corporate Information Resources Managements)

  • 김재수
    • 정보관리연구
    • /
    • 제23권4호
    • /
    • pp.39-58
    • /
    • 1992
  • 정보(情報) 매핑을 사용하면 조직이 실제로 사용하고 있는 다수의 정보공급원(情報供給源) 및 서비스, 시스템들을 발견할 수 있고, 중요하지 않거나 중복되어 있거나, 불필요한 정보(情報)가 무엇인지를 발견할 수 있다. 이러한 정보자원(情報資源) 발견과정을 통하여 기업은 정보의 질(質), 접근성(接近性), 성능(性能), 유용성(有用性), 효율성(效率性)에 있어서 기업의 장점 및 약점에 연관된 문제점들과 적합성을 규명할 수가 있다.

  • PDF

영상 내 건설인력 위치 추적을 위한 등극선 기하학 기반의 개체 매칭 기법 (Entity Matching for Vision-Based Tracking of Construction Workers Using Epipolar Geometry)

  • 이용주;김도완;박만우
    • 한국BIM학회 논문집
    • /
    • 제5권2호
    • /
    • pp.46-54
    • /
    • 2015
  • Vision-based tracking has been proposed as a means to efficiently track a large number of construction resources operating in a congested site. In order to obtain 3D coordinates of an object, it is necessary to employ stereo-vision theories. Detecting and tracking of multiple objects require an entity matching process that finds corresponding pairs of detected entities across the two camera views. This paper proposes an efficient way of entity matching for tracking of construction workers. The proposed method basically uses epipolar geometry which represents the relationship between the two fixed cameras. Each pixel coordinate in a camera view is projected onto the other camera view as an epipolar line. The proposed method finds the matching pair of a worker entity by comparing the proximity of the all detected entities in the other view to the epipolar line. Experimental results demonstrate its suitability for automated entity matching for 3D vision-based tracking of construction workers.

다중개체모형을 적용한 무형문화유산 메타데이터 요소 개발에 관한 연구 (A Study on the Development of Metadata Schema for Intangible Cultural Heritage Based on Multiple Entity Model)

  • 한희정;김태영;김용
    • 한국문헌정보학회지
    • /
    • 제50권3호
    • /
    • pp.329-359
    • /
    • 2016
  • 본 연구는 다중개체모형을 기반으로 무형문화유산 메타데이터 요소를 개발하였다. 이를 위해 2016년에 새롭게 제정된 "무형문화재 보전 및 진흥에 관한 법률"과 무형문화유산 기록화도서 및 자원조사를 실시한 기관들의 기록정보자원과 가이드라인 및 전승현황을 조사하고, 관련 기관의 무형문화유산 디지털아카이빙 현황과 정보서비스들을 분석하여 무형문화유산에서 요구되는 정보항목들을 도출하였다. 또한 다중개체모형 기반의 무형문화유산 메타데이터 개발을 통해 가장 핵심인 무형문화유산 정보를 기준으로 무형문화유산과 관련된 행위주체들의 정보, 그리고 이들이 생산하는 기록정보자원 정보, 이들 기록정보자원들을 관리하는 데 필요한 기록관리업무 정보를 유기적으로 연결하여 종합적으로 제공할 수 있도록 하였다. 무형문화유산의 다양한 관계와 이들 정보의 최신성을 유지함으로써 정보의 효율적인 관리와 더불어 이용자에게 무형문화유산에 대한 풍부한 맥락 정보를 제공하고 궁극적으로 무형문화유산의 가치와 지속가능한 발전을 이끌어낼 수 있을 것으로 기대한다.

대용량 자원 기반 과학기술 핵심개체 탐지를 위한 정보추출기술 통합에 관한 연구 (A Study on the Integration of Information Extraction Technology for Detecting Scientific Core Entities based on Large Resources)

  • 최윤수;정창후;최성필;류범종;김재훈
    • 정보관리연구
    • /
    • 제40권4호
    • /
    • pp.1-22
    • /
    • 2009
  • 대용량 문서에서 정보를 추출하는 작업은 정보검색 분야 뿐 아니라 질의응답과 요약분야에서 매우 유용하다. 정보추출은 비정형 데이터로부터 정형화된 정보를 자동으로 추출하는 작업으로써, 개체명 인식, 전문용어 인식, 대용어 참조해소, 관계 추출 작업 등으로 구성된다. 이들 각각의 기술들은 지금까지 독립적으로 연구되어왔기 때문에, 구조적으로 상이한 입출력 방식을 가지며, 하부모듈인 언어처리 엔진들은 특성에 따라 개발 환경이 매우 다양하여 통합 활용이 어렵다. 과학기술문헌의 경우 개체명과 전문용어가 혼재되어 있는 형태로 구성된 문서가 많으므로, 기존의 연구결과를 이용하여 접근한다면 결과물 통합과정의 불편함과 처리속도에 많은 제약이 따른다. 본 연구에서는 생의학 분야 과학기술 문헌을 분석하여 전문용어 및 개체명 등을 통합 추출할 수 있는 기반 프레임워크를 개발한다. 이를 위하여, 문장자동분리, 품사태깅, 기저구인식 등과 같은 기반 언어 분석 모듈은 물론 이를 활용한 개체명 인식기, 전문용어 인식기를 개발하고 이들을 하나의 플랫폼으로 통합한 과학기술 핵심개체 인식 체계를 제안한다. 전체 플랫폼의 성능을 체계적으로 평가하기 위해서, KEEC 2009를 비롯한 다양한 말뭉치를 기반으로 세부 요수 모듈에 대한 성능 평가를 수행하였으며, 비교적 높은 수준의 성능을 확보하였다. 본 논문에서 개발된 핵심개체자동인식 플랫폼은 정보검색, 질의응답, 문서색인, 사전구축 등 다양한 정보서비스 분야에 활용될 수 있다.

농업환경자원관리를 위한 팜맵 활용전략에 관한 연구 (Farm-map Application Strategy for Agri-Environmental Resources Management)

  • 위성승;이원석;정남수
    • 한국농공학회논문집
    • /
    • 제64권3호
    • /
    • pp.1-8
    • /
    • 2022
  • In this study, a farm map utilization strategy for sustainable agricultural environmental resource management was derived. In addition, it is intended to present an efficient method of providing farm map-related services. As a result of the demand survey, the additional information required for the farm map includes 29% of information on crops grown on farmland, 21% of management-related information such as the owner or business entity, 17% of topographical information including slope, 15% of agricultural water information, 17% of land status information, and the addition of functions. 2% was investigated. As a result of intensive interview survey, it was found that it can be used for information on crops cultivated by agricultural businesses, actual cultivated area by township, arable land consolidation division boundary, and management of agricultural promotion zones. The farm map can be used as basic data to efficiently manage agricultural environmental resources. Since the status of support for individual farms or lots, such as soil improvement agent support and organic fertilizer support, may belong to personal information, it can be processed and provided in units required by administration or policies, such as administrative boundaries, subwatersheds, and watersheds. It can serve as a basis for executing the direct payment currently supported only by individual farms, even in a community unit that manages environmental direct payments.

효율적인 하천정보 서비스를 위한 RIMGIS 개선방안 연구 (A Study on the Improvement of RIMGIS for an Efficient River Information Service)

  • 신형진;채효석;황의호;임광섭
    • 한국지리정보학회지
    • /
    • 제16권1호
    • /
    • pp.15-25
    • /
    • 2013
  • 국가하천에 대한 하천대장, 하천측량도 및 부도 등 관련 정보들을 표준화하여 구축함으로써 관련 업무 활용 및 대국민 서비스 등을 실시하기 위해 국토해양부에서는 지난 2000년도부터 하천관리지리정보시스템(RIMGIS; River Information Management GIS)을 구축하여 운영 중에 있다. RIMGIS는 그 동안 정보환경 변화에 능동적으로 대응하기 위해 여러 차례 개선되었으며, 최근 스마트 리버 하천정보 서비스 및 관련 자료가 방대해짐에 따라 빅데이터를 효율적으로 관리하기 위한 개선이 필요한 실정이다. 본 연구에서는 RIMGIS의 현황 파악, 개선방향 도출, 데이터베이스를 재설계, 배포프로그램 개발 및 하천종합정보시스템 제안을 통해 정보환경 변화에 대응해 향후 스마트 리버 하천정보 서비스를 제공하기 위한 방안을 제시하고자 한다. 따라서, RIMGIS의 활용성을 강화하기 위해 속성정보의 엔터티간 연관관계를 구분할 수 있는 유일키와 외부키 등과 하천표준 데이터베이스 관점에서 테이블간의 위상관계를 정립하여 속성정보 DB의 구성과 정보관리를 위하여 연관관계도도 새롭게 제시하였다. 아울러, 하천관리 패러다임 변화에 대응 가능한 하천관련 정보의 효율적인 관리와 이용 체계 수립을 통해 현재 공급자 중심의 시스템 운영을 수요자 중심으로 확대하기 위한 방안을 도출하였다.

링크확률과 개체명 인식을 이용한 영-한 교차언어 링크 탐색 (English-Korean Cross-lingual Link Discovery Using Link Probability and Named Entity Recognition)

  • 강신재
    • 한국지능시스템학회논문지
    • /
    • 제23권3호
    • /
    • pp.191-195
    • /
    • 2013
  • 본 논문에서는 방대한 웹 자원의 연결성을 더욱 증가시키기 위해 영어 위키피디아 문서로부터 한국어 위키피디아 문서로의 교차언어 링크를 자동으로 탐색하는 방법을 제안한다. 어구의 링크확률을 대략 추정하여 사용하던 기존의 방법에 비해, 본 연구에서는 위키피디아 문서 집합으로부터 추출한 제목 목록과 링크 확률과 같은 다양한 정보들과 개체명 인식 결과를 함께 사용하여 링크가 걸릴 앵커 후보를 선택한다. 앵커 후보를 한국어 대역어로 번역한 후, 대역어에 가장 적합한 한국어 웹문서를 찾아 교차언어 링크로 설정하게 된다. 실험한 결과 MAP 수치로 0.375를 얻었다.

A Trust Management Model for PACS-Grid

  • Cho, Hyun-Sook;Lee, Bong-Hwan;Lee, Kyu-Won;Lee, Hyoung
    • Journal of information and communication convergence engineering
    • /
    • 제5권2호
    • /
    • pp.144-149
    • /
    • 2007
  • Grid technologies make it possible for IT resources to be shared across organizational and security domains. The traditional identity-based access control mechanisms are unscalable and difficult to manage. Thus, we propose the FAS (Federation Agent Server) model which is composed of three modules: Certificate Conversion Module (CCM), Role Decision Module (RDM), and Authorization Decision Module (ADM). The proposed FAS model is an extended Role-Based Access Control (RBAC) model which provides resource access capabilities based on roles assigned to the users. FAS can solve the problem of assigning multiple identities to a shared local name in grid-map file and mapping the remote entity's identity to a local name manually.