• 제목/요약/키워드: Entity-based

검색결과 748건 처리시간 0.027초

자연어 처리의 개체명 인식을 통한 기록집합체의 메타데이터 추출 방안 (A method for metadata extraction from a collection of records using Named Entity Recognition in Natural Language Processing)

  • 송치호
    • 한국기록관리학회지
    • /
    • 제24권2호
    • /
    • pp.65-88
    • /
    • 2024
  • 본 연구는 인공지능의 하위분야인 자연어 처리(NLP)의 개체명 인식(NER)을 통하여 기록에 내재된 메타데이터 값과 기술 정보를 추출하는 방안에 대한 시험적 연구이다. 연구 대상은 1960~1970년대에 생산된 구로공단 수기 기록물(약 1,200 쪽, 8만여 단어)을 대상으로 하였다. 디지털화를 포함하는 전처리 과정과 함께 기록 텍스트에 대해서 구글의 BERT 언어모델에 기반하여 구현되어 공개된 언어 API를 사용하여 개체명을 인식하였다. 그 결과로 구로공단의 과거 기록에 포함된 173개의 인명과 314개의 조직 및 기관 개체명을 추출할 수 있었고, 이는 기록의 내용에 대한 직접적인 검색어로 사용될 수 있다고 기대된다. 그리고 자연어 처리의 이론적 방법론을 반·비정형의 텍스트로 이루어진 실제 기록물에 적용할 때 발생하는 문제점을 파악하여 해결 방안과 고려해야 할 시사점을 제시했다.

지상무기체계 교전 모의를 위한 에이전트 기반 시뮬레이션 시스템 아키텍처 설계 연구 (A Study on Agent based Simulation System Architecture for the Engagement of Ground Weapon Systems)

  • 함원경;정용호;나재호;박상철
    • 한국시뮬레이션학회논문지
    • /
    • 제21권4호
    • /
    • pp.81-90
    • /
    • 2012
  • 본 논문은 지상무기체계 교전을 모의하기 위한 시뮬레이션 시스템 구축에 관한 연구이다. 본 논문에서는 에이전트 시뮬레이션 설계 방법론에 기반하여 시뮬레이션 시스템 아키텍처를 제안한다. 제안된 아키텍처의 각 개체는 에이전트 기반으로 모듈화된 컴포넌트들을 조합하여 구성된다. 이와 같은 개체 구성 방법은 개체의 재사용성과 조합성을 향상시키고, 결과적으로 시뮬레이션 시스템의 개발에 투입되는 시간, 비용, 및 노력을 감소시킨다. 지상무기체계 교전의 모의는 환경의 영향을 반영하는 것이 매우 중요하다. 제안된 아키텍처의 합성전장환경은 전장의 환경 데이터를 가지며 시뮬레이션 시스템의 전투개체와 계속적으로 상호작용한다. 이러한 아키텍처를 기반으로 구축된 시뮬레이션 시스템은 목적에 따라 다양한 지상무기체계 교전 시나리오의 신속한 모의가 가능하고, 개체들의 행위 수행에 환경 영향이 반영되어 신뢰성 있는 시뮬레이션 결과를 도출할 수 있다. 본 논문은 제안된 아키텍처를 기반으로 예제 시스템을 구축하여 그 효용성을 증명하였다.

무기체계 효과도 분석을 위한 개체 플러그인 방식의 모의 재구성 연구 (Simulation Reconfiguration using Entity Plug-in approach for Weapon System Effectiveness Analysis)

  • 김태영
    • 한국시뮬레이션학회논문지
    • /
    • 제27권2호
    • /
    • pp.49-59
    • /
    • 2018
  • 무기체계 효과도 분석은 시뮬레이션 기반 획득 단계에서 합리적 의사결정을 지원하기 위한 수단 중 하나이다. 무기체계의 효과도는 환경과 교리 등 복합적인 요소에 영향을 받는 지표이며 주요 관심 이슈에 따라 다르게 정의될 수 있다. 이로 인해 무기체계 효과도 분석은 공통적인 조건과 환경 상에서 다양한 대안에 관한 비교 실험을 요구한다. 이에 본 연구는 리플렉션 기법을 활용하여 모의 구조를 효율적으로 재구성할 수 있는 방법을 제안한다. 제안하는 방법은 DEVS(Discrete EVent System specification) 형식론을 기반으로 하며 모의 개체의 동적 플러그인을 통한 구조 및 환경 재구성을 포함하며 이를 통해 다양한 대안 요구를 다룰 수 있는 효과도 분석 환경을 구상하고자 한다.

NLP기반 NER을 이용해 소셜 네트워크의 조직 구조 탐색을 위한 협력 프레임 워크 (A Collaborative Framework for Discovering the Organizational Structure of Social Networks Using NER Based on NLP)

  • 프랭크 엘리호데;양현호;이재완
    • 인터넷정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.99-108
    • /
    • 2012
  • 방대한 양의 데이터로부터 정보추출의 정확도를 향상시키기 위한 많은 방법이 개발되어 왔다. 본 논문에서는NER(named entity recognition), 문장 추출, 스피치 태깅과 같은 여러 가지의 자연어 처리 작업을 통합하여 텍스트를 분석하였다. 데이터는 도메인에 특화된 데이터 추출 에이전트를 사용하여 웹에서 수집한 텍스트로 구성하였고, 위에서 언급한 자연어 처리 작업을 사용하여 비 구조화된 데이터로부터 정보를 추출하는 프레임 워크를 개발하였다. 조직 구조의 탐색을 위한 택스트 추출 및 분석 관점에서 연구의 성능을 시뮬레이션을 통해 분석하였으며, 시뮬레이션 결과, 정보추출에서 MUC 및 CoNLL과 같은 다른 NER 분석기 보다 성능이 우수함을 보였다.

간호기록을 이용한 중환자실 간호업무 조사연구 (Analysis of the Nursing Practice in a Medical ICU Based on an Electronic Nursing Record)

  • 송경자
    • 대한간호학회지
    • /
    • 제37권6호
    • /
    • pp.883-890
    • /
    • 2007
  • Purpose: The purpose of this study was to identify the entity of critical care nursing practices through analyzing nursing statements described by electronic nursing records in a MICU. Methods: 176,459 nursing statements of 188 patients during a 6 month-stay were analyzed statement by statement according to the nursing process(nursing phenomena, nursing diagnosis, & nursing activity) and 21 nursing components of Saba's Clinical Care Classification. Results: Among 176,459 single statements, the statements of nursing activity ranked first in number. The contents of the statements were analyzed and categorized by main themes. Among 489 categorized themes, the number of themes of nursing phenomena statements was the highest. When analyzed by Saba's clinical Care Classification, the nursing statements mainly included a physiological component. Among 21 components, the respiratory component ranked in the first position in nursing phenomena, nursing diagnosis and nursing activity. The extra statements not included in the 21 components were 9,294(15.1%) in nursing phenomena and 21,949(22.7%) in nursing activity. Most are statements related to tests and the doctor. Conclusion: The entity of MICU nursing practice expressed by electronic nursing records was mainly focused on physiological components and more precisely on respiratory components.

웹계층 오브젝트 모델링을 통한 분산 애플리케이션 개발 프레임웍크 (A Framework for Developing Distributed Application with Web-Tier Object Modeling)

  • 천상호;권기현;최형진
    • 정보처리학회논문지D
    • /
    • 제11D권5호
    • /
    • pp.1143-1148
    • /
    • 2004
  • 분산 애플리케이션을 위한 다계층 모델 또는 분산 아키텍처를 개발하기 위해서는 웹디자이너와 페이지 작성가의 역할 분리, 엔터티 정의와 사용에 대한 고려, 데이터베이스 연결 및 관리, 트랜잭션 처리 둥 여러 가지 사항을 고려하여야 한다. 본 논문에서는 분산 애플리케이션 개발시 여러 고려사항에 대한 해결책으로 웹 계층 오브젝트 모델링 방법을 사용하는 DONSL(Data Server of Non SQL-Query) 아키텍처를 제안한다. 이 아키텍처는 트랜잭션 처리를 지원하고 웹 계층과 DBMS 사이에는 질의 로직을 단순화하는 방법을 통해 성능을 보장하는 구조이다. 제안한 개념적인 프레임웍은 각 계층(tier)의 작업을 단순화시키고 엔터티와 DAO(Data Access Object)를 제거시킴으로서 중대규모 사이트 구현을 용이하게 하는 방법을 제공한다.

백화점 독점 수입브랜드 자산 요인에 대한 연구 (A Study on the Asset Attributions of Exclusive Imported Brands at Department Stores)

  • 류문상;박재옥
    • 한국의류산업학회지
    • /
    • 제13권1호
    • /
    • pp.44-54
    • /
    • 2011
  • This study aims to clarify the asset evaluation attributes of imported brands exclusively by department stores based on qualitative study. For the qualitative research, hands-on staff of the branch office who had at least 5 years experience in PB-related positions at one of the four domestic department stores(Lotte, Shinsegae, Hyundai, Galleria), and at least 20 years old adults who had purchased imported brand items exclusively by a certain department store(Shinsegae, Lotte) were included. The asset evaluation attributes of department store-exclusively imported brands were drawn up through the one-to-one in-depth interview method. As a result of qualitative study on the asset evaluation attributes of department store-exclusive importation brands, it turned out that there were 4 factors in view of business entity - stability, profitability, growth potential, and relationship, and that there were 6 factors in view of consumers - product quality, recognition, country of origin, image, preference, and reliability. In comparison with the existing preliminary study, it was notable that relationship in view of business entity, and country of origin in view of consumers were added to the asset elements.

결함 심각도에 기반한 소프트웨어 품질 예측 (Software Quality Prediction based on Defect Severity)

  • 홍의석
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권5호
    • /
    • pp.73-81
    • /
    • 2015
  • 소프트웨어 결함 예측 연구들의 대부분은 입력 개체의 결함 유무를 예측하는 이진 분류 모델들에 관한 것들이다. 하지만 모든 결함들이 같은 심각도를 갖지는 않으므로 예측 모델이 입력 개체의 결함경향성을 몇 개의 심각도 범주로 분류할 수 있다면 훨씬 유용하게 사용될 수 있다. 본 논문에서는 전통적인 복잡도와 크기 메트릭들을 입력으로 하는 심각도 기반 결함 예측 모델을 제안하였다. 학습 알고리즘은 많이 사용되는 네 개의 기계학습 기법들을 사용하였으며, 모델 구조는 삼진 분류 모델로 하였다. 모델 성능 평가를 위해 실험 데이터는 두 개의 NASA 공개 데이터 집합을 사용하였고, 평가 측정치는 Accuracy를 이용하였다. 평가 실험 결과는 역전파 신경망 모델이 두 데이터 집합에 대해 각각 81%와 88% 정도의 Accuracy 값으로 가장 좋은 성능을 보였다.

전자기록철의 구조와 관리방안 - 영국 ERMS 표준을 중심으로 - (A Study of Electronic Records Folder Management)

  • 설문원;천권주
    • 한국기록관리학회지
    • /
    • 제5권2호
    • /
    • pp.49-72
    • /
    • 2005
  • 본 연구의 목적은 전자기록의 계층구조와 유형을 조사 분석하고, 전자기록의 각 계층 중 관리에 가장 기본이 되는 계층인 기록철(records folder)의 관리방안을 제시하는 것이다. 이를 위해 영국의 "전자기록관리시스템을 위한 기능요건"을 기준으로 전자기록의 계층모형 및 기록철 관리방안을 분석하였다. 또한 이 표준에서 제시한 전자기록의 계층구조를 가상의 사례에 적용해봄으로써 각 계층의 의미를 분명히 설명하고자 하였다. 이러한 선진사례 분석을 토대로, 우리나라 분류체계에서 전자기록철의 개념 도입 시 고려해야할 점, 전자기록철의 개시와 종결 기준 설정, 전자기록권(part) 개념의 도입 등을 중심으로 시사점을 정리하였다.

웹 GIS 기반 철도 지반정보 관리프로그램의 개발 (Development of the Railroad Geotechnical Information Management System Using Web GIS)

  • 황선근;이성혁;김현기;김정무
    • 한국철도학회논문집
    • /
    • 제7권1호
    • /
    • pp.20-25
    • /
    • 2004
  • Railroad geotechnical information management system was developed by using Web GIS and DB in this study. The standardization of railroad geotechnical information is progressed by classifying three groups as like basic informations, vibration informations along railway lines and design drawings. The basic informations consisted of basic and dynamic properties of soils, geophysical exploration and seismic survey/exploration. And the specification for 'human exposure to whole-body vibration' was adopted to construct the vibration informations along railway lines. The informations as like drawings and photographs were saved by changing to graphic files in the standardization of design drawings. In the case of standardization of geographical information, the topographical maps(NGIS, 1:5000) were primarily used as digital maps. Another digital maps(KRRI, 1:5000) and their geographical DB based on NGI code system were added on this maps. The standardized informations were used to construct their database. And railroad information management system was developed using Entity-Relation(ER) model which had a good feasibility for expansion and transition to other system in designing stage of database. This system consisted of layer selection, search and analysis of geotechnical informations and Zeus DB was adopted for GIS operating and user interface. This system could be a good tool for saving, searching and analyzing the geotechnical and geophysical informations. These DB systems would offered the basic informations to plans, design and construction of railroad lines etc. in practical use.