• Title/Summary/Keyword: Entity-based

Search Result 755, Processing Time 0.022 seconds

A Study on efficient application of elderly human resource through the aged for start business (고령자창업을 통한 고령인적자원의 효율적 관리방안에 관한 연구)

  • Jung, Lee-Sang
    • Management & Information Systems Review
    • /
    • v.25
    • /
    • pp.143-169
    • /
    • 2008
  • The purpose of this paper is to propose alternatives to help for the aged to implement start business as a method to recreate the aged population for their second life. There are three considerations that supports start business for the elderly. The first is to reinforce educational support system for the aged. Through the lifelong education, the aged require easy start business' information. This is not only goverment's job, a local autonomous entity is to support in the form of organic organization. The second is the maintenance of financial support system. Besides start business education, various financial support system must serve for the aged to challenge their start business enthusiastically. The last consideration is formation of start business network that joins the aged efficiently. Based on these aspects, the application for increasing elderly human resource is to consider both employment program of the aged and also start business program for them.

  • PDF

KAISER: Named Entity Recognizer using Word Embedding-based Self-learning of Gazettes (KAISER: 워드 임베딩 기반 개체명 어휘 자가 학습 방법을 적용한 개체명 인식기)

  • Hahm, Younggyun;Choi, Dongho;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.337-339
    • /
    • 2016
  • 본 논문에서는 한국어 개체명 인식의 성능 향상을 위하여 워드 임베딩을 활용할 수 있는 방법에 대하여 기술한다. 워드 임베딩이란 문장의 단어의 공기정보를 바탕으로 그 단어의 의미를 벡터로 표현하는 분산표현이다. 이러한 분산 표현은 단어 간의 유의미한 정도를 계산하는데 유용하다. 본 논문에서는 이러한 워드 임베딩을 통하여 단어 벡터들의 코사인 유사도를 통한 개체명 사전 자가 학습 및 매칭 방법을 적용하고, 그 실험 결과를 보고한다.

  • PDF

Lexicon Feature Infused Character-Based LSTM CRFs for Korean Named Entity Recognition (문자 기반 LSTM-CRF 한국어 개체명 인식을 위한 사전 자질 활용)

  • Min, Jin-Woo;Na, Seung-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.99-101
    • /
    • 2016
  • 문자 기반 LSTM CRF는 개체명 인식에서 높은 인식을 보여주고 있는 LSTM-CRF 방식에서 미등록어 문제를 해결하기 위해 단어 단위의 임베딩 뿐만 아니라 단어를 구성하는 문자로부터 단어 임베딩을 합성해 내는 방식으로 기존의 LSTM CRF에서의 성능 향상을 가져왔다. 한편, 개체명 인식에서 어휘 사전은 성능 향상을 위한 외부 리소스원으로 활용하고 있는데 다양한 사전 매칭 방법이 파생될 수 있음에도 이들 자질들에 대한 비교 연구가 이루어지지 않았다. 본 논문에서는 개체명 인식을 위해 다양한 사전 매칭 자질들을 정의하고 이들을 LSTM-CRF의 입력 자질로 활용했을 때의 성능 비교 결과를 제시한다. 실험 결과 사전 자질이 추가된 LSTM-CRF는 ETRI 개체명 말뭉치의 학습데이터에서 F1 measure 기준 최대 89.34%의 성능까지 달성할 수 있었다.

  • PDF

A Korean Named Entity Recognizer using Weighted Voting based Ensemble Technique (가중 투표 기반의 앙상블 기법을 이용한 한국어 개체명 인식기)

  • Kwon, Sunjae;Heo, Yoonseok;Lee, Kyunchul;Lim, Jisu;Choi, Hojeong;Seo, Jungyun
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.333-336
    • /
    • 2016
  • 본 연구에서는 개체명 인식의 성능을 향상시키기 위해, 가중 투표 방법을 이용하여 개체명 인식 모델을 앙상블 하는 방법을 제안한다. 각 모델은 Conditional Random Fields의 변형 알고리즘을 사용하여 학습하고, 모델들의 가중치는 다목적 함수 최적화 기법인 NSGA-II 알고리즘으로 학습한다. 실험 결과 제안 시스템은 $F_1Score$기준으로 87.62%의 성능을 보여, 단독 모델 중 가장 높은 성능을 보인 방법보다 2.15%p 성능이 향상되었다.

  • PDF

Named Entity Linking Based on Deep Learning Model (딥러닝 모형 기반 한국어 개체명 연결)

  • Sohn, Dae-Neung;Lee, Dongju;Lee, Yong-Hun;Chung, Youjin;Kang, Inho
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.90-95
    • /
    • 2016
  • 개체명 연결이란 문장 내 어떤 단어를 특정 사물이나 사람, 장소, 개념 등으로 연결하는 작업이다. 과거에는 주로 연결 대상 단어 주변 문맥에서 자질 공학을 거쳐 입력을 만들고, 이를 이용해 SVM이나 Logistic Regression 혹은 유사도 계산, 그래프 기반 방법론 등으로 지도/비지도 학습하여 문제를 풀어왔다. 보통 개체명 연결 문제의 출력 부류(class)가 사물이나 사람 수만큼이나 매우 커서, 자질 희소성 문제를 겪을 수 있다. 본 논문에서는 이 문제에 구조적으로 더 적합하며 모형화 능력이 더 뛰어나다 여겨지는 딥러닝 기법을 적용하고자 한다. 다양한 딥러닝 모형을 이용한 실험 결과 LSTM과 Attention기법을 같이 사용했을 때 가장 좋은 품질을 보였다.

  • PDF

Answer Extraction based on Named Entity in Korean Question Answering System (한국어 질의응답시스템에서 개체인식에 기반한 대답 추출)

  • Lee, Kyung-Soon;Kim, Jae-Ho;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.184-189
    • /
    • 2000
  • 본 논문에서는 한국어 질의응답시스템에서 개체인식에 기반하여 대답을 추출하는 방법을 제안한다. 질의에 대해 문서검색을 통해 검색된 상위 문서를 대상으로 하여 대답이 들어 있을 가능성이 높은 단락을 추출한다. 질의 유형 분석을 통해 대답 유형을 파악한다 단락에 나타나는 어휘들에 대해서 대답유형에 속하는지에 대한 개체인식을 통해서 대답을 추출한다. 질의응답 시스템의 평가를 위한 테스트컬렉션을 이용한 성능평가에서는 순위5까지의 대답추출에서 역순위 평균값이 개체추출에 대해서는 0.322, 50바이트 대답추출에서는 0.449, 250바이트 대답추출에서는 0.559이다. 상위 5이내에 정답을 포함할 비율은 개체추출에서는48.90%, 50바이트 대답추출에서는 62.20%, 250바이트 대답추출에서는 68.90%을 성능을 보였다.

  • PDF

Korean Named Entity Recognition Based on Supervised Learning Using Named Entily Construction Principles (개체명 구성 원리를 이용한 교사학습 기반의 한국어 개체명 인식)

  • Hwang, Yi-Gyu;Lee, Hyun-Sook;Chung, Eui-Sok;Yun, Bo-Hyun;Park, Sang-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.111-117
    • /
    • 2002
  • 개체명 인식은 질의응답(QA), 정보 주줄(IE), 텍스트 마이닝 시스템의 성능 향상에 중요한 역할을 담당한다. 이 논문에서는 교사학습 기반의 한국어 개체명 인식에 대해 설명한다. 한국어에서 많은 개체명들이 하나 이상의 단어로 구성되어 있으며, 개체명을 구성하는 단어 사이에는 의존 관계가 존재하고, 개체명과 개체명 주위의 단어 사이에도 문맥적 의존관계를 가지고 있다. 본 논문에서는 가변길이의 개체명과 주변 문맥의 학습을 위해 트라이그램을 이용한 HMM을 사용하였으며, 자료 부족 문제를 해소하기 위해 어휘 기반이 아닌 부개체 유형 기반의 학습을 수행하였다. 학습된 개체명 인식 시스템을 이용하여 경제 분야의 신문 기사에 대한 실험 결과, 84.4%의 정확률과 90.9%의 재현률을 보였다.

  • PDF

A Study on the Generation of Simulation Codes for Process Design under CIM Environments (CIM 환경에서 프로세스 설계를 위한 시뮬레이션 코드의 자동 생성에 관한 연구)

  • 박찬권;김기태;장성용;박진우
    • Journal of the Korea Society for Simulation
    • /
    • v.6 no.1
    • /
    • pp.25-40
    • /
    • 1997
  • This study deals with an autonomous generation of simulation codes for the design of processes of c CIM system based on the concept of model transformation. We assume we have a functional model of an organization which is developed using the well-known IDEF0 methodology. Then, a modeling methodology, called PROWD(PRocess flOW Description), is suggested to develop the flow processes of the organization. To Derive simulation specifications for the transformed PROWD model, we define a module of a "unit system" for each activity of PROWD model. Then specifications for system entities and resources are derived from input/control/mechanism/output and entity flows of PROWD model. Entitiy queues are defined from the sates and events of unit systems. Finally, SIMAN model frame is generated from those specifications through a suggested algorithm. The implementability and validity of the proposed approach is tested by developing a prototype of a computer-assisted design system on the operation processes of FMS installed at SNU-ASRI (Seoul National University-Automation and Systems Research Institute).nstitute).

  • PDF

Korean Named Entity Recognition using Cotraining-based Learning (Cotraining 학습을 이용한 한국어 개체명 인식)

  • Lee, Hyun-Sook;Chung, Eui-Sok;Hwang, Yi-Gyu;Yun, Bo-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.597-600
    • /
    • 2002
  • 본 논문에서는 정보추출 및 정보검색, 문서요약과 같은 자연어처리 응용에서 중요한 역할을 하는 개체명 인식 모델을 제안하였다. 기존의 한국어 개체명 인식에 관한 연구는 규칙 기반 연구의 경우 수동으로 생성한 규칙이나 어휘사전에 매우 의존적이고, 통계기반의 연구의 경우 개체명이 태깅된 대량의 학습데이터를 필요로 하므로 새로운 도메인으로의 이식성 관점에서 한계가 있다. 이를 극복하기 위해 본 논문에서는 개체명이 태깅되지 않은 학습데이터를 이용하여 Cotraining 기반 학습을 수행함으로써 개체명 인식을 위한 규칙과 사전을 자동적으로 확장하였다. 실험 결과, 경제분야 문서에 대해 87.6%의 정확률을 보였다.

  • PDF

Development of web based Load Service Entity System(LSES) (웹 기반의 부하관리사업자 시스템(LSES)개발)

  • Lee, Yong-Ik;Kim, Tae-Ho;Han, Jin-Hee;Yoon, Tae-Wook
    • Proceedings of the KIEE Conference
    • /
    • 2003.11a
    • /
    • pp.435-437
    • /
    • 2003
  • 공급 예비력 확보와 설비투자 지연을 목적으로 운영하였던 직접 부하제어(DLC)는 경쟁, 규제 완화, 민간 자본의 참여 등으로 변화된 양방향 입찰 시장에서 시장가격결정에 수요측 의사를 반영하는 수단으로 의미가 변화되어 가고 있다. 현재 직접 부하제어 시범사업은 한전과 에너지관리공단에서 2원화하여 운영하고 있으며 에너지관리공단의 시스템 구성은 상위 시스템으로 전력부하관리센터(LMC)와 민간 사업자용 부하관리사업자시스템(LSES), 하위 시스템으로 EMD 시스템으로 구성되어 있다. 본 논문에서는 민간 부하관리 사업자인 LG 산전의 데이터 센터에 설치된 웹 기반의 부하관리사업자시스템의 구성, 주요 기능, 구현된 배분 알고리즘, 정산 알고리즘을 소개하고 시스템의 유용성 및 활용 방안을 언급하고자 한다.

  • PDF