• 제목/요약/키워드: 반자동 구축

검색결과 108건 처리시간 0.051초

기계가독사전을 이용한 한국어 시소러스 구축 (Construct ion of Korean Thesaurus Us ing Machine Readable Dictionary)

  • 이주호;은광희;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.273-279
    • /
    • 2001
  • 시소러스는 자연언어처리의 여러 분야에서 이용 가능한 아주 유용한 정보이다. 본 논문에서는 기존의 구축된 시소러스를 기반으로 우리말 큰사전을 이용하여 한국어 명사 시소러스를 반자동으로 구축하는 과정을 소개한다. 우선 코퍼스의 고빈도어를 중심으로 사전에서 추출한 기본명사들의 각 의미에 1차로 의미번호 부착 후 그 결과를 이용하여 사전 정의문으로 각 의미별 클러스터를 구성했다. 그리고, 전단계에서 의미번호를 붙이지 못한 명사의 의미에 대하여 그 정의문과 클러스트들 간의 유사도를 계산하여 가장 유사한 의미번호를 후보로 제시하였다. 마지막으로 사전의 하이퍼링크를 사용하여 아직 의미 번호가 붙지 않는 명사의 의미에 의미번호를 부여했다. 각 단계에서는 사람의 후처리를 통해서 시소러스의 정확도를 높였다.

  • PDF

바이오 분야 학술 문헌에서의 분야별 관계 추출 데이터셋 반자동 구축에 관한 연구 - 알츠하이머병 유관 유전자 간 상호 작용 중심으로 - (A Study on the Semiautomatic Construction of Domain-Specific Relation Extraction Datasets from Biomedical Abstracts - Mainly Focusing on a Genic Interaction Dataset in Alzheimer's Disease Domain -)

  • 최성필;유석종;조현양
    • 한국도서관정보학회지
    • /
    • 제47권4호
    • /
    • pp.289-307
    • /
    • 2016
  • 본 논문에서는 생의학 분야의 특정 세부 분야에 특화된 관계 추출 학습 말뭉치를 효율적으로 구축할 수 있는 시스템을 소개한다. 이 시스템은 대상 분야에 해당하는 용어집(유전자, 단백질, 질환 명칭 등)을 입력하면, 대용량 상호 작용 데이터베이스를 통해서 이들 용어 간의 연관 관계를 1차적으로 생성하고 생성된 연관 관계 집합을 다시 학술 데이터베이스에서 검색하여 최종적으로 연관 관계 포함 문장을 추출하는 형태로 수행된다. 개발된 시스템의 유용성 검증을 위해서 알츠하이머병 분야에서의 유전자 간 상호 작용 학습 말뭉치를 구축하는데 본 시스템을 적용하였고, 140개의 유전자 집합을 입력하여 이 분야에 특화된 학습 집합인 유전자 쌍 및 상호 작용 포함 문장 3,510 건을 추출하였다. 본 논문에서 제안한 시스템을 활용함으로써 기존에 완전 수작업으로 수행되던 연관 관계 추출용 학습 말뭉치 구축의 효율성을 높일 수 있고 다양한 세부 분야에 적합한 학습 말뭉치 구축에 도움을 줄 수 있다.

기술용어 간 관계추출의 성능평가를 위한 반자동 테스트 컬렉션 구축 프레임워크 개발 (Development of a Framework for Semi-automatic Building Test Collection Specialized in Evaluating Relation Extraction between Technical Terminologies)

  • 정창후;최성필;이민호;최윤수
    • 한국콘텐츠학회논문지
    • /
    • 제10권2호
    • /
    • pp.481-489
    • /
    • 2010
  • 관계 추출 시스템의 중요성이 날로 부각되면서 이러한 시스템을 평가하기 위한 테스트 컬렉션의 구축이 중요한 과제로 떠오르고 있다. 본 논문에서는 반자동화된 처리 과정을 거쳐서 규모 있는 관계 추출용 테스트 컬렉션을 구축하는 프레임워크를 제안한다. 그리고 개발된 프레임워크를 이용하여 실제적으로 과학기술 문헌에 존재하는 기술용어 간 연관관계 추출 시스템의 성능 평가를 위한 테스트 컬렉션을 구축하고(관계유무 파악 및 관계분류 식별을 검사할 수 있는 1,707건의 문장 규모) 결과를 분석한다. 제안된 방법론은 정형화되고 시간이 많이 소요되는 문서분석 작업을 처리과정별로 자동화함으로써 구축에 들어가는 비용을 최소화할 수 있고, 시스템의 알고리즘을 기반으로 동작하기 때문에 구축자의 성향에 따른 편차를 줄이고 일관된 결과물을 얻을 수 있다. 또한 문헌 집합(과학기술 전 분야에 걸친 30,858,830건의 학술 데이터베이스) 및 용어 사전(16개 분야 253,603건 규모의 전문용어) 선정 시 특정 분야에 편중되지 않도록 노력함으로써 균형 잡히고 객관화된 테스트 컬렉션을 생성할 수 있다.

투표 기반 서술형 주관식 답안 자동 채점 모델의 설계 및 구현 (Design and Implementation of an Automatic Scoring Model Using a Voting Method for Descriptive Answers)

  • 허정만;박소영
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권8호
    • /
    • pp.17-25
    • /
    • 2013
  • 본 논문에서는 투표기법을 이용하여 서술형 주관식 문제에 대한 학습자 답안을 자동으로 채점하는 모델을 제안한다. 제안하는 방법은 모델 구축 비용을 줄이기 위해서, 문제 유형별로 세분화하여 서술형 주관식 답안 자동 채점 모델을 따로 구축하지 않는다. 제안하는 방법은 서술형 주관식 답안 자동 채점에 유용한 자질을 추출하기 위해서, 모범 답안과 학습자 답안을 비교한 결과를 바탕으로 다양한 자질을 추출한다. 제안하는 방법은 답안 채점 결과의 신뢰성을 높이기 위해서, 각 학습자 답안을 여러 기계학습 기반 분류기를 이용하여 채점하고, 각 채점 결과를 투표하여 만장일치로 선택한 채점 결과를 최종 채점 결과로 결정한다. 실험결과 기계학습 기반 분류기 C4.5만 사용한 채점 결과는 정확률이 83.00%인데 반해, 기계학습 기반 분류기 C4.5, ME, SVM에서 만장일치로 선택한 채점 결과는 정확률이 90.57%까지 개선되었다.

KOMPSAT-2 화상기반의 중분류 토지피복도에 대한 정확도 평가 (Accuracy Assessment for Intermediate-Classified Land Cover Map Based on KOMPSAT-2 Imagery)

  • 김천;홍성후
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2009년도 춘계학술대회 논문집
    • /
    • pp.22-25
    • /
    • 2009
  • 본 논문은 기 구축된 환경부의 중분류 토지피복도를 올해 KOMPSAT-2 화상으로 갱신하기 위한 예비연구에서 분류결과의 정확도 평가를 중점적으로 나타낸다. KOMPSAT-2 화상기반의 중분류 토지피복도는 객체지향의 분류기법을 이용하였고, 경계선 수정의 경우 반자동 기법에 의해 제작되었다. 계통표집과 임의표집에 의한 Kappa 분석에서 계통 표집의 KHAT값은 0.81, 임의표집의 KHAT값은 0.89를 각각 가지므로 거의 완벽의 일치성을 표시한다. 따라서 전술한 지도화 방법을 통해 제작된 KOMPSAT-2 화상의 중분류 토지피복도는 이용자에게 토지피복정보의 신뢰성도 함께 제공한다.

  • PDF

반자동 실내 3D 공간 구축을 이용한 사람 크기 예측 (Human Size Estimation via Semi-automatic Indoor 3D Space Layout)

  • 길종인;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 추계학술대회
    • /
    • pp.45-46
    • /
    • 2015
  • 사람 검출 시스템은 카메라의 위치 및 각도 등에 큰 영향을 받는다. 이로 인해 획득한 2D 영상에서 사람은 위치에 따라 각기 다른 크기를 갖는 형태로 나타난다. 이러한 요인들은 사람 검출 시스템의 실시간 구현을 어렵게 만드는 요인이 된다. 본 논문에서는 실내 공간의 구조를 깊이맵으로 구성하여, 이로부터 3D 공간을 구성한다. 3D 공간에서는 어느 위치에서든지 사람의 크기가 일관되므로 이를 2D 영상으로 투영하게 되면 2D 영상의 좌표에 따른 정확한 사람의 크기를 추정할 수 있다. 실험 결과로부터 제안 방법의 타당성을 입증하였다.

  • PDF

의미관계 정보를 이용한 약품 온톨로지의 구축과 활용 (Medicine Ontology Building based on Semantic Relation and Its Application)

  • 임수연;박성배;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권5호
    • /
    • pp.428-437
    • /
    • 2005
  • 온톨로지는 주어진 응용 도메인의 특성을 나타내는 관련 개념들의 집합과 정의, 그리고 그들간의 관계로 이루어진다. 본 논문에서는 온톨로지를 구축하고 갱신할 때의 시간과 비용을 줄이기 위하여 텍스트의 분석결과를 이용한 도메인 온톨로지의 반자동 구축방안을 제안한다. 이를 위하여 관련 문서들 내에 출현한 전문용어들의 처리방안을 제시하고, 추출한 개념들과 그들간의 관계를 온톨로지의 구축에 활용한다. 실험 도메인은 약품분야로 정하였으며, 구축한 온톨로지는 문서의 검색에 활용하였다. 온톨로지 내의 계층관계들이 문서검색에 효용이 있음을 보이기 위하여 일반적인 키워드기반 문서검색과 온톨로지 내의 관련 정보들을 연관피드백에 이용한 온톨로지기반 문서검색을 비교한 결과, 후자의 경우 정확률이 $4.97\%$, 재현율이 $0.78\%$ 향상됨을 알 수 있었다.

기계학습을 이용한 택배 고객의 소리 분류 (Classification of V.O.C in The Door-to-Door Delivery Service Using Machine Learning Techniques)

  • 홍성윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.329-332
    • /
    • 2012
  • 국내 택배시장 규모는 매출 3조원 이상, 물량 13 억 상자 이상을 처리하고 있다. 2000년 6천억원에서 불과 10년 사이에 500% 이상 확대되었다. 그에 반해 소비자들의 불만 역시 증가하였다. 따라서 현재의 수작업 VOC 분류 방식으로는 적정한 대응에 한계가 있을 수 밖에 없다. 이 논문에서는 효율적인 택배불만 처리를 위해서 불만의 종류와 정도를 기계학습을 이용하여 자동분류 하는 과정 및 결과를 기술한다. 약 93,000건의 VOC(voice of customer)를 대상으로 학습 데이터를 구축하고 여러 자질 선택 기법을 비교하였으며, 기존의 다양한 문서 자동 분류 방법들을 적용해 보았다. 실험결과 지지벡터기계가 가장 좋은 성능을 보였고, 각각의 F-measure 값은 불만의 정도는 83.1%, 불만의 종류는 75.9% 로 측정되었다.

도심형 에너지 자립 스마트팜 서비스 모델 설계 및 구축 (Design and Construction of Urban-type Energy Self-Supporting Smart-Farm Service Model)

  • 김관형
    • 한국정보통신학회논문지
    • /
    • 제23권10호
    • /
    • pp.1305-1310
    • /
    • 2019
  • 현대의 농업은 자원위주의 농업에서 과학기술 위주의 농업으로 변하고 있다. 과학기술이 융합된 농업은 새로운 신성장 동력으로 인식하고 있으며, 지능적인 스마트팜을 구축하기 위하여 정부 및 지방자치단체, 연구소, 산업계가 협력하여 스마트팜에 필요한 각종 장치를 개발하여 보급하고 있다. 최근에는 클라우드 플랫폼을 구축하여 보다 지능적인 농업환경을 구축하는 연구가 진행되고 있다. 본 논문에서는 도시의 건물 옥상을 활용하여 여가시간의 활용과 농업활동을 체험할 수 있는 도심형 에너지 자립 스마트팜 구축방안을 제시한다. 또한, IT 기술을 활용하여 스마트팜의 다양한 데이터를 원격지 서버에서 데이터를 관리하고 스마트팜 내부 환경을 제어할 수 있는 HMI 모듈을 개발하여 자동 또는 반자동으로 스마트팜을 관리하도록 한다. 서비스 모델은 모바일 기반으로 스마트팜의 내부 환경을 관리할 수 있는 모델을 제시한다.

개선된 스네이크 모텔에 기반한 반자동 건물 영역 추출 (Semi-automatic Building Area Extraction based on Improved Snake Model)

  • 박현주;권오봉
    • 전자공학회논문지CI
    • /
    • 제48권1호
    • /
    • pp.1-7
    • /
    • 2011
  • 3차원 지도(3D Map)를 구축하기 위해서는 지형정보와 지도상에서 건물 영역 및 건물 형상 정보가 필요하다. 이를 위해 본 논문에서는 개선된 스네이크(Snake) 알고리즘으로 건물 영역을 반자동으로 추출하는 방법을 제안한다. 본 방법은 전처리, 제어점의 초기화, 개선된 스네이크 알고리즘 적용 세 단계로 구성한다. 첫 번째 단계에서는 위생영상을 그레이 영상으로 변환 후 근사 에지를 추출하여 그레이 영상과 합성한다. 두 번째 단계에서는 사용자가 건물의 중심점을 설정한 후 원형 또는 사각형 모양의 초기 제어점을 계산하여 설정한다. 세번째 단계에서는 개선된 스네이크 알고리즘을 적용하여 건물영역을 추출한다. 이러한 과정에서 스네이크 에너지 계산식의 한 항을 새로운 방법으로 설정하여 건물영역 추출용으로 특화하였다. 그리고 스카이 뷰의 위성영상을 이용하여 제안된 방법을 건물영역 매칭율을 평가하였는데 75%의 매칭율을 보였다.