• 제목/요약/키워드: 해답 추출

검색결과 18건 처리시간 0.026초

개념 기반 질의-응답 시스템에서 개념 규칙을 이용한 해답 추출 (Answer Extraction using Concept Rules in Concept-based Question-Answering System)

  • 강유환;안영민;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.184-188
    • /
    • 2005
  • 본 논문에서는 개념 기반 질의-응답 시스템에서 개념 규칙을 이용하여 해답을 추출하는 방법에 대하여 기술한다. 개념 기반 질의-응답 시스템은 질의문의 각 유형별 개념 정보를 이용하여 질의문을 분석하고 해답을 추출하는 시스템이다. 질의문의 키워드들을 개념에 따라 분류하고, 질의 유형별로 공통적으로 나타나는 개념들을 이용하여 개념 프레임을 정의한다. 또한, 개념 정보와 해답이 들어 있는 문장과 문단에서 공통적으로 나타나는 구문 특성을 이용하여 해답 추출을 위한 규칙을 작성한다. 개념 규칙은 형태 정보와 구문 정보를 포함하며, 질의 유형별로 따로 작성한다. 작성된 규칙을 이용하여 문서로부터 해답이 들어 있는 문장과 문단을 추출한 후 질의문의 해답 유형에 해당하는 개체를 해답 후보로 제시한다. 실험 결과 개념 규칙을 이용한 해답 추출의 정확도가 매우 높게 나타났다.

  • PDF

정확한 해답 추출을 위한 개념 기반의 질의 분석 (Concept-based Question Analysis for Accurate Answer Extraction)

  • 신승은;강유환;안영민;박희근;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제7권1호
    • /
    • pp.10-20
    • /
    • 2007
  • 본 논문에서는 정확한 해답 추출을 위해 키워드보다 중요한 역할을 하는 개념을 분석하는 개념 기반 질의 분석에 대해 기술한다 해답 유형이 같은 질의들에서 나타나는 개념은 유사하기 때문에 이러한 개념들을 잘 정의하여 이용할 경우, 해답을 포함하는 다양한 형태의 구문으로부터 보다 정확한 해답을 추출할 수 있다는 것이 본 논문의 주요 아이디어이다. 즉, 해답을 포함하는 문서와 그 문서 내에 있는 해답을 좀더 정확하게 추출하기 위해 질문에 있는 각 단어나 구절들의 구문 및 의미 역할을 파악하고자 하는 것이다. 이를 위해, 정답 유형별로 그 유형의 질문에서 공통으로 나타나는 주요 개념들로 구성된 개념 프레임을 정의하고, 사용자 질의를 분석하여 개념 프레임을 채우는 과정으로 질의 분석을 수행한다. 실험 결과 본 논문에서 제안한 개념 기반 방식이 기존의 질의분석 기법에 비해 높은 정답 추출 성능을 보여주었다. 본 논문에서 제안한 개념 기반 접근 방법은 언어에 관계없이 적용 가능한 모델이며, 또한 기존 방식과 함께 사용할 수 있는 장점도 있다.

새로운 데이터 탐색 기술과 기법의 활용

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 1호통권56호
    • /
    • pp.84-91
    • /
    • 1998
  • 데이터베이스에 저장되는 데이터의 양은 급격히 증가되어 왔고, 사용자들은 필요한 데이터를 찾기 위해 서말이 넘는 땀방울을 흘려야 했다. 그러나 새로운 탐색 기술들이 이러한 문제에 대한 해답을 제시하고 있다. 자연언어 질의, 역-인덱싱, 인터넷 탐색 엔진, 데이터베이스 텍스트 탐색 같은 기술들은 사용자의 오랜 숙원을 해결해줄 기대주로 관심을 모으고 있다. 자유 형식 정보 소스들로부터 정보의 특별한 탐색과 추출을 수행하기 위해 사용 가능한 보다 새로운 탐색 기술들과 기법들을 소개한다.

  • PDF

개념 기반 질의-응답 시스템에서의 정답 추출 (Answer Extraction of Concept based Question-Answering System)

  • 안영민;오수현;강유환;서영훈
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 춘계 종합학술대회 논문집
    • /
    • pp.448-451
    • /
    • 2005
  • 본 논문에서는 개념 기반 질의-응답 시스템에서의 정답 추출 방법에 대하여 기술한다. 개념 기반 질의-응답 시스템은 개념 정보를 이용하여 해답을 추출하는 시스템을 말하며, 질의분석을 통해 분류되고 추출된 개념 그에 따른 정답 추출 규칙을 이용하여 정답을 추출하는 방법과 시스템에 대하여 연구하였다. 질의에 대한 정답이 들어 있는 문서들을 분석하여 정답 추출 규칙을 작성한다. 규칙은 개념과 구문정보를 포함하고 있으며 작성된 규칙을 통하여 문서로부터 정답후보를 생성하고 정답을 선택한다.

  • PDF

어휘 의미 패턴(Lexico-Semantic Pattern)과 온톨로지를 이용한 정보검색기의 설계 및 구현 (The Design and Implementation of an Information Retrieval System Using Lexico-Semantic Pattern and Ontology)

  • 김병우;고영중
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.957-962
    • /
    • 2007
  • 본 논문에서 제안하는 정보 검색기는 일반적인 불리언(Boolean) 질의를 통해서 정보를 검색하는 것이 아니라, 문장으로 입력된 질의형태의 패턴을 분석하여 그에 맞는 정보를 직접 제공하는 것에 목적을 둔다. 이를 위해 어휘 의미 패턴(Lexical Semantic Pattern)과 온톨로지(Ontology) 기술이 정보검색기 개발에 적용되었다. 제안된 시스템에서는 다양한 형태로 표현된 문장 질의를 어휘 의미 패턴을 사용해서 문장의 질의 패턴을 추출하고 사용자 질의를 하나의 온톨로지(Ontology) 추론 질의와 매칭함으로써 질의에 대한 정확한 해답을 추출할 수 있다. 또한, 자연어 문장 입력에 대한 검색 질의 생성기를 구축하고 온톨로지로 표현된 지식을 사용하여 정보검색기 질의를 자동으로 확장함으로써 더욱 정확한 정보 검색 결과를 만들어 낼 수 있다.

  • PDF

Scratch-Pad 메모리를 위한 동적 코드 배치 기법 (Dynamic Code Placement Techniques for Scratch-Pad Memory)

  • 김지훈;장춘기;이재진;민상렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
    • /
    • pp.784-786
    • /
    • 2005
  • SPM (Scratch-Pad Memory)을 위한 코드 배치 기법과 demand paging기법을 Post pass optimizer를 사용하여 구현한다. 코드 배치 문제는 ILP (Integer Linear Programming) 문제로 변환하여 해결한다. 최적 화기는 ILP 해답의 질을 높이기 위해 응용 프로그램의 프로파일 정보를 사용하고, 코드로부터 natural loop을 추출한다. 또한 SPM을 사용하여 demand paging을 할수 있도록 추가 코드를 삽입한다. 이 기법을 사용해 6개의 내장형 응용 프로그램을 실험하였고, 프로그램 크기의 $20\%$에 해당하는 SPM에 대해 전력 소모는 $75.9\%$로 감소하였고 성능은 $54.5\%$ 증가하였다.

  • PDF

답토양(畓土壤)의 인산완형액(燐酸緩衡液)에 의(依)한 지력질소(地力窒素) 평가(評價)에 관(關)한 연구(硏究) (Evaluation of Potentially Available Soil Nitrogen by Using Buffer Phosphote Solution of pH7)

  • 안상배
    • 한국토양비료학회지
    • /
    • 제19권4호
    • /
    • pp.327-332
    • /
    • 1986
  • pH7 인산완형용액(燐酸緩衡容液)으로 추출(抽出)한 지력질소(地力窒素)를 몇개의 토양(土壤)에서 비교평가(比較評價)하기 위(爲)하여 퇴비(堆肥), 석회(石灰) 및 규회석(珪灰石)을 32년간(年間) 장기연용(長期連用)한 사질답(砂質畓), 이앙전(移秧前) 70일간(日間) 담수(湛水) 및 무담수(無湛水)한 사질답(砂質畓), 다수확(多收穫)을 낸 보통답(普通畓) 및 인접(隣接)한 농가(農家)의 보통답(普通畓)을 실내조건(室內條件)으로 지력질소평가(地力窒素評價), 지력질소소장(地力窒素消長), 지력질소(地力窒素)와 추출질소(抽出窒素)와의 관계(關係) 및 답유형별(畓類型別) 지력질소(地力窒素)에 의(依)한 질소시비량결정(窒素施肥量決定) 등(等)을 분석검토(分析檢討)하였던 바 다음과 같은 결과(結果)를 얻었다. 1. 동일비료(同一肥料)를 연용(連用)할 사질답(砂質畓)에서 처리별(處理別) 인산완형액(燐酸緩衡液)에서 추출(抽出)된 유기태질소(有機態窒素)는 3요소(要素)+퇴비구(堆肥區), 3요소구(要素區), 3요소(要素)+퇴비(堆肥)+석회(石灰)+규회석구(珪灰石區), 3요소(要素)+석회(石灰)+규회석구(珪灰石區), 3요소(要素)+규회석(珪灰石), 무비구(無肥區) 순위(順位)로 많았다. 2. 3요소(要素) 및 3요소(要素)+퇴비구(堆肥區) 처리(處理)에서 생육시기별(生育時期別)로 지력질소(地力窒素) 소장(消長)을 보면 처리(處理)에 관계(關係)없이 시험전(試驗前)에 비(比)해 유수형성기(幼穗形成期), 출수기(出穗期)로 생육(生育)이 경과(經過)됨에 따라 유기태질소함량(有機態窒素含量)은 감소(減少)되는 경향(傾向)이었다. 3. 다수확(多收穫)을 낸 보통답(普通畓)과 인근보통답(隣近普通畓)에서 비교(比較)할때 T-N, Org-N, $NH_4-N$ 성분(成分)은 다수확답(多收穫畓), $NO_3-N$는 인근답(隣近畓)에서 많았다. 특(特)히 4주간(週間) 담수항온후(湛水恒溫後) 생성(生成)된 $NH_4-N$와 추출(抽出)된 전질소(全窒素)N와는 1%의 유의성(有意性)이 있는 정(正)의 관계(關係)가 있었다. 4. 담수(湛水) 및 무담수(無湛水)한 사질답(砂質畓)에서 토양유기태질소(土壤有機態窒素)는 무담수처리구(無湛水處理區)에서 많았으나 도체내(稻體內) 질소흡수량(窒素吸收量)은 반대(反對)로 담수구(湛水區)에서 많았다. 5. 답유형별(畓類型別) 토양(土壤)의 추출전질소(抽出全窒素)는 보통답(普通畓), 사질답(砂質畓), 미숙답(未熟畓), 염해답(鹽害畓) 순(順)으로 많았으며 지력질소(地力窒素)에 의(依)한 추정질소시비량(推定窒素施肥量)은 반대(反對)로 염해답(鹽害畓), 미숙답(未熟畓), 사질답(砂質畓), 보통답(普通畓) 순위(順位)였다.

  • PDF

인공신경망을 이용한 강우예측기법에 관한 연구 (Study on Precipitation Prediction Technique using Artificial Neural Network)

  • 여운기;지홍기;이순탁
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1412-1416
    • /
    • 2009
  • 최근의 극심한 기상이변으로 인하여 발생되는 이상호우의 예측에 관한 사항은 치수 이수는 물론 방재의 측면에서도 역시 매우 중요한 관심사로 부각되고 있다. 강우를 예측하기 위해 많은 방법들이 사용되고 있으나 강우의 메커니즘은 매우 복잡하여 수문순환과정에서 가장 예측하기 힘든 요소이며, 추계학적 예측모형이나 확정론적 예측모형 모두에 있어 상당한 불확실성을 내포하고 있다. 기상예측모형 등을 이용하여 강우예측에 대한 정도를 높여가고는 있으나 많은 수문학적 모형에서 요구하는 시공간적으로 정도가 높은 강우를 예측하기에는 힘들다. 인공신경망은 과거자료의 입 출력 패턴에서 정보를 추출하여 지식으로 보유하고, 이를 근거로 새로운 상황에 대한 해답을 제시하도록 하는 인공지능분야의 학습기법으로 인간이 과거의 경험과 훈련으로 지식을 축적하듯이 시스템의 입 출력에 의하여 연결강도를 최적화함으로서 모형의 구조를 스스로 조직화하기 때문에 모형의 구조에 적합한 최적 매개변수를 추정할 수 있다. 따라서 정확한 예측이 어려운 강우사상을 과거의 자료로부터 신경망의 수학적 알고리즘을 통해 강우의 예측에 적용할 수 있을 것이다. 따라서 본 연구에서는 이러한 인공신경망의 기법 중 오류 역전파 알고리즘을 통하여 과거의 강우사상들을 입 출력 자료로 이용하여 인공신경망을 학습시켜 강우의 예측에 대한 정도를 높이도록 하였다.

  • PDF

일반적인 웹 검색 경로패턴 추출 알고리즘 (Algorithm for Extracting the General Web Search Path Pattern)

  • 장민석;하은미
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.771-773
    • /
    • 2005
  • 웹 환경에서 사용자들의 정보검색 패턴을 얻어내기 위해 흔히 로그 파일의 정보검색 패턴을 분석하는 기존 연구들이 있어 왔다. 이들에서 흔히 사용하는 방법은 경로 순회 패턴(path traversal patterns)에서 효율적으로 빈번 패턴(frequent patterns)을 찾아내는 알고리즘을 제안하는 것이다. 하지만 이들의 기존 연구의 가장 일반적인 문제점들 중의 하나는 일반적인 패턴 즉, 복잡한 형태 패턴(topological patterns)에 대한 적절한 해답을 찾아주지는 못한다는 것이다. 따라서 본 논문에서는 일반적인 패턴 유형을 정의하고 이들로부터 정보검색 패턴을 알아내는 효율적인 알고리즘을 제안하고자 한다.

  • PDF

퍼지 역평가법과 시나리오 분석을 통한 상하이 및 북중국과 우리나라 컨테이너항만의 경쟁력분석에 관한 연구 (The Analysis of Competitiveness in Container Ports of Shanghai and North China & Korea Using Inverse Relation of Fuzzy Evaluation and Scenario Analysis)

  • 류형근;이홍걸;여기태
    • 대한교통학회지
    • /
    • 제22권7호
    • /
    • pp.49-59
    • /
    • 2004
  • 상하이항을 비롯한 북중국 항만이 우리나라 항만을 위협하는 상황으로 전개됨에 따라, 현재 이러한 항만들 사이에서 부산항 및 광향항의 경쟁력을 도모하기 위한 많은 연구들이 수행되고 있다. 그러나, 이러한 연구들은 경쟁력을 도출하고, 그것을 평가하는 데 비중을 두고 있는 반면, 평가된 결과를 토대로 경쟁력 도모를 위한 Critical Point를 명확히 추출한 연구는 전무한 실정이다. 즉, 기존의 분석법이 단순히 평가결과를 도출하는 것에 국한된 나머지, 평가결과로부터 평가에 영향을 끼친 항목이 명확히 무엇인지, 평가우위를 차지하기 위해 어떠한 부분을 개선시켜야 하는 지에 대한 해답을 제시하지는 못했다. 결과적으로, 이와 같은 문제는 평가결과로부터 경쟁력에 영향을 미쳤던 핵심 요인을 추출하는 알고리즘이 마련되어 있지 않은 것에 기인한다. 본 연구는 이러한 점에 주목하고, 우리나라 및 상하이 북중국 주요 항만을 대상으로 기존연구의 항만경쟁력 평가결과로부터 퍼지 역관계법을 이용하여 주요 항만의 경쟁력 상승에 영향을 미치는 핵심요인을 추출하고, 간단한 시나리오 분석을 통해 몇 가지 중요한 시사점을 제안하는 것을 연구의 목적으로 한다. 연구결과 부산항은 현 시점에서 무엇보다 역량을 집중해야 할 항목으로 배후지 여건 즉 항만배후지역의 자유무역지대의 활성화가 가장 큰 관건으로 나타났다. 광양항은 주요화물발생지까지의 거리, 효율적인 배후연계 네트워크 등에 역점을 두어야 하는 것으로 나타났다.