• Title/Summary/Keyword: 단어 검색

Search Result 558, Processing Time 0.025 seconds

A study on the Stochastic Model for Sentence Speech Understanding (문장음성 이해를 위한 확률모델에 관한 연구)

  • Roh, Yong-Wan;Hong, Kwang-Seok
    • The KIPS Transactions:PartB
    • /
    • v.10B no.7
    • /
    • pp.829-836
    • /
    • 2003
  • In this paper, we propose a stochastic model for sentence speech understanding using dictionary and thesaurus. The proposed model extracts words from an input speech or text into a sentence. A computer is sellected category of dictionary database compared the word extracting from the input sentence calculating a probability value to the compare results from stochastic model. At this time, computer read out upper dictionary information from the upper dictionary searching and extracting word compared input sentence caluclating value to the compare results from stochastic model. We compare adding the first and second probability value from the dictionary searching and the upper dictionary searching with threshold probability that we measure the sentence understanding rate. We evaluated the performance of the sentence speech understanding system by applying twenty questions game. As the experiment results, we got sentence speech understanding accuracy of 79.8%. In this case, probability ($\alpha$) of high level word is 0.9 and threshold probability ($\beta$) is 0.38.

An Experimental Field Trial of Stock Information Retrieval System Based on Speech Recognition (음성인식기술을 이용한 증권정보 안내 시스템의 실험적 실용시험)

  • 도삼주
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.241-244
    • /
    • 1994
  • 이 논문은 대어휘, 화자독립 음성인식 시스템인 KT-STOCK과 이 시스템에 대한 전화망을 통한 실험적 실용시험에 대해 기술하였다. KT-STOCK은 현재 주식시장에 상장된 712개 회사의 현재주가를 음성을 이용하여 검색할 수 있는 시스템이다. 이 시스템은 hidden markov model 기술에 기반을 둔 고립단어 인식 시스템이며 유사음소를 기본 인식단위로 사용한다. KT-STOCK은 1994년 6월 24일부터 실험적 실용시험 중에 있다. 중간 결과에 따르면 모의 실험 결과는 실제 환경에서의 시험과 차이가 있는 거승로 나타났다. 실제 환경에서 이 시스템의 인식률은 현재 61.9%이다.

  • PDF

Information Filtering for successful e-business education (성공적인 기업교육을 위한 Information Filtering)

  • 문남미;이수경
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.807-813
    • /
    • 2001
  • 본 논문에서는 기업교육에 있어서 e-Learning을 효과적으로 실현하기 위해 Information Filtering을 제안하고자 한다. 사용자 profile에 기반하여 지식 경영상 시스템을 기업교육에 도입함으로써 정보 검색 시 term space에서 모든 단어를 vector로 나타내어, 사용자 profile과 비교 측정하여 다음 유사한 측정을 통해서 원하는 정보 문서를 사용자에게 제공한다. Information Filtering의 도입으로 사용자의 흥미 변화에 맞춰 다이나믹하게 공급되는 학습 문서속에서 기업을 위한 e-Learning으로 경영성과를 높이는 하나의 전력을 제시한다.

  • PDF

Application of a Naive Bayes Classifier for Topic Word Sense Disambiguation (주제어의 중의성 해소를 위한 Naive Bayes 분류기 적용에 관한 연구)

  • 유현숙;정영미
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2000.08a
    • /
    • pp.71-74
    • /
    • 2000
  • 단어의 의미 중의성을 해소하는 것은 자연언어처리의 중요한 문제 중의 하나이다. 특히 문서의 주제어가 중의성을 가질 때, 이 문서는 부적합한 범주에 속하게 되어 정보검색시 잡음을 일으키는 원인이 되기도 한다. 그러므로, 본 논문에서는 문서를 대표하는 주재어의 의미 중의성을 해소하기 위해 주변 문맥자질을 고려하는 방법을 모색한다 이를 위해 자연언어처리의 통계적 방법으로 문서 범주화에 많이 사용되는 Naive Bayes 분류기를 중의성 해소에 적용하고, 그 결과 얻어진 중의성 해소 성능을 평가한다.

  • PDF

Text Clustering Algorithm Based on Ontology Concepts Combination (온톨로지 개념 합병 기반 문서 군집화 기법)

  • Guan, XiangDong;Kim, Woosaeng
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2012.10a
    • /
    • pp.722-724
    • /
    • 2012
  • 문서 군집화를 통하여 문서를 효율적으로 조직, 관리, 검색 할 수 있다. 일반적으로 문서 군집화는 많은 단어와 개념들을 포함하고 있기 때문에 차원이 큰 벡터 공간 모델에서 군집화를 수행한다. 본 논문에서 문서 집합에 대응하는 온톨로지를 이용하여 문서 벡터 공간의 차원을 줄여 효율적으로 군집화하는 방법을 제안하고, 실험을 통하여 기존 방법보다 우수함을 보인다.

  • PDF

Automatic Text Summarization Using Thesaurus (시소러스를 이용한 문서 자동 요약)

  • 이창범;박혁로
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.352-354
    • /
    • 2001
  • 문서 자동요약은 입력된 문서에 대해 컴퓨터가 자동으로 요약을 생성하는 과정을 의미한다. 즉, 컴퓨터가 문서의 기본적인 내용을 유지하면서 문서의 복잡도 즉 문서의 길이를 줄이는 작업이다. 효율적인 정보 접근을 제공함과 동시에 정보 과적재를 해결하기 하기 위한 하나의 방법으로 문서 자동요약에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 의미기반 정보검색용 시소러스(thesaurus)를 이용한 문서 자동요약을 제안한다. 제안한 방법에서는 단어간의 연관 관계 즉, 동의어, 유의어, 상위어, 하위어 관계를 문서 요약에 이용한다. 크게 연관 사슬 형성 단계, 중심 문장 추출 단계, 요약 생성 단계의 새단계로 나누어 요약을 생성한다. 수동 요약된 신문기사를 대상으로 평가한 결과 평균 66%가 일치하였다.

  • PDF

호르몬과 당뇨병 - 성장호르몬과 당뇨병

  • Hong, Eun-Gyeong
    • The Monthly Diabetes
    • /
    • s.287
    • /
    • pp.10-14
    • /
    • 2013
  • 인터넷을 열어 무심코 '성장호르몬과 당뇨병'이란 단어를 검색해 보면 주로 '성장호르몬이 당뇨병 위험도를 높인다'라는 식의 부정적인 자료들을 주로 접하게 된다. 하지만 내용들을 찬찬히 살펴보다 보면 '성장호르몬이 노인에서 삶의 질을 증진시키고 노화를 방지하는 치료제로 사용된다'는 자료들도 간간히 찾아볼 수 있는데 우리는 이 대목에서 성장호르몬이 좋다는 것인지 아니면 나쁘니 절대 사용하지 말라는 것인지 혼란이 생긴다. 따라서 본 원고에서는 성장호르몬의 역할과 임상 적용시 나타나는 장점 및 단점, 특히 당뇨병과의 연관성에 대해 살펴보고자 한다.

  • PDF

Representation of ambiguous word in Latent Semantic Analysis (LSA모형에서 다의어 의미의 표상)

  • 이태헌;김청택
    • Korean Journal of Cognitive Science
    • /
    • v.15 no.2
    • /
    • pp.23-31
    • /
    • 2004
  • Latent Semantic Analysis (LSA Landauer & Dumais, 1997) is a technique to represent the meanings of words using co-occurrence information of words appearing in he same context, which is usually a sentence or a document. In LSA, a word is represented as a point in multidimensional space where each axis represents a context, and a word's meaning is determined by its frequency in each context. The space is reduced by singular value decomposition (SVD). The present study elaborates upon LSA for use of representation of ambiguous words. The proposed LSA applies rotation of axes in the document space which makes possible to interpret the meaning of un. A simulation study was conducted to illustrate the performance of LSA in representation of ambiguous words. In the simulation, first, the texts which contain an ambiguous word were extracted and LSA with rotation was performed. By comparing loading matrix, we categorized the texts according to meanings. The first meaning of an ambiguous wold was represented by LSA with the matrix excluding the vectors for the other meaning. The other meanings were also represented in the same way. The simulation showed that this way of representation of an ambiguous word can identify the meanings of the word. This result suggest that LSA with axis rotation can be applied to representation of ambiguous words. We discussed that the use of rotation makes it possible to represent multiple meanings of ambiguous words, and this technique can be applied in the area of web searching.

  • PDF

IT 업체정보검색시스템에서 동의어 처리 기법

  • 강옥선;이현철;조완섭
    • Proceedings of the Korea Society of Information Technology Applications Conference
    • /
    • 2001.05a
    • /
    • pp.105-106
    • /
    • 2001
  • 일반적인 정보 검색은 색인어를 통해 이루어지는데 이런 경우 사용자는 정보를 검색하기 위해 데이터베이스에 저장된 정보들이 가지고 있는 색인어를 정확하게 입력해야 한다. 그러나 일반 사용자가 색인어를 정확하게 입력하기는 어렵고, 특히 찾고자 하는 분야가 전문 분야에서 사용되는 용어일 때는 더욱 그러하다. 이럴 때 시소러스와 같은 지식구조를 이용해서 색인어를 탐색하여 검색의 효율을 높일 수 있다. 최근 들어 정보기술 분야의 연구가 활발함에 따라 정보자로의 생산이 급격히 증가하고 이를 관련 주제 분야의 연구정보로 활용하는 경우가 증가하고 있다. 따라서 IT 분야의 정보를 관리할 수 있는 시스템의 개발이 시급하다. 또한 IT 분야와 같은 전문분야일 때 검색 시스템에서 사용할 용어의 관리에 대한 연구의 필요성이 증가하고 있다. 본 논문에서는 IT분야의 정보를 검색할 수 있는 IT 업체정보검색시스템에서 정보 검색시에 생기는 용어간의 불일치 문제를 해결하고, 각 용어들간의 계층 관계를 나타내어 정보 검색시 검색어의 확장을 도울 수 있는 용어 관리 시스템의 구조를 제안하고 그에 대한 검색 알고리즘을 제시한다. 제안된 구조는 사용자의 검색어에 대한 동의어 관계나 상위어, 하위어 등의 계층 관계를 파악하여 검색의 범위에 추가함으로써 검색 효율을 높일 수 있다. 또한 새로운 용어의 생성이나 삭제와 같은 연산이 발생했을 때 시스템을 동적으로 확장할 수 있도록 구현하였다. 제안된 시스템은 단어간의 계층 구조를 효율적으로 검색하기 위하여 객체-관계형 데이터베이스를 사용하였다. 또한 메모리 상주 DBMS를 사용하여 많은 사용자들이 동시에 접근하는 환경에서도 빠른 검색 성능을 유지할 수 있도록 하였다. 제시된 방법은 정보기술 분야뿐만 아니라 다른 전문용어 분야의 연구로도 그 범위를 확장 할 수 있다.자기자본비용의 조합인 기회자본비용으로 할인함으로써 현재의 기업가치를 구할 수 있기 때문이다. 이처럼 기업이 영업활동이나 투자활동을 통해 현금을 창출하고 소비하는 경향은 해당 비즈니스 모델의 성격을 규정하는 자료도로 이용될 수 있다. 또한 최근 인터넷기업들의 부도가 발생하고 있는데, 기업의 부실원인이 어떤 것이든 사회전체의 생산력의 감소, 실업의 증가, 채권자 및 주주의 부의 감소, 심리적 불안으로 인한 경제활동의 위축, 기업 노하우의 소멸, 대외적 신용도의 하락 등과 같은 사회적·경제적 파급효과는 대단히 크다. 이상과 같은 기업부실의 효과를 고려할 때 부실기업을 미리 예측하는 일종의 조기경보장치를 갖는다는 것은 중요한 일이다. 현금흐름정보를 이용하여 기업의 부실을 예측하면 기업의 부실징후를 파악하는데 그치지 않고 부실의 원인을 파악하고 이에 대한 대응 전략을 수립하며 그 결과를 측정하는데 활용될 수도 있다. 따라서 본 연구에서는 기업의 부도예측 정보 중 현금흐름정보를 통하여 '인터넷기업의 미래 현금흐름측정, 부도예측신호효과, 부실원인파악, 비즈니스 모델의 성격규정 등을 할 수 있는가'를 검증하려고 한다. 협력체계 확립, ${\circled}3$ 전문인력 확보 및 인력구성 조정, 그리고 ${\circled}4$ 방문보건사업의 강화 등이다., 대사(代謝)와 관계(關係)있음을 시사(示唆)해 주고 있다.ble nutrient (TDN) was highest in booting stage (59.7%); however no significant difference was found among other stages. The concentrations of Ca and P were not different among mature stages. Accordi

  • PDF

Learning User Preferences in Web Information Retrieval (웹 정보 검색 환경에서의 사용자 기호 학습)

  • 서영우;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.72-74
    • /
    • 1999
  • 본 논문은 웹 기반의 정보 여과 시스템인 WAIR을 이용하여 사용자의 기호를 학습하는 방법을 설명한다. 제시된 방법은 여과된 문서들에 대한 사용자의 반응을 관찰하여 각 개인 사용자의 프로파일을 학습한다. 사용자의 기호를 가장 잘 표현하는 단어들을 찾는데 강화 학습을 사용하였다. 기존의 방법은 사용자의 명시적인 적합성 평가(relevance feedback)를 이용하여 검색 또는 여과 성능을 향상시킨 반면 제시된 방법은 사용자의 기호를 묵시적 적합성 평가를 통해 학습한다. 여과된 문서에 대한 사용자의 행동을 통해 사용자의 명시적 평가를 추측하는 것이다. 약 7,000 여개의 HTML 문서에 대해 7명의 사용자가 약 4주 동안 실제 웹을 대상으로 웹 문서 여과 실험을 실시하였다. 제시된 방법은 기존의 적합성 평가를 이용한 정보 여과 방법보다 각 개인에게 보다 적절한 정보를 제시하였다.

  • PDF