• Title/Summary/Keyword: 용어추출

Search Result 365, Processing Time 0.022 seconds

Knowledge Structures in Knowledge Organization Research: 2000-2011 (정보조직 지식구조에 대한 연구 - 2000년~2011년 학술논문을 중심으로 -)

  • Park, Ok-Nam
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.22 no.3
    • /
    • pp.247-267
    • /
    • 2011
  • The purpose of this study is to investigate knowledge structure of knowledge organization research area in Korea. The study employed content analysis and network analysis to analyze degree centrality, betweenness, and eigenvector as well as frequency of words. It also analyzes research articles published during the period of 2000-2001. The study can be summarized that the network of keywords of knowledge organization researches is compact and complicated. Cataloging and classification play important roles in the network, and metadata and ontology becomes focal areas in knowledge organization. On the other hand, networks of authorships and authors are broad and fragmented. Collaboration is not active enough.

Developing a Test-Bed Toolkit for Scientific Document Analysis (기술 문헌 분석 테스트베드 툴킷 개발)

  • Choi, Sung-Pil;Song, Sa-Kwang;Jung, Han-Min
    • The Journal of the Korea Contents Association
    • /
    • v.12 no.8
    • /
    • pp.13-19
    • /
    • 2012
  • This paper introduces a test-bed toolkit for evaluating and enhancing text analysis engines which extract technological knowledge from articles, patents, reports and so forth. The toolkit consists of two test-beds for technical entity recognition and relation extraction engines, which are capable of identifying technical entities and predicting semantic relation types between the entities. With using the introduced toolkits, users and developers can efficiently perform the execution monitoring and error analysis of the technical text analysis engines.

Processing Detailed Description of Product Extracted from Web Using The Functional Hierarchy of Goods (상품의 기능 계층 구성도를 이용한 웹상에서 추출한 상품 상세 정보 처리)

  • Lee, Keun-Yong;Park, Ki-Seon;Lee, Yong-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.233-240
    • /
    • 2006
  • 인터넷 쇼핑몰을 이용하는 구매자의 상품 구매를 돕는 방법으로 가격 비교 서비스가 가장 많이 이용되고 있다. 가격비교 서비스는 구매자가 구매할 상품을 이피 결정했다고 가정하고 동일 상품을 판매하는 사이트들의 가격과 서비스 정보를 비교하여 구매자치 구매 결정에 많은 도움을 주고 있다. 가격 비교 서비스는 구매자에게 인터넷 쇼핑몰 사이트에서 판매되는 수많은 상품 중 어떤 상품을 선택할 지에 대한 고민을 해결해 주지는 못하고 있다. 구매자가 구매할 상품을 결정하지 못했을 때, 상품의 선택을 도울 수 있는 방법은 서로 다른 상품 모델에 대한 기능적 차이를 비교할 수 있도록 해주어야 한다. 상품에 대한 기능의 차이점은 상품의 상세 정보를 통해서 파악이 가능하다. 따라서 상품의 상세 정보를 구매자가 한눈에 파악할 수 있도록 제공하는 것은 상품을 선택하는데 매우 중요한 요소이다. 각 상품의 상세 정보는 구매자에게 해당 상품이 어떤 기능을 가지고 있는지 보기 쉽게 기술되어 있지만 다른 상품과는 기능을 설명하는 순서가 다르거나 사용한 용어 및 단위 표현에 같은 의미의 다른 표현 방식을 사용하기도 한다. 본 논문은 상품들의 기능적인 차이점을 파악하는 것을 도울 수 있도록 하기 위해서, 개별 상품에 대해서는 상품의 상세 정보가 보기 쉽게 기술되었다는 점을 이용하여 상품의 상세 정보로부터 상품의 정보를 추출한다. 추출된 정보는 상품을 구성하는 기능 계층 정보를 이용하여 각 상품들의 기능과 기능에 대한 설명을 일치시키는 방법을 제안한다.

  • PDF

Homography Estimation for View-invariant Gait Recognition (시점 불변 게이트 인식을 위한 호모그래피의 추정)

  • Na, Jin-Young;Kang, Sung-Suk;Jeong, Seung-Do;Choi, Byung-Uk
    • Annual Conference of KIPS
    • /
    • 2003.05a
    • /
    • pp.691-694
    • /
    • 2003
  • 게이트는 사람의 걷는 방법 혹은 그 특성을 나타내는 용어로써, 최근 컴퓨터 비젼 기술을 이용하여 개개인을 분별하기 위한 게이트 특징 정보를 추출하고자 하는 연구가 활발히 진행되고 있다. 그러나 영상을 기반으로 추출한 게이트 정보는 카메라의 시점에 종속적인 단점을 가지고 있다. 이러한 단점을 해결하기 위한 노력으로 3차원 정보를 획득하려는 연구가 진행되고 있으나 이는 카메라와 사람간의 거리, 카메라 파라미터 등 부가적인 정보를 필요로 한다. 본 논문에서는 영상내의 정보만을 이용하여, 카메라 시점에 종속적인 게이트 인식의 단점을 해결할 수 있는 방안을 제안한다. 먼저 실루엣 영상으로부터 걷는 방향을 찾아내고, 간단한 연산을 통해 평면 호모그래피를 추정한다. 추정된 호모그래피를 이용하여 측면 시점의 영상으로 재구성하면, 시점 변화에 비종속적인 게이트 정보를 추출할 수 있다. 본 논문에서 제안한 방법을 평가하기 위하여 실추엣 영상의 폭과 높이 변화를 비교하였다 실험을 통해 제안한 방법을 적용할 경우, 그렇지 않은 경우에 비하여 특징 변화가 적음을 확인하였고, 특히 보폭 통의 게이트 특징 정보가 일정한 값을 유지함을 볼 수 있었다.

  • PDF

Topic-based Multi-document Summarization Using Non-negative Matrix Factorization and K-means (비음수 행렬 분해와 K-means를 이용한 주제기반의 다중문서요약)

  • Park, Sun;Lee, Ju-Hong
    • Journal of KIISE:Software and Applications
    • /
    • v.35 no.4
    • /
    • pp.255-264
    • /
    • 2008
  • This paper proposes a novel method using K-means and Non-negative matrix factorization (NMF) for topic -based multi-document summarization. NMF decomposes weighted term by sentence matrix into two sparse non-negative matrices: semantic feature matrix and semantic variable matrix. Obtained semantic features are comprehensible intuitively. Weighted similarity between topic and semantic features can prevent meaningless sentences that are similar to a topic from being selected. K-means clustering removes noises from sentences so that biased semantics of documents are not reflected to summaries. Besides, coherence of document summaries can be enhanced by arranging selected sentences in the order of their ranks. The experimental results show that the proposed method achieves better performance than other methods.

A Generation System of English Pronunciation for the medical domain (의료분야를 위한 영어 발음열 생성 시스템)

  • Kim, A-Lum;Jeong, Kyung Seok;Park, Hyuk Ro
    • Annual Conference of KIPS
    • /
    • 2004.05a
    • /
    • pp.793-796
    • /
    • 2004
  • 본 논문은 의료분야의 음성 인식 시스템의 발음모델의 성능 향상에 필요한 올바른 영어 단어 발음열을 얻고자 한다. 본 시스템의 텍스트는 의료 전문 용어인 영어와 한글의 조합으로 되어있어, 한국어 G2P 성능뿐만 아니라 영어 G2P의 성능도 중요한 문제가 되고 있다. 또한 본 시스템의 의료 음성 데이터가 한국 화자로써, 표기열이 영어식 발음 폰셋으로 변환되면 효율적이지 못하다. 이를 위해, 영어 G2P의 결과를 한국 화자에 적합하게 변환해주는 방법론이 필요하게 된다. 따라서 본 논문에서 제안하는 방법은 음성 텍스트에서 영어만 추출한 후, 영어 G2P 프로그램(addttp, NIST)을 이용해 발음열을 구한다. 그리고 한국 화자의 실제 음성을 통해 얻은 정답 발음열을 구하여 서로 비교한다. 비교를 위해 각 발음열의 한 폰씩 정렬을 수행한 후, 삽입, 삭제, 대치 에러가 이러나는 쌍과 좌우 바이그램 정보를 추출한다. 마지막으로, 좌우 바이그램 정보에서 best1의 에러 패턴을 통해 모든 단어에 적용한다. 이 때, 최종적으로 실보다 득이 되는 에러패턴만을 추출, 적용한다. 실험에서는 26여개의 에러 패턴을 찾을 수 있어, 8%의 올바른 발음열을 추가적으로 얻는데 성공하였다.

  • PDF

A School-tailored High School Integrated Science Q&A Chatbot with Sentence-BERT: Development and One-Year Usage Analysis (인공지능 문장 분류 모델 Sentence-BERT 기반 학교 맞춤형 고등학교 통합과학 질문-답변 챗봇 -개발 및 1년간 사용 분석-)

  • Gyeongmo Min;Junehee Yoo
    • Journal of The Korean Association For Science Education
    • /
    • v.44 no.3
    • /
    • pp.231-248
    • /
    • 2024
  • This study developed a chatbot for first-year high school students, employing open-source software and the Korean Sentence-BERT model for AI-powered document classification. The chatbot utilizes the Sentence-BERT model to find the six most similar Q&A pairs to a student's query and presents them in a carousel format. The initial dataset, built from online resources, was refined and expanded based on student feedback and usability throughout over the operational period. By the end of the 2023 academic year, the chatbot integrated a total of 30,819 datasets and recorded 3,457 student interactions. Analysis revealed students' inclination to use the chatbot when prompted by teachers during classes and primarily during self-study sessions after school, with an average of 2.1 to 2.2 inquiries per session, mostly via mobile phones. Text mining identified student input terms encompassing not only science-related queries but also aspects of school life such as assessment scope. Topic modeling using BERTopic, based on Sentence-BERT, categorized 88% of student questions into 35 topics, shedding light on common student interests. A year-end survey confirmed the efficacy of the carousel format and the chatbot's role in addressing curiosities beyond integrated science learning objectives. This study underscores the importance of developing chatbots tailored for student use in public education and highlights their educational potential through long-term usage analysis.

A Study on The Reengineering Tool From conventional System into Design Pattern (기존 시스템에서 설계 패턴으로의 재공학 툴에 관한 연구)

  • Kim, Haeng-Kon;Cha, Jung-Eun
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.9
    • /
    • pp.2334-2344
    • /
    • 1998
  • Appliciltion systems focusing class units, as component abstraction based on source code, has insufficient benefit of independency and reuse of elements. Only few effects are acquired, because it is only inclined implementation. We need design pattern to represent not only the problem abstraction but also information and relationship between system elements for generic solutions of specific domain Also, it is essential to software reverse engineering to catch the correct system through examming the cxisting system and utilizing the acquired knowledges as reusable resource. Namely, software reverse engineering for extracting the design pattern is very important because it improves the understand ability for system analysis and design through extracting the design structure of object-oriented system, and provides rich and high leIel reusabilitv through grasping the standard idioms and relationships between components. In this paper, we defined the extraction algorithm for design patterns with standardized, packaged and quantitative measlIIul thruugh applying reyerse engineering into existing ubject Olicnted system. And we designed the reengineering toul including reverse engineering for autumatic extractiun of design patterns ami reuse fur retrieval. editing and rebuilding oi design patterns. Also we applied the algorithms into Java applications.

  • PDF

A Comparative Analysis of Content-based Music Retrieval Systems (내용기반 음악검색 시스템의 비교 분석)

  • Ro, Jung-Soon
    • Journal of the Korean Society for information Management
    • /
    • v.30 no.3
    • /
    • pp.23-48
    • /
    • 2013
  • This study compared and analyzed 15 CBMR (Content-based Music Retrieval) systems accessible on the web in terms of DB size and type, query type, access point, input and output type, and search functions, with reviewing features of music information and techniques used for transforming or transcribing of music sources, extracting and segmenting melodies, extracting and indexing features of music, and matching algorithms for CBMR systems. Application of text information retrieval techniques such as inverted indexing, N-gram indexing, Boolean search, truncation, keyword and phrase search, normalization, filtering, browsing, exact matching, similarity measure using edit distance, sorting, etc. to enhancing the CBMR; effort for increasing DB size and usability; and problems in extracting melodies, deleting stop notes in queries, and using solfege as pitch information were found as the results of analysis.

Analysis of Psychology Based on Network and Informatic Algorithm (네트워크 및 정보 알고리즘 기반 심리학 분석)

  • Kim, Yuree;An, Sammy;Kim, Hak Yong
    • The Journal of the Korea Contents Association
    • /
    • v.15 no.7
    • /
    • pp.567-577
    • /
    • 2015
  • In the period of spirit revolution, psychology for studying human mind is one of the important fields with humanities. To analyze for correct understanding of popularization of psychology, for future psychology research trends, and for correlation of the psychological sub-fields as a linker between natural and social sciences, we employed network technology and informatic algorithm to be more objective. By elucidating core key words from bipartate network that consists of terms and their explaining words in psychological glossary, we provide psychological contents for understanding psychology. As analyzing lots articles obtained from Korean Journal of Psychology and Annual Review of Psychology, it was possible to observe research trends of the psychological sub-fields. To analyze the correlation among sub-fields of the psychology, we extracted and compared title words of the articles that had published on Psychological Review over the past fifteen years. We also employed a pair-wise comparison matrix algorithm and then elucidated the correlation among sub-fields of the psychology. By this research, we expect to contribute not only providing information about popularization of psychology, analysis of research trends, and correlation among sub-fields of the psychology, but also providing convergent contents that conflate the psychology and the informatic technologies.