• Title/Summary/Keyword: 용어추출

Search Result 365, Processing Time 0.024 seconds

Confusion in the Meaning of Induction, Deduction, Hypothetical Deductive Method, and Abduction in Science Instruction Textbooks (과학교육론 교재에서 나타나는 귀납, 연역, 가설연역, 귀추의 의미 혼선)

  • Cheong, Yong Wook
    • Journal of Science Education
    • /
    • v.43 no.1
    • /
    • pp.79-93
    • /
    • 2019
  • There have been great concerns on induction, deduction, abduction, and hypothetical deductive method as scientific method and logic behind the method. However, as seen from the similar logic structure of abduction and hypothetical deductive method logic, distinction of those four terms could be unclear. This study investigates statements of science instruction textbooks concerning those terms to analyze their meaning as scientific method or in the context of inquiry. For this purpose, related statements are extracted from seven textbooks to investigate the definitions and examples of those terms and relation among these terms by focusing on coherence of usage of the terms and the possibility of clear distinction among the terms. We find that those terms do not have coherent meanings in the textbooks and many statements make it hard to distinguish the meanings of the terms. Finally the origin of the confusion and educational implication is discussed.

Determination of Usenet News Groups by Fuzzy Inference and Neural Network (퍼지추론과 신경망을 사용한 유즈넷 뉴스그룹 결정)

  • 김종완;김희재;김병만
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2004.04a
    • /
    • pp.401-404
    • /
    • 2004
  • 본 연구에서는 다양한 뉴스그룹들 중에서 사용자의 취향과 유사한 뉴스그룹들을 코호넨 신경망을 이용하여 추천해주는 방법을 제시한다. 신경망을 학습시키기 위한 뉴스 문서의 키워드들을 선택하기 위해 여러 문서들로부터 후보 용어들을 추출하고 퍼지 추론을 적용하여 대표 용어들을 선택한다. 하지만 신경망의 학습패턴을 관찰해 보면, 맡은 부분이 비어있는 희소성 문제를 발견할 수 있다. 이에 본 연구에서는 통계적인 결정계수를 도입하여 불필요한 차원을 제거한 후 신경망을 학습시키는 새로운 방법을 제안한다. 제안된 방법은 모든 차원을 활용할 때 보다 클러스터내 거리와 클러스터간 거리의 척도를 이용한 클러스터 중첩도 면에서 우수한 분류 성능을 보여줌을 확인하였다.

  • PDF

Feature Selection for Document Classifier for IT documents based on SVM (SVM 기반 기술정보 문서분류를 위한 특징 선택 기법)

  • Kang, Yun-Hee
    • Annual Conference of KIPS
    • /
    • 2002.04a
    • /
    • pp.577-580
    • /
    • 2002
  • 인터넷상의 정보의 급증에 따라 필요한 정보를 발견하고 관련된 정보를 조직화하기가 더욱 어려워지고 있으며 정보 접근의 부하를 줄이기 위한 효율적인 문서 분류의 중요성 및 필요성이 증가하고 있다. 본 논문에서는 디렉토리 내의 학습 문서 집합을 기반으로 구성된 디렉토리 내의 대표 용어 집합으로 구성된 모델을 학습 및 분류하기 위해 SVM을 사용한다. 문서분류를 위해 정보통신 웹 디렉토리 내의 문서로부터 추출된 용어 집합을 기반으로 학습을 수행한 후 문서 분류를 수행한다. 또한 TFiDF를 기반으로 특징을 표현하기 위해 벡터공간 모델을 사용하였고 이를 기반으로 성능 평가를 수행한다.

  • PDF

News Article Recommender System By Relevance and Reinforcement Learning (관련성과 강화학습을 이용한 신문기사 추천시스템)

  • 상태종;손기준;박미성;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.229-231
    • /
    • 2004
  • 추천 시스템은 양질의 정보를 추천하기 위해서 사용자의 관심도를 반영해야 한다. 이를 위해 본 연구에서는 강화학습과 관련 정보, 비관련 정보를 모두 이용하는 피드백 방법을 결합하였다. 사용자의 문서에 대한 평가를 평가 값으로 사용하여 사용자가 선호하는 용어와 선호하지 않는 용어를 추출하고, 이를 이용해 사용자 프로파일을 강화학습으로 학습하게 된다. 제안된 방법으로 신문기사 추천시스템에 적용하여 실험한 결과, 관련 정보와 비관련 정보를 함께 사용한 방범이 기존의 관련 정보안물 사용한 방법보다 더 나은 성능을 보였다.

  • PDF

An Analysis of Explicit and Implicit Teaching Cases for Scientific Terms in Science Textbooks (과학교과서에 제시된 과학용어에 대한 명시적 및 암시적 교육 사례 분석)

  • Yun, Eunjeong
    • Journal of The Korean Association For Science Education
    • /
    • v.39 no.6
    • /
    • pp.767-775
    • /
    • 2019
  • This study was conducted to analyze explicit and implicit teaching cases of scientific terms in accordance with the 2015 revised curriculum, pointing out the problems of current textbooks in terms of scientific terms education and proposing method to improve them. Scientific terms used in eight science textbooks of 2015 revised curriculum, third and sixth graders of elementary school, first graders of middle school and first graders of high school were extracted, and cases used explicitly and implicitly were collected and analyzed. Brief summary of the results of the study is as follows. First, scientific terms were used in elementary, middle, and high school science textbooks at a rate of about 15 to 30 percent of the total vocabulary contained in the textbooks, which is on average more than five times larger than those in foreign countries based on the number of scientific terms included on each page. Second, among the scientific terms used in science textbooks, the percentage of scientific terms in which semantic education is achieved through explicit means was 9.7 to 18.8 percent, which naturally means that the remaining 80 percent or more of the scientific terms are presented in the form of implicit education. Third, even though the ratio of explicit term education should be higher in the lower grades, the ratio of explicit term education in elementary schools was lower than 10% in the sixth grade.

Calculation of similarity by weighting title and summary in word co-occurrence of research reports (연구 보고서의 공기관계 정보에 제목 및 요약의 가중치를 적용한 유사도 계산)

  • Kim, Nam-Hun;Joo, Jong-Min;Park, Hyuk-Ro;Yang, Hyung-Jeong
    • Proceedings of The KACE
    • /
    • 2017.08a
    • /
    • pp.37-40
    • /
    • 2017
  • 본 논문에서는 국가 연구 보고서의 공기 관계 정보와 제목, 요약 등에 가중치를 적용한 유사도 계산방법을 제안한다. 이를 위해 국가 연구개발 보고서에서 텍스트를 추출하여 한 문장 단위로 문서를 분할하고, 기본 불용어와 보고서에서 특징적으로 나타나는 불용어를 처리하고 형태소 분석을 한 뒤 공기관계를 추출하였다. 또한 문서의 유사도 계산시 정확성을 높이기 위해 제목과 요약 부분에 가중치를 부여하였다. 이를 통해 본 논문에서 제안하는 방법이 문서 검색 라이브러인 루씬(Lucene)을 이용한 방법보다 2.5%의 검색성능 향상을 그리고 Knn-휴리스틱 방법보다는 1.1%의 검색성능 향상을 보였다. 이러한 결과를 통해 문서의 요약과 제목 그리고 공기관계 정보가 연구보고서의 유사도를 계산 하는데 영향을 미친다는 것을 보였다.

  • PDF

A Junkmail Checking System Using Fuzzy Relational Products (퍼지 관계 곱을 이용한 정크메일 분류 시스템)

  • 박정선;김창민;김용기
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2001.12a
    • /
    • pp.341-344
    • /
    • 2001
  • 20세기 후반 인터넷의 발전을 기반으로 전자메일은 현재의 대표적인 개인간 정보전달 수단으로 자리 잡게 되었다. 그러나 전자메일 사용자들은 인터넷상에 개인 전자메일 주소가 노출되므로 해서 많은 정크메일(junkmail)을 수신하게 되었는데, 정크메일이란 기업의 광고 선전물과 같이 수신을 원하지 않는 전자메일을 의미한다. 이러한 정크메일의 증가에 따라 정크메일을 분류하는 수단이 필요하게 되었는데, 현재까지는 사용자가 입력한 송신자의 전자메일 주소 또는 도메인 주소를 등록하여 차단하거나 제목에 특정 단어를 포함한 메일을 완전히 삭제하여 버리는 기술수준에 머무르고 있다. 본 논문에서는 퍼지 관계 곱을 기반으로 메일의 내용에 의미적으로 접근하여 정크메일을 분류하는 시스템을 제안한다. 이는 퍼지 관계곱 연산을 이용하여 미리 정의한 정크용어들과 사용자에게 수신되는 전자메일 내의 용어들간 의미적 포함관계를 분석하고 그를 통해 전자메일의 정크도(degree of junk)를 추출한다. 각 전자메일별로 추출된 정크도는 사용자가 부여하는 정크 기준치(SVJ, Standard Value of Junk)를 기분으로 정크메일과 비 정크메일로 분류한다. 제안된 기법은 사용자가 특정 개수의 동일한 전자메일에 대해 느끼는 정크도를 기준으로 분류한 정크메일 수를 비교하여 그 효용성을 증명하였다.

  • PDF

Key Expressions in Editorial Texts: Determining the Unithood and Termhood of Word Sequences based on a 2009 Newspaper Corpus (신문 사설의 특징적 표현들에 대한 연구)

  • Kim, Hye-Young;Kang, Beom-Mo
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.185-190
    • /
    • 2012
  • 본 논문은 동아, 조선, 중앙, 한겨레 신문의 2009년 신문 사설의 제목과 본문에서 나타나는 n-gram에 대한 논의이다. 구체적으로 자주 출현하는 단어들의 연속 단위 3~6개의 형태소를 추출하여 신문 사설에서 나타난 고빈도 형태소 연속체를 살펴본다. 또한 이들을 기사문에서 추출한 패턴과 로그공산비로 비교하여 신문 사설에서 더 특징적인 의미로 사용되는 어휘들을 살펴본다. 그 결과, 사설 본문에서는 3-gram은 '아야 한다'. 4-gram은 'ㄹ 것이다', 5-gram은 'ㄹ 수밖에 없다', 6-gram은 '아야 할 것이다' 등이, 사설 제목은 '것인가, 안 된다'가 하나의 용어처럼 사용되고 있었다. 이러한 형태소 연속체를 살펴봄으로써, 신문사설의 텍스트 특징과 정형적인 표현에 대해서 살펴볼 수 있다.

  • PDF

Semantic Query Expansion based on a Question Category Concept List in QA system (질의 응답 시스템에서 질의 카테고리별 개념리스트 구축에 기반한 의미적 질의 확장)

  • 김혜정;강보영;박성배;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.178-180
    • /
    • 2004
  • 질의 응답(Question Answering) 시스템은 질의에서 요구하는 정답 유형(Answer tyype) 및 질의에 사용된 용어를 적용하여 보다 정확한 답을 추출하고자 한다. 그러나 질의에 사용된 용어들이 문서의 정답문장에 그대로 사용되지 않고 같은 의미의 다른 어휘로 출현하기도 하며, 혹은 다른 문법적 정보를 가진 카테고리로 등장하여 정답 추출에 어려움이 따른다. 따라서, 본 논문은 질의별 카테고리 개념 리스트를 구축하여 효과적인 의미적 질의 확장 방법론을 제안한다. 제안된 방법은 먼저 질문 문장의 패턴 린 질의 정보 유형을 파악하여 질의 카테고리 및 카테고리별 개념 리스트를 구축한다. 그런 후 구축된 질의 개념 카테고리 및 리스트를 활용하여 질의 유형을 학습하고, 새로운 질의가 입력되면 해당 개념 카테고리로 분류한 후, 개념 리스트를 기반으로 개념별 질의 확장을 수행한다. 제안된 시스템의 성능 명가를 위하여, TREC-9의 질의와 TREC 문서 중 1991년도 WSJ(Wall Street Journal) 42,654건을 대상으로 실험한 결과 질의 확장을 수행하지 않는 시스템의 경우 MRR(Mean reciprocal ratio) 측정에서 0.223의 결과를 보인 반면 제안된 시스템의 경우 0.50의 향상된 결과를 보였다.

  • PDF