• Title/Summary/Keyword: 문장비중

Search Result 29, Processing Time 0.024 seconds

An Approach to Detect Spam E-mail with Abnormal Character Composition (비정상 문자 조합으로 구성된 스팸 메일의 탐지 방법)

  • Lee, Ho-Sub;Cho, Jae-Ik;Jung, Man-Hyun;Moon, Jong-Sub
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.18 no.6A
    • /
    • pp.129-137
    • /
    • 2008
  • As the use of the internet increases, the distribution of spam mail has also vastly increased. The email's main use was for the exchange of information, however, currently it is being more frequently used for advertisement and malware distribution. This is a serious problem because it consumes a large amount of the limited internet resources. Furthermore, an extensive amount of computer, network and human resources are consumed to prevent it. As a result much research is being done to prevent and filter spam. Currently, research is being done on readable sentences which do not use proper grammar. This type of spam can not be classified by previous vocabulary analysis or document classification methods. This paper proposes a method to filter spam by using the subject of the mail and N-GRAM for indexing and Bayesian, SVM algorithms for classification.

Post-Processing of Voice Recognition Using Phonologic Rules and Morphologic analysis (음절 복원 규칙과 형태소 분석을 이용한 음성인식 후처리)

  • Seo, Sang-Hyun;Kim, Jae-Hong;Kim, Hae-Jin;Kim, Mi-Jin;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.495-499
    • /
    • 1997
  • 컴퓨터의 사용이 보편화됨에 따라 컴퓨터와 사용자 사이의 쉽고 자연스러운 의사 소통을 위한 자연어 인터페이스에 대한 연구가 활발히 진행되고 있다. 이 중에서 특히, 음성인식 분야는 음성명령, 받아쓰기 시스템 등 일반적인 컴퓨터 사용자의 요구를 충족시켜 줄 수 있는 분야로 주목을 받고 있다. 그러나 음성인식은 인식 자체만으로는 인식률에 한계가 있으며, 인식 결과를 향상시키기 위해서는 후처리 단계가 필요하다. 본 논문에서는 음성 인식의 성능을 향상시키기 위해 음성 인식의 결과로 들어온 연속된 한국어 음성을 올바른 음절로 복원시켜 주는 시스템을 구현하였다. 이 시스템에서는 어절단위의 연속된 한국어 음성을 입력으로 받아 한국어 발음 규칙을 역으로 적용하여 원래의 음절로 복원시키고, 형태소 분석기를 이용하여 복원된 음절이 올바른지를 확인하고 수정한다. 초등학교 교과서에 나오는 문장을 대상으로 본 시스템의 성능을 실험한 결과, 90.42%의 복원율을 나타내었다. 현재 정확하게 복원이 되지 않는 것 중에는 동음이의어가 차지하는 비중이 크며, 이 문제는 구문분석이나 의미분석을 이용하여 어느 정도 개선할 수 있을 것으로 보인다.

  • PDF

A Sentence Generation System for Multiple Choice Test with Automatic Control of Difficulty Degree (난이도 자동제어가 구현된 객관식 문항 생성 시스템)

  • Kim, Young-Bum;Kim, Yu-Seop
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.1404-1407
    • /
    • 2007
  • 본 논문에서는 객관식 문항을 난이도에 따라 자동으로 생성하는 방법을 고안하여, 학습자 수준에 적합하도록 다양하고 동적인 형태로 문항 제시를 할 수 있는 시스템을 제안하였다. 이를 위해서는 주어진 문장에서 형태소 분석을 통해 키워드를 추출하고, 각 키워드에 대하여 워드넷의 계층적 특성에 따라 의미가 유사한 후보 단어를 제시한다. 의미 유사 후보 단어를 제시할 때, 워드넷에서의 어휘간 유사도 측정 방법을 사용함으로써 생성된 문항의 난이도를 사용자가 원하는 수준으로 조정할 수 있도록 하였다. 단어의 의미 유사도는 동의어를 의미하는 수준 0에서 거의 유사도를 찾을 수 없는 수준 9 까지 다양하게 제시할 수 있으며, 이를 조절함으로써 문항의 전체 난이도를 조절할 수 있다. 후보 어휘들의 의미 유사도 측정을 위해서, 본 논문에서는 두 가지 방법을 사용하여 구현하였다. 첫째는 단순히 두 어휘의 워드넷 상에서의 거리만을 고려한 것이고 둘째는 두 어휘가 워드넷에서 차지하는 비중까지 추가적으로 고려한 것이다. 이러한 방법을 통하여 실제 출제자가 기존에 출제된 문제를 토대로 보다 다양한 내용과 난이도를 가진 문제 또는 문항을 보다 쉽게 출제하게 함으로써 출제에 소요되는 비용을 줄일 수 있었다.

  • PDF

A method for morphological correction of ambiguous error (한글 문서에서 형태적 중의 오류의 교정)

  • Kim, Min-Ju;Jeong, Jun-Ho;Lee, Hyeon-Ju;Choe, Jae-Hyeok;Kim, Hang-Jun;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.41-48
    • /
    • 1998
  • 교정 시스템에 나타나는 오류 유형들 중에는 전체적인 교정률에 차지하는 비중은 적지만 출현할 때마다 틀릴 가능성이 아주 높은 오류들이 있다. 기존의 교정 시스템에서는 이러한 오류들에 대한 처리가 미흡한데, 철자 오류와 띄어쓰기 오류 중 형태가 비슷하거나 같은 형태가 다른 기능을 함으로써 발생하는 오류들이다. 이러한 오류는 일반 문서 작성자뿐만 아니라 한글 맞춤법에 대해 어느 정도 지식을 가진 사람의 경우에도 구분이 모호하다. 복합 명사와 미등록어를 제외한 오류 중 약 30%가 여기에 속한다. 따라서 본 논문에서는 이러한 오류 유형들을 분류하고, 이 중에서 빈번하게 출현하는 오류에 대한 교정을 시도하고, 오류 유형들이 문장 내에서 어떤 분포를 가지는지 알아본다. 약 617만 어절의 말뭉치를 이용하여 해당 형태와 다른 성분들과의 관련성을 조사하여 교정 방법을 제시하고, 형태소 분석을 하여 교정을 행한다. 코퍼스 655만 어절 대상으로 실험한 결과 84.6%의 교정률을 보였다. 본 논문에서 제시한 교정 방법은 기존의 교정 시스템에 추가되어 교정 시스템의 전체 교정률을 향상시킬 수 있다. 또한 이와 비슷한 유형의 다른 어휘 교정에 대한 기초 자료로 사용될 수 있을 것이다.

  • PDF

Confucius's Theory of Poetics in Analects (공자의 『시경』 재구성과 시론(詩論) - 『논어』를 중심으로)

  • Lim, Heon-gyu
    • Journal of Korean Philosophical Society
    • /
    • v.137
    • /
    • pp.439-462
    • /
    • 2016
  • This Article's aim is to articulate Confucius's theory of poetics in analects. Confucius tried to establish Humanism and educate the idea of 'learning to become a sage' based upon six classics. He empathized with the education of The Book of Poetry. Sze-ma Tseen said that the old poems amounted to more than 3,000. Confucius removed those which were only repetitions of others and sang to them with his lute, bringing them into accordance with the appropriate musical style. This is the first notice which we have of any compilation of the ancient poems by Confucius. Confucius said, "If you do not learn the Odes, you are not fit to converse with. The Odes 1) serve to stimulate the mind, 2) may be used for purposes of self-contemplation, 3) teach the art of sociability, 4) show how to regulate feelings of resentment, 5-6.) 'From them you learn the more immediate duty of serving one's father, and the remoter one of serving one's prince. and from them we become largely acquainted with the names of birds, beasts, and plants.' Confucius' said, 'In the Book of Poetry are three hundred pieces, but the design of them all may be embraced in one sentence-- "Having no depraved thoughts."' This sentence is the final definition of Poetics.

Comparison of Verbs in the Contents of the National Curriculum for Elementary and Middle School Science: Focused on the 7th, 2007, and 2009 Revision (초·중학교 과학과 교육과정의 내용 진술에 사용된 서술어 비교: 제7차 교육과정 이후를 중심으로)

  • Jo, Kwang-Hee
    • Journal of Science Education
    • /
    • v.39 no.2
    • /
    • pp.239-254
    • /
    • 2015
  • The aims of this research were to analyze and compare verbs in the contents of the 7th, 2007, and 2009 revised national curriculum for elementary and middle school science. After the investigation of 1383 verbs in description of achievement standards and inquiry, we found that 'to know'(15.0 %) in elementary school and 'to understand'(24.2 %) in middle school were the most frequently used ones, totally in these three curriculums. In the 7th national curriculum, frequently used verbs in elementary school were ones related with inquiry such as observation, investigation and so on though 'to understand' had the most common verbs. Secondly, 'to explain' ranked top among verbs in the 2007 revised national curriculum. It showed some possibility of influences of the discussion-oriented situation at that time. Finally, however, in 2009 revised national curriculum, 'to know' and 'to understand' occupied the first and second portion of the verb distribution. In addition, 'to understand' and 'to observe' were used evenly through three curriculums but the portions of 'to know' increased through curriculum revisions. Some implications and discussions were also added with suggestions for further researches.

  • PDF

A Comparative Study of South and North Korea on Mathematics Textbook and the Development of Unified Mathematics Curriculum for South and North Korea (II) - Focusing on the Elementary School Textbooks of South and Those of North Korea - (남북한 수학 교과서 영역별 분석 및 표준 수학 교육과정안 개발 연구 (II): 남북한 초등학교 수학교과서의 구성과 전개방법 비교)

  • 임재훈;이경화;박경미
    • School Mathematics
    • /
    • v.5 no.1
    • /
    • pp.43-58
    • /
    • 2003
  • This study intends to compare the structure of contents and the way of developing concepts in mathematics textbooks of south and those of north Korea. After thorough investigations of the textbooks from south and north Korea, the following three characteristics were identified. First, the mathematics textbooks of south Korea tends to spread out contents across several grades, while those of north Korea have a tendency of centralization in terms of locating contents Second, in the textbooks of South Korea, mathematics concepts are permeated through real world situations, and students gradually acquire those concepts mostly through activities. This is different from the approach of the north Korean textbooks in which various problems play a key role in explaining concepts. Third, the main strategy of introducing contents in the textbooks of south and that of north Korea corresponds to 'guidance' and 'explanation' respectively. Exploratory questions leading to the concepts are more emphasized in the textbooks of south Korea, on the other hand, meaningful explanations play an important role in the textbooks of north Korea.

  • PDF

An Analysis of the Fraction as Quotient in Elementary Mathematics Instructional Materials (몫으로서의 분수에 관한 초등학교 수학과 교과용도서 분석)

  • Pang, JeongSuk;Lee, Ji-Young
    • Journal of Educational Research in Mathematics
    • /
    • v.24 no.2
    • /
    • pp.165-180
    • /
    • 2014
  • This study analyzed in what ways the instructional materials have been dealing with the fraction as quotient, since the seventh national mathematics curriculum. An analysis of this study urged us to re-consider the content related to the fraction as quotient. First, the fraction as quotient has weakened in the current mathematics textbooks and workbooks in comparison to those developed under the previous curriculum. Second, the contexts of whole number division taught in grades 3 and 4 were not naturally connected to those of the fraction as quotient taught in grade 5. Third, the types of word problems, visual models, and partitioning strategies in the textbooks and the workbooks were partial, and the process of formalization was limited. Building on these results, this study is expected to suggest specific implications which may be taken into account in developing new instructional materials in process.

  • PDF

Contribution Degree Analysis of Discharge from Sewage Treatment Plants at Streamflow in River (하수종말처리시설 방류수의 하천유량 기여도 분석)

  • Moon, Jang-Won;Choi, Si-Jung;Kang, Seong-Kyu;Lee, Dong-Ryul
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.1370-1374
    • /
    • 2010
  • 하수종말처리시설은 가정 등에서 배출되는 생활하수를 처리하여 오염물질을 제거한 후 다시 하천으로 물을 되돌려 보내는 시설로 하천수의 수질 측면에서 매우 중요한 역할을 수행하고 있다. 그러나 하천수의 수질 측면뿐만 아니라 수량적인 측면에서도 하수종말처리시설은 하천유량 관리에 있어 중요한 고려사항이라 할 수 있다. 하수종말처리시설을 통해 하천으로 방류되는 물은 비교적 일정한 수준을 유지하고 있으며, 이는 평저수기 및 갈수기 하천유량 관리 측면에서 매우 중요한 의미를 갖는다. 효율적인 하천유량 관리를 위해서는 하천을 중심으로 이루어지는 물 순환 구조에 대해 명확하게 파악할 수 있어야 하며, 하천에서 빠져나가는 물의 양과 하천으로 들어오는 물의 양을 파악함으로써 적절한 하천유량 관리가 이루어질 수 있다. 본 연구에서는 하수종말처리시설에서 하천으로 방류되는 물의 양이 하천유량에서 차지하는 비중을 파악하기 위한 분석을 수행하였다. 이를 위해 하수종말처리시설의 처리수 방류위치를 확인한 후 이를 기준으로 인접한 상 하류 하천구간에 유량자료가 생산되고 있는 수위관측시설을 검토하여 분석을 위한 대상 지점을 선정하였다. 선정된 지점을 중심으로 홍수기(6~9월)를 제외한 기간에 대해 하천유량과 하수종말처리시설의 방류수량을 검토하여 하수처리수의 기여도를 분석하였다. 하천유량과의 비교와 함께 분석 대상 지점에 고시되어 있는 하천유지유량과 비교한 후 그 결과를 제시하였다. 본 연구의 결과를 통해 하수처리수가 하천에 흐르는 유량에 기여하는 정도를 파악할 수 있으며, 이는 하천유량이 상대적으로 적은 평저수기 및 갈수기 하천유량 관리를 위한 기반 정보로 활용할 수 있을 것이다.

  • PDF

Combinatory Categorial Grammar for the Syntactic, Semantic, and Discourse Analyses of Coordinate Constructions in Korean (한국어 병렬문의 통사, 의미, 문맥 분석을 위한 결합범주문법)

  • Cho, Hyung-Joon;Park, Jong-Cheol
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.4
    • /
    • pp.448-462
    • /
    • 2000
  • Coordinate constructions in natural language pose a number of difficulties to natural language processing units, due to the increased complexity of syntactic analysis, the syntactic ambiguity of the involved lexical items, and the apparent deletion of predicates in various places. In this paper, we address the syntactic characteristics of the coordinate constructions in Korean from the viewpoint of constructing a competence grammar, and present a version of combinatory categorial grammar for the analysis of coordinate constructions in Korean. We also show how to utilize a unified lexicon in the proposed grammar formalism in deriving the sentential semantics and associated information structures as well, in order to capture the discourse functions of coordinate constructions in Korean. The presented analysis conforms to the common wisdom that coordinate constructions are utilized in language not simply to reduce multiple sentences to a single sentence, but also to convey the information of contrast. Finally, we provide an analysis of sample corpora for the frequency of coordinate constructions in Korean and discuss some problematic cases.

  • PDF