• 제목/요약/키워드: Proper Vocabulary

검색결과 45건 처리시간 0.025초

주제색인의 이론과 실제 (Theory and practice of alphabetical subject indexing)

  • 윤구호
    • 한국도서관정보학회지
    • /
    • 제10권
    • /
    • pp.95-131
    • /
    • 1983
  • Index is a systematic guide to items contained in, or concepts derived from, a collection, Thus, it is represented as a paired set of index terms (t) and documents (D) : I= {(t,D) vertical bar t .mem. V, D .mem. W), where V is index vocabulary and W is document collection. Indexing is the process of analysing the informational content of records of knowledge and expressing the informational content in the language of the indexing system. It involves: 1) Selecting indexable concepts in a document; and 2) expressing these concepts in the language of the indexing system (as index entries): and an ordered list. Indexing process involves technical, semantic and syntactic problems. Technical problems are related to the accuracy of indexing, which is primarily governed by the indexer's ability of analysing subject, identifying indexable concepts, and coding. The proper levels of indexing exhaustivity, and index language specificity are also significant factors affecting the quality of index. Semantic problems are related to the choice of index terms and the form in which they should be used. Equivalent, hierarchical and affinitive/associative relationships of index terms are involved. Syntactic problems are largely related to the coordination of index terms. This process of coordination arises from the need to be able to search for the intersection of two or more classes defined by terms denoting distinct concepts. Finally, most valuable aspects of alphabetical subject indexing theories and practices are derived from those of Cutter, Kaiser, Ranganathan, Coates, Lynch and Austin, and discussed in details.

  • PDF

건축설비소음 평가를 위한 어휘의 유형화에 관한 연구 (A Research on Vocabulary Materialization for Evaluation of Architecture Plumbing Noise)

  • 유희종;정은정;김재수
    • 설비공학논문집
    • /
    • 제19권4호
    • /
    • pp.346-354
    • /
    • 2007
  • Recently, in accordance with the buildings are rapidly becoming to high-stories, large-sizes, and since the case that noise of equipment machinery, tool itself infringes the life environment is on increasing, this is becoming to the object of civil appeal. Accordingly, in order to set up a countermeasure against such equipment machinery noise, even a systemic evaluating method is required, up to now while the appraisal that considering on the physical characteristic only had been done, but the characteristic about subjective valuation was not reflected as yet. Therefore, in this research, through the 1st, 2nd Psycho-Acoustics Experiments, the 30 vocabularies were extracted for evaluation of the construction equipment noise. As the result of Element Analysis, the 3 Elements were extracted from these vocabularies, and it could be understood that these Elements have been trustfully selected. It is now considering that the extracted vocabularies as per the above result would be used to Psycho-Acoustic Evaluation on Equipment Noise, and Psycho-Acoustics Experiment.

Understanding recurrent neural network for texts using English-Korean corpora

  • Lee, Hagyeong;Song, Jongwoo
    • Communications for Statistical Applications and Methods
    • /
    • 제27권3호
    • /
    • pp.313-326
    • /
    • 2020
  • Deep Learning is the most important key to the development of Artificial Intelligence (AI). There are several distinguishable architectures of neural networks such as MLP, CNN, and RNN. Among them, we try to understand one of the main architectures called Recurrent Neural Network (RNN) that differs from other networks in handling sequential data, including time series and texts. As one of the main tasks recently in Natural Language Processing (NLP), we consider Neural Machine Translation (NMT) using RNNs. We also summarize fundamental structures of the recurrent networks, and some topics of representing natural words to reasonable numeric vectors. We organize topics to understand estimation procedures from representing input source sequences to predict target translated sequences. In addition, we apply multiple translation models with Gated Recurrent Unites (GRUs) in Keras on English-Korean sentences that contain about 26,000 pairwise sequences in total from two different corpora, colloquialism and news. We verified some crucial factors that influence the quality of training. We found that loss decreases with more recurrent dimensions and using bidirectional RNN in the encoder when dealing with short sequences. We also computed BLEU scores which are the main measures of the translation performance, and compared them with the score from Google Translate using the same test sentences. We sum up some difficulties when training a proper translation model as well as dealing with Korean language. The use of Keras in Python for overall tasks from processing raw texts to evaluating the translation model also allows us to include some useful functions and vocabulary libraries as well.

청감실험을 통한 고화질 TV set 소음평가에 관한 실험적 연구 (An Experimental Study on the noise Rating of H.D. TV sets by Psycho-acoustic Experiments)

  • 이주엽;박현구;이태강;김희진;김선우
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2006년도 춘계학술대회논문집
    • /
    • pp.862-869
    • /
    • 2006
  • The purpose of this study is to propose the proper vocabularies for evaluating H.D TV set fan noise in residential condition. To achieve this goal, psycho-acoustic experiments were carried out with TV set fan noise modulated at specific frequency band. finally, a correlation analysis between vocabularies, and a factor analysis of psycho-acoustical responses were conducted. As a result of this study, followings are suggested. Analyzing the psycho-acoustical response corresponding to the various sound level, the higher the sound levels, the higher the response values were. It is estimated that the sound level determined psycho-acoustical responses. On the degree of response to fan noise, the initial level of negative feeling is located on $35{\sim}40$ dB(A). The factor of evaluating H.D. TV set fan noise has induced three the appropriate korean adjectives; Irritate, Monotonous, stuffy and dryness. The result of this study may be used to evaluate the acoustic threshold level for indoor noise or a basis for specifying the desired acoustic environment of dwellings.

  • PDF

청감실험을 통한 고화질 TV set 소음평가에 관한 실험적 연구 (An Experimental Study on the Noise Evaluation of H.D. TV sets by Psycho-acoustic Experiments)

  • 이주엽;이태강;김희진;김선우
    • 한국소음진동공학회논문집
    • /
    • 제16권10호
    • /
    • pp.1014-1023
    • /
    • 2006
  • The purpose of this study is to propose the proper vocabularies for evaluating H.D TV set fan noise. To achieve this goal, psycho-acoustic experiments were carried out with TV set fan noise modulated at specific frequency band. Finally, a correlation analysis between vocabularies, and a factor analysis of psycho-acoustical responses were conducted. As a result of this study, followings are suggested. Analyzing the psycho-acoustical response corresponding to the various sound level, the higher the sound levels, the higher the response values were. It is estimated that the sound level determined psycho-acoustical responses. On the degree of response to fan noise, the initial level of negative feeling is located on $35{\sim}40$ dB(A). The factor of evaluating H.D. TV set fan noise has induced three the appropriate korean adjectives; Irritate, Monotonous, stuffy and dryness. The result of this study may be used to evaluate the acoustic threshold level for indoor noise or a basis for specifying the desired acoustic environment of dwellings.

연속분포 HMM에서 평행분기 음성단위를 사용한 단어인식율 향상연구 (On the Use of a Parallel-Branch Subunit Mod디 in Continuous HMM for improved Word Recognition)

  • 박용규;은종관
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권2E호
    • /
    • pp.25-32
    • /
    • 1995
  • 단어인식의 성능향상을 위하여 평행분기 음성단위(subunit) 모델의 사용을 제안하였으며 연속 분포 HMM에서 이 모델은 각 음성단위를 확률분포함수 (mixture components)를 이용하여 분기시킴에 의해 얻어진다. 제안된 방법을 사용한 결과에 따르면 기존에 제안된 평행분기 [1] 음성단위 모델이나 단일분기 모델보다 높은 인식률을 얻을 수 있었다. 본 연구에서는 각 음성단위에 대해 활률분포함수나 분기수의 적절한 결합을 통해 높은 인식률을 얻는데 이 1036 한국어 결리단어가 인시실험에 사용되었다.

  • PDF

대학보고서에 대한 외국인 학부 유학생과 교수자의 평가 양상 연구 (A Study on the Report Assessment Patterns of International Undergraduate Students and Instructors)

  • 장미정;박정은
    • 한국어교육
    • /
    • 제29권3호
    • /
    • pp.293-324
    • /
    • 2018
  • The purpose of this study was to identify differences in the report assessment patterns of international undergraduate students and instructors. Based on two sample reports, the following differences were confirmed between international students and instructors' assessments of reports. First, instructors and students showed no differences in their assessments of the well-formatted report. However, the two groups exhibited differences in their assessments of the report that was not well formatted in that students evaluated the report more highly than instructors did. Second, instructors and students exhibited notable differences in their assessments of items such as citation, logic, and expression. This may have been because students lacked knowledge on citation methods and the use of grounds for arguments based on citation methods and topics. Third, students and instructors showed differences in their areas of focus when evaluating reports. Instructors mostly focused on the main topics of each report, whereas students focused on supporting details for the main topics. Based on these findings, instructors need to emphasize the following areas in educating international undergraduate students on report writing. First, they should stress proper source citation. They should provide frequent guidance on how to accurately cite sources. Second, they should help students to first think about the overall form and content of their reports. Instructors should emphasize that having a logical overall report structure and content that is relevant to the subject is more important in general than grammar or accuracy of vocabulary.

DP 알고리즘에 의한 발음사전 전처리와 문맥종속 자소별 MLP를 이용한 영어 발음사전 생성기의 개선 (Improvements of an English Pronunciation Dictionary Generator Using DP-based Lexicon Pre-processing and Context-dependent Grapheme-to-phoneme MLP)

  • 김회린;문광식;이영직;정재호
    • 한국음향학회지
    • /
    • 제18권5호
    • /
    • pp.21-27
    • /
    • 1999
  • 본 논문에서는 가변어휘 단어 인식기에 사용하기 위한 개선된 MLP 기반 영어 발음사전 생성기를 제안한다. 가변어휘 단어 인식기는 인식대상 도메인이 수시로 바뀌는 상황에서 현재의 인식 도메인에 의해 결정되는 임의의 한국어 어휘들에 대해 처리 할 수 있다. 이 시스템을 영어 단어에 대해서도 처리할 수 있도록 하기 위해서는 미리 정의된 사전에 포함할 수 없는 영어 고유명사와 같은 단어의 발음열을 구할 수 있는 방법이 필요하다. 영어 발음사전 생성기를 구현하기 위하여 본 연구에서는 각 자소를 음소로 변환해 주는 문맥종속 다층 퍼셉트론 구조를 제안한다. 각 자소별 다층 퍼셉트론을 훈련하기 위해서는 표준 발음사전으로부터 각 자소에 대응하는 음소 학습용 데이터를 준비해야 한다. 이를 위해 본 연구에서는 적절한 거리척도를 사용하는 동적 프로그래밍 알고리즘을 사용한다. 훈련 및 평가를 위한 데이터로는 116,191개 영어 단어의 발음사전을 사용하였다. 평가 결과 각각 30~50개의 히든 노드를 가지는 26개 자소별 MLP와 예외 자소 발음사전을 가지고 표준 발음사전에 대하여 72.8%의 단어 정확도를 얻었으며, 이것은 기존의 규칙 에 기반한 발음사전 생성의 정확도인 24.0% 보다 매우 우수한 결과임을 보여주었다.

  • PDF

애니메이션의 조명 연출에 대한 연구 - 3D 애니메이션 장면에서 나타나는 정서적 어휘를 중심으로 (The Study on the Lighting Directing of Animation - Focusing on the Emotional Vocabulary that Appears in the 3D Animation Scene)

  • 이종한
    • 만화애니메이션 연구
    • /
    • 통권36호
    • /
    • pp.349-374
    • /
    • 2014
  • 빛은 언어이다. 연출자가 애니메이션의 장면을 구성할 때 자신의 의도를 효과적으로 표현하기 위해 장면구성요소를 적절하게 사용해야 한다. 캐릭터의 연기, 장면의소품의 배치 그리고 빛이 장면구성요소에 들어갈 수 있다. 이러한 것들은 관객이 작품의 내러티브를 이해하고 연출자가 전달하고자 하는 정서를 이해하는데 도움을 준다. 특히 빛을 이용하여 색이나 명암을 조절하여 장면에서 전달하고자 하는 정서를 표현하므로 관객들이 자연스럽게 정서를 이해하고 작품에 집중하게 할 수 있도록 한다. 이러한 조명 연출은 초기 연극 무대나 렘브란트와 같은 회화작가의 작품에서도 쉽게 찾아볼 수 있다. 부분적으로 빛을 조절하여 장면이 가지고 있는 신성, 고민, 두려움 등 여러 가지 정서를 표현하여 작품의 극적 요소와 아름다움을 증가시킨다. 따라서 연출자가 어떠한 의도를 가지고 빛을 이용하느냐에 따라 장면의 의미는 여러 가지로 변화할 수 있다. 조명은 대상의 인식과 시공간의 시각화라는 기본적인 기능 외에도 예술적 방식을 통해 인간의 정서에 자극을 주어 작품의 몰입도를 높일 수 있다. 본 연구에서는 작품의 내러티브에 기초를 둔 장면의 정서적 표현을 하기 보조하기 위해 조명이 어떤 역할을 하며 적절한 정서를 표현하기 위해 조명을 어떻게 사용해야 하는지 알아볼 것이다. "영화 조명의 정서 표현 기능을 적용한 3D애니메이션 조명 연구"를 선행연구로 하여 3D 애니메이션에 적용할 수 있는 정서적인 언어의 표현을 분류하여 기존의 정서 이론에 기반을 둔 정서적 어휘와 결합한다. 그리고 3D 애니메이션에서 나타난 정서적 장면을 선택하여 정서를 표현하기 위한 조명의 연출을 분석하여 정리한다. 이것으로 연출자가 장면의 의미를 전달하기 위해 정서적인 언어에 맞는 조명 연출법을 정리하고자 한다. 이것은 장면의 정서를 표현을 위한 3D 애니메이션 조명 연출의 기준을 제시할 연구가 계속 되어지길 기대한다.

한국어 인식을 위한 인식 단위와 학습 데이터 분류 방법에 대한 연구 (A Study on Recognition Units and Methods to Align Training Data for Korean Speech Recognition))

  • 황영수
    • 융합신호처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.40-45
    • /
    • 2003
  • 본 연구는 한국어 분절음 인식을 위한 인식 단위 설정과 학습시 학습 데이터 분할 방법에 대한 연구이다 대용량 음성 인식을 수행할 경우, 표준 패턴의 인식 단위를 단어나 음절이 아닌 분절음 단위로 사용하여야 효율적인 음성 인식을 수행할 수 있다. 본 연구는 이와 같은 분절음 인식을 수행하기 위한 연구로서, 인식 단위 설정 변화와 학습시 학습 데이터 분할 방법에 따른 인식 결과를 미국 OGI 연구소의 speech toolkit을 이용하여 검토한다. 인식 단위에 관해서 특히 모음의 경우 철자에 기초한 음소별 인식 단위 설정과 현대어 발음에 기초한 인식 단위 설정을 비교했으며, 그 결과 발음에 기초해 몇 개의 모음을 통합한 경우가 더 우수한 결과를 보였으며, 학습 데이터 분할 방법에 따른 인식 결과는 손으로 분할한 방법이 자동 분할 방법보다 약 2-3%의 인식 향상을 보였다. 또한 인식 단위의 설정에 있어서 독립된 분절음으로 설정한 경우보다 앞, 뒤의 소리의 상황을 고려한 바이폰(bipbone)을 이용할 경우가 5.7%-25.9%의 향상된 인식 결과를 보였다 인식 방법에 있어서는 HMM 만을 이용한 방법보다 신경회로망과 HMM을 결합한 인식 방법이 6.1%-7.5%의 더 좋은 인식률을 나타내었다.

  • PDF