• 제목/요약/키워드: semantic weight

검색결과 71건 처리시간 0.022초

Ranking Translation Word Selection Using a Bilingual Dictionary and WordNet

  • Kim, Kweon-Yang;Park, Se-Young
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.124-129
    • /
    • 2006
  • This parer presents a method of ranking translation word selection for Korean verbs based on lexical knowledge contained in a bilingual Korean-English dictionary and WordNet that are easily obtainable knowledge resources. We focus on deciding which translation of the target word is the most appropriate using the measure of semantic relatedness through the 45 extended relations between possible translations of target word and some indicative clue words that play a role of predicate-arguments in source language text. In order to reduce the weight of application of possibly unwanted senses, we rank the possible word senses for each translation word by measuring semantic similarity between the translation word and its near synonyms. We report an average accuracy of $51\%$ with ten Korean ambiguous verbs. The evaluation suggests that our approach outperforms the default baseline performance and previous works.

STW를 이용한 웹 문서 장르 분류에 관한 연구 (A Research for Web Documents Genre Classification using STW)

  • 고병규;오군석;김판구
    • 정보화연구
    • /
    • 제9권4호
    • /
    • pp.413-422
    • /
    • 2012
  • 웹 문서의 지속적인 증가로 인해 텍스트 기반, Page Rank 등의 방법으로 한 연구들이 증가하고 있다. 특히 웹 문서 내 URL 정보, HTML Tag 정보 등을 활용하는 연구들이 다시 주목을 받고 있다. 따라서 웹 문서 장르 분류를 위해 앞서 언급한 웹 문서 내 특징 요소들을 바탕으로 본 논문에서는 STW(Semantic Term Weight)를 적용하여 웹 문서 장르 분류하는 연구를 기술한다. 웹 문서 장르 분류에 사용되는 데이터 셋은 학습 문서와 테스트 문서로 구성되고, SVM 알고리즘을 사용하여 웹 문서 분류 실험을 수행한다. 학습 과정을 위해 20-Genre-collection corpus 내 1,000여개의 문서를 선정하여 SVM 알고리즘을 통해 학습하였고, 테스트 과정에서 사용된 데이터 셋은 KI-04 corpus를 사용하였다. 테스트 과정 후 STW를 사용한 실험과 STW를 사용하지 않은 실험으로 분류하여 정확도를 측정하였다. 또한 이를 바탕으로 1,212개의 테스트 문서를 분류하였다. 그 결과 STW를 사용한 실험 이 그렇지 않은 실험 보다 약 10.2% 높은 정확도를 보였다.

새로운 N-ary 관계 디자인 기반의 온톨로지 모델을 이용한 문장의미결정 (A Semantic Similarity Decision Using Ontology Model Base On New N-ary Relation Design)

  • 김수경;안기홍;최호진
    • 정보관리학회지
    • /
    • 제25권4호
    • /
    • pp.43-66
    • /
    • 2008
  • 시맨틱 웹 기술의 제안과 더불어 다양한 분야에 온톨로지의 특징을 적용한 기술 개발 연구가 많이 진행되고 있다. 인간이 소유한 개념을 가장 적절하게 표현하기 위해 현재에도 OWL, RDF와 같은 온톨로지 언어의 표현력을 확장시키기 위해 N-ary 관계나 모델-이론 의미론과 같은 개발이 진행되고있다. 본 연구는 한국어에 있어 문장이 내포하는 의미를 정확하게 결정하기 위해 문장의 구조에 따라 달라지는 단어의 의미를 연관할 수 있도록 N-ary 관계와 디자인 기반이 적용된 온톨로지의 지식 표현 방법을 연구하였다. 특히 다양한 지식 영역을 포함하는 다의어(polysemy)와 동의어(synonym)의 특징을 갖는 단어에 있어 각 지식 영역으로 분류되어 각 지식 영역에 있는 유사한 의미를 가진 단어로 확장되어 유사한 의미를 가진 단어가 포함된 문장의 경우 까지도 확장할 수 있는 표현 방법을 연구하였다. 연구의 검증을 위해 사용자가 입력한 병증 문장을 제안된 방법에 따라 구축된 온톨로지내 지식 관계와 의미 결정을 위한 추론 표현 방법을 이용하여 병증의 의미를 결정하고 그에 따른 진단을 제공하는 실험 시스템을 구현하였고, 한국어가 갖고 있는 문장의 유의성, 모호성, 복합성 의 특징을 보유한 증상문들의 실험 결과 의미 결정과 유사 의미 확장에 있어 우수한 성능을 보여주었다.

LOD-기반 추천 시스템에서 LOD 그래프에 가중치를 사용한 의미 거리 측정 모델 (A Semantic Distance Measurement Model using Weights on the LOD Graph in an LOD-based Recommender System)

  • 허원회
    • 한국융합학회논문지
    • /
    • 제12권7호
    • /
    • pp.53-60
    • /
    • 2021
  • LOD-기반 추천 시스템은 보통 DBpedia와 같은 LOD 데이터세트 내에서 사용가능한 데이터를 활용하여 최종 사용자에게 영화, 책, 음악과 같은 아이템을 추천한다. 이러한 시스템은 링크드 데이터 리소스 쌍 간의 일치 정도를 측정하는 의미 유사도 알고리즘을 사용한다. 이 논문에서는 LOD 그래프의 링크에 사용자 평가 등급을 변환한 가중치를 할당하여 LOD-기반 추천 시스템에서 의미 거리를 측정하는 새로운 접근방식을 제안했다. 이 논문에서 제안된 의미 거리 측정 모델은 가중치 계산을 통해 그래프가 사용자에게 개인화되는 처리 단계와 이러한 가중치를 LDSD에 적용하는 방법을 기반으로 한다. 실험 결과는 다른 유사한 방법들과 비교하여 제안된 방법이 더 높은 정확도를 보였으며, 추천 시스템의 의미 거리 측정의 범위를 넓혀서 유사도 향상에 기여하였다. 향후 연구로는 다른 방법의 LOD-기반 유사도 측정을 사용하여 모델에 미치는 영향을 분석하는 것을 목표로 한다.

사전의 뜻풀이말에서 추출한 의미정보에 기반한 동형이의어 중의성 해결 시스템 (A Homonym Disambiguation System based on Semantic Information Extracted from Dictionary Definitions)

  • 허정;옥철영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권9호
    • /
    • pp.688-698
    • /
    • 2001
  • 동형이의어는 문장에서 그와 함께 사용된 체언, 용언에 의해서 그의 의미를 확정지을 수 있다. 본 논문에서는 사전의 뜻풀이말에서 추출한 통계적 의미정보에 기반한 동형이의어 중의성 해결 시스템을 제안한다. 의미정보는 동형이의어를 포함하고 있는 사전의 뜻풀이말에서 체언(보통 명사)와 용언(형용사, 동사)을 추출하여 구성된다. 정확한 의미정보를 추출하기 위해서 사전 뜻풀이말의 유형을 두 가지로 분류하였다. 첫 번째 유형은 의미분별할 동형이의어와 표제어가 의미적으로 상-하의어 관계를 이루고 있는 경우로, 표제어의 뜻풀이말에서 동형이의어가 의미적으로 중심어이다. 이러한 상-하의어 관계는 의미계층 구조가 없는 경우에 활용할 수 있으며, 자료 부족 문제를 해결하기 위한 의미정보의 확장에 유용하다. 두 번째 유형은 동형이의어가 뜻풀이말의 중간에 사용된 경우이다. 본 논문에서 제안하는 동형이의어 중의성 해결 시스템은 체언과 용언 의미정보를 모두 고려한 모델로, 체언과 용언이 동형이의어 중의성 해결에 영향을 주는 정도(가중치)를 결정하기 위하여 9개의 동형이의어 명사를 대상으로 실험하였다. 학습에 이용된 코퍼스(사전 뜻풀이말)로 실험한 결과, 체언과 용언의 가중치가 0.9/0.1일 때 평균 96.11%의 중의성 해결 정확률이 가장 높았다. 또한 제안하는 동형이의어 중의성 해결 시스템의 일반성을 측정하기 위해, 학습되지 않은 외부 데이터 (국어 정보베이스 I과 ETRI 코퍼스 1,796 문장)로 실험한 결과 평균 80.73%의 정화률을 보였다.

  • PDF

문서 내용의 계층화를 이용한 문서 비교 방법 (Document Clustering Methods using Hierarchy of Document Contents)

  • 황명권;배용근;김판구
    • 한국정보통신학회논문지
    • /
    • 제10권12호
    • /
    • pp.2335-2342
    • /
    • 2006
  • 웹의 비약적인 성장으로 웹에는 무수한 정보를 축적하고 있으며, 특히 텍스트 문서는 인간에 의해 가장 쉽게 그리고 많이 이용되는 형식이라 하겠다. 텍스트 문서의 효율적 검색을 위해 많은 연구가 이루어졌으며, 확률을 이용한 방법, 통계적인 기법을 이용한 방법, 벡터 유사도를 이용한 방법, 베이지안 자동문서 분류 방법 등이 제안되었다. 그러나 이러한 기존의 방법들은 문서의 특징을 정확하게 반영할 수 없고, 의미적 검색이 이루어지지 않는 단점을 가지고 있다 이에 본 논문은 문서를 미리 분류하는 기존의 방법을 개선하기 위해, 유사한 문서를 의미적으로 찾아내기 위한 새로운 문서 분류의 척도를 제안하며 이를 적용하는 방법을 제시한다. 본 방법은 문서의 내용을 의미적인 계층으로 표현하고 중요 도메인에 가중치를 두며, 문서들간의 도메인 가중치와 도메인 내의 개념 일치도를 이용하여 유사도를 구한다.

A Korean Homonym Disambiguation System Based on Statistical, Model Using weights

  • Kim, Jun-Su;Lee, Wang-Woo;Kim, Chang-Hwan;Ock, Cheol-young
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 Language, Information, and Computation Proceedings of The 16th Pacific Asia Conference
    • /
    • pp.166-176
    • /
    • 2002
  • A homonym could be disambiguated by another words in the context as nouns, predicates used with the homonym. This paper using semantic information (co-occurrence data) obtained from definitions of part of speech (POS) tagged UMRD-S$^1$), In this research, we have analyzed the result of an experiment on a homonym disambiguation system based on statistical model, to which Bayes'theorem is applied, and suggested a model established of the weight of sense rate and the weight of distance to the adjacent words to improve the accuracy. The result of applying the homonym disambiguation system using semantic information to disambiguating homonyms appearing on the dictionary definition sentences showed average accuracy of 98.32% with regard to the most frequent 200 homonyms. We selected 49 (31 substantives and 18 predicates) out of the 200 homonyms that were used in the experiment, and performed an experiment on 50,703 sentences extracted from Sejong Project tagged corpus (i.e. a corpus of morphologically analyzed words) of 3.5 million words that includes one of the 49 homonyms. The result of experimenting by assigning the weight of sense rate(prior probability) and the weight of distance concerning the 5 words at the front/behind the homonym to be disambiguated showed better accuracy than disambiguation systems based on existing statistical models by 2.93%,

  • PDF

현실요법에 기초한 미술치료 프로그램이 대학생의 체중조절과 신체상 및 자아존중감에 미치는 효과 (The Effect of an Art Therapy Program based on Reality Therapy on Weight Control, Body Image, and Self-esteem of College Students)

  • 김원경;박정희
    • 한국학교보건학회지
    • /
    • 제14권2호
    • /
    • pp.249-268
    • /
    • 2001
  • This study was carried out to identify the effects of an art therapy program based on reality therapy on the weight control, body image, and self-esteem of college students. The program was developed by the authors. The design was a pretest-post test control group design. The subjects were college students attending M college : 8 in experimental group A, 6 in experimental group 2, who wanted to control their body weight and 16 in the control group who didn't attend the program those in the experimental group attended the program once (group A) or twice (group B) per week meeting a total of six times. The data were analyzed by quantity method (SPSS 10.0 program) and quality method(process analysis). The results were as follows : 1. The average obesity index of pre-test, post-test, and a follow-up test decreased from 8.9% to 6.1%, 3.7%. And the rate of decrease both pre-post and post-follow up were statistically significant 2. The average obesity index of group A decreased from 9.6% to 6.3%, 4.1% and the rate of decrease between pre and post were statistically significant. But the rate of decrease between post and follow-up were statistically not significant 3. The average obesity index of group B decreased from 7.8% to 5.8%, 3.1% and the rate of decrease between pre and post were not significant statistically. But the rate of decrease between post and follow-up were statistically significant 4. The average scores of pre and post body image increased and were statistically significant : group A from 129.0 to 153.5, group B from 127.7 to 155.2. 5. The average scores of pre and post semantic differential method increased and were statistically significant: group A from 38.1 to 44.1, group B from 38.0 to 45.0. 6. The average scores of pre and post self-esteem increased: group A increased from 37.3 to 40.3 and were statistically significant, group B increased from 36.5 to 39.5 but was statistically insignificant 7. The average scores of pre and post obesity rate, body image, semantic differential method and self-esteem in the control group were not statistically significant 8. The pre and post scores of body image(p=.001), semantic differential method(p=.001) and self-esteem(p=.039) between experimental and control group were statistically significant. 9. In Duncan multiple comparison, it was not statistically significant between group A and B, but statistically significant between group A and the control group, group B and the control group in obesity index, body image, semantic differential method. There was no statistically significance among the three groups in self esteem 10. In Duncan multiple comparison, group A gained higher scores than group B in obesity index(-1.2%), and self esteem(0. 3). Group B gained higher scores than group A in body image(3. 0), and semantic differential method(1. 0). So it is difficult to conclude whether group A or B is more effective. In conclusion, the art therapy program based on reality therapy was effective in weight the control program of college students: obesity was decreased, the scores of body image and semantic differential method and self-esteem were increased. The scores of group A were increased more than group Band were statistically significant, The time interval was a very important factor in this program. The recommendation is : the validity of this program has to be tested through various subjects and in various areas. And also this program has to be tested in other topics.

  • PDF

주파수 특성 분류를 통한 임팩트 볼 중량충격음의 주관적 평가 (Evaluation of heavy-weight impact sounds generated by impact ball through classification)

  • 김재호;이평직;전진용
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2007년도 춘계학술대회논문집
    • /
    • pp.1142-1146
    • /
    • 2007
  • In this studies, subjective evaluation of heavy-weight floor impact sound through classification was conducted. Heavyweight impact sounds generated by an impact ball were recorded through dummy heads in apartment buildings. The recordings were classified according to the frequency characteristics of the floor impact sounds which are influenced by the floor structure with different boundary conditions and composite materials. The characteristics of the floor impact noise were investigated by paired comparison tests and semantic differential tests. Sound sources for auditory experiment were selected based on the actual noise levels with perceptual level differences. The results showed that roughness and fluctuation strength as well as loudness of the heavy-weight impact noise had a major effect on annoyance.

  • PDF

셀룰라아제 처리된 데님직물의 태에 관한 연구(제1보);주관적인 태 평가를 위한 척도개발 (The Assessment of Hand for Enzyme Hydrolyzed Denim fabrics(Part I))

  • 김경애;이미식;김정희
    • 한국의류학회지
    • /
    • 제23권8호
    • /
    • pp.1139-1148
    • /
    • 1999
  • This paper discussed the assessment of hand of denim fabrics finished by enzymatic hydrolysis. The semantic differential scale established using the database collected from university students. Analyzing the subjective rating by common factor analysis with oblimin rotation five factors expressing the hand were induced. Factor one was the surface property related to the surface roughness or softness Factor two was the durability which was related to the compactness and bearing strength Factor three was the sense of weight which was related to the thickness and weight. The moisture related properties and the sense of shape recovery were the forth and fifth factors respectively. the evaluations on the surface property weight and moisture related properties were similar by men and women However the shape recovery and the durability were evaluated differently. Surface and weight related properties were important factors judging the hand of fabrics by both group.

  • PDF