• 제목/요약/키워드: ambiguous

검색결과 1,036건 처리시간 0.025초

지지벡터기계를 이용한 단어 의미 분류 (Word Sense Classification Using Support Vector Machines)

  • 박준혁;이성욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.563-568
    • /
    • 2016
  • 단어 의미 분별 문제는 문장에서 어떤 단어가 사전에 가지고 있는 여러 가지 의미 중 정확한 의미를 파악하는 문제이다. 우리는 이 문제를 다중 클래스 분류 문제로 간주하고 지지벡터기계를 이용하여 분류한다. 세종 의미 부착 말뭉치에서 추출한 의미 중의성 단어의 문맥 단어를 두 가지 벡터 공간에 표현한다. 첫 번째는 문맥 단어들로 이뤄진 벡터 공간이고 이진 가중치를 사용한다. 두 번째는 문맥 단어의 윈도우 크기에 따라 문맥 단어를 단어 임베딩 모델로 사상한 벡터 공간이다. 실험결과, 문맥 단어 벡터를 사용하였을 때 약 87.0%, 단어 임베딩을 사용하였을 때 약 86.0%의 정확도를 얻었다.

아라비안 숫자를 동반한 중의적 기호의 자동전사: 온점, 쌍점, 빗금을 중심으로 (Automatic Transcription of Three Ambiguous Symbols Used with Arabic Numerals: Period, Colon and Slash.)

  • 윤애선;정영임;권혁철
    • 한국언어정보학회지:언어와정보
    • /
    • 제8권1호
    • /
    • pp.117-136
    • /
    • 2004
  • In this paper, we have proposed Auto- TSS, an automatic transcription module of three ambiguous symbols-period (.), colon (:) and slash (/)--using their linguistic contexts. Few previous studies have discussed the problems of ambiguities in reading those symbols into Korean alphabetic letters in order to improve the current Korean TTS (Text-To-Speech) systems. We have classified 9 different reading formulae of the three symbols, analyzed their left and right contexts, and investigated selection rules and distributions between the symbols and their contexts. Based on these linguistic features, 30 stereotyped patterns, 53 rules and 5 heuristics determining the types of reading formulae are investigated for Auto-TSS. This module works modularly in 4 steps. The pilot test was conducted with three test suites, which contain respectively 6,979, 3,491 and 2,450 morpheme clusters containing at least one of three ambiguous symbols and Arabic numeral(s). Encouraging results of 94.3%, 93.0%, 94.2% accuracy were obtained for the test suites. Our next phases are to develop a guessing routine for unknown contexts of the union symbols by using statistical information; to refine the proper nouns and terminology detecting module; and to apply Auto-TSS on a larger scale.

  • PDF

모호한 패턴 클래스 도입을 통한 기저 세포암 분류기의 신뢰도 향상 (Reliability Improvement of Automatic Basal Cell Carcinoma Classifier with an Ambiguous Pattern Class)

  • 박아론;백성준;정인욱;송민규;나승유
    • 전자공학회논문지CI
    • /
    • 제44권1호
    • /
    • pp.64-70
    • /
    • 2007
  • 라만 분광법은 피부암 진단에 사용되는 매우 유력한 비침습성 진단 방법이다. 라만 스펙트럼을 이용한 이전의 연구에 따르면 MAP (maximum a posteriori probability)와 MLP (multilayer perceptron networks)와 같은 기존의 분류 방법으로도 좋은 분류결과를 얻을 수 있다. 하지만 암 진단은 작은 오류에도 종종 치명적인 결과가 따르기 때문에 본 연구에서는 판정이 모호한 데이터를 따로 집단화하여 분류 오류를 감소하는 방법을 제안한다. 이때 모호한 패턴은 조직검사를 통하여 다시 암여부를 판정하게 된다. 본 논문에서는 모호한 패턴 클래스를 MSE (minimum squared error), MAP와 MLP에 도입하기 위해 기존 알고리듬을 수정하였고 모호한 패턴 클래스가 본래 도입되어 있는 RCE (reduced coulomb energy networks)와 실험결과를 비교하였다. 216개의 공초점 라만 스펙트럼에 대한 실험결과에 의하면 모호한 패턴으로 판정된 데이터를 늘림에 따라 나머지 패턴은 완벽하게 분류할 수 있음을 보였다. 그 중 MSE는 테스트 패턴 중 약 8.8%의 모호한 패턴으로 나머지 패턴에 대하여 완벽한 분류결과를 보였다.

의미 중의성을 고려한 온톨로지 기반 메타데이타의 자동 생성 (Ontology-based Automated Metadata Generation Considering Semantic Ambiguity)

  • 최정화;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권11호
    • /
    • pp.986-998
    • /
    • 2006
  • 인터넷의 발전으로 방대해진 정보를 컴퓨터가 이해하고 효율적으로 관리하기 위해서는 시맨틱 웹 기반의 메타데이타가 반드시 필요하다. 그러나 메타데이타 생성 시 의미 중의성을 가진 정보가 존재하며 이 문제의 해결책이 필요하다. 본 논문에서는 순차적으로 존재할 수 있는 단어들의 확률 모델을 이용하여 문서와 같은 정보에 포함된 의미가 애매한 단어를 관련성이 높은 모델의 개념으로 메타데이타를 생성하는 방법을 제안한다. 제안한 방법에서 메타데이타를 생성 할 때, 온톨로지에 정의된 개념들 간의 중의성을 고려하고 명칭(named entity)의 일부 단어에 대한 인식을 위해 은닉 마르코프 모델(Hidden Markov Model)을 사용한다. 먼저 온톨로지에 정의된 각 클래스(class)의 인스턴스(instance)를 인식하기 위한 마르코프 모델을 생성한다. 다음으로 문서로부터 의미가 애매한 단어의 의미를 파악할 수 있는 상황정보(Context)를 생성하고, 상황정보에 포함된 단어들의 순서에 대응하는 최적의 마르코프 모델을 찾아 메타데이타 생성시의 중의성 문제를 해결한다. 제안한 방법으로 전산학관련 논문에 대해 의미가 애매한 7개의 단어를 추출하여 실험하였다. 그 결과 상황정보에 존재하는 개체(entity)의 의미부류들 중 가장 빈번한 의미 부류로 애매한 단어의 의미를 선정한 SemTag보다 정확도 면에서 38%정도의 나은 성능을 나타내었다.

청소년의 마음이해 능력과 사회적 능력 (Understanding of mind and social skills in adolescents)

  • 최현옥;김혜리
    • 한국심리학회지 : 문화 및 사회문제
    • /
    • 제14권1호
    • /
    • pp.1-18
    • /
    • 2008
  • 본 연구는 청소년기에도 마음이해 능력이 계속 발달하는지, 또 마음이해 능력이 사회적 능력과 관련되는지 알아보기 위해 수행되었다. 초등학교 6학년 60명과 중학교 2학년 60명이 연구에 참여하였다. 마음이해 능력은 2차 순위 틀린 믿음 과제, 애매한 행동 이해하기 과제, 숨은 말뜻 이해하기 과제, 그리고 헛디딤 말 이해하기 과제로 측정하였다. 사회적 능력은 마음이해 관련 사회행동과 마음이해와 무관할 수 있는 관습적 사회행동을 묻는 질문지로 측정하였다. 2차 순위 틀린 믿음과제와 숨은 말뜻 이해하기 과제에서는 두 집단 간의 수행차가 나타나지 않았으나 애매한 행동 이해하기 과제와 헛디딤 말 이해하기 과제에서는 중학생의 수행이 더 높았다. 이는 마음읽기 능력이 청소년기에도 계속 발달하는데, 특히 애매한 행동의 의미를 이해하는 능력과 말하는 이가 상대방에 대한 특정한 사실을 알지 못해 실수로 하는 헛디딤 말이 상대방의 기분을 상하게 한다는 사실을 이해하는 능력이 6학년 이후에도 발달함을 보여준다. 또, 여러 마음이해 과제 중에서, 애매한 행동 이해하기가 사회적 행동을 가장 잘 예측하는 것으로 나타났으며, 마음이해 과제들의 사회적 행동 설명력 또한 크지는 않았지만 유의미한 것으로 나타났다.

  • PDF

모호한 광고와 명료한 광고의 메시지효과 비교 (Comparison of the Ambiguous Advertising Messages Effect with Clear Advertising Messages)

  • 이현우;오창일;조경섭
    • 디자인학연구
    • /
    • 제18권3호
    • /
    • pp.129-138
    • /
    • 2005
  • 메시지의 명확성은 성공적인 커뮤니케이션의 필수적인 요건으로 간주되어 왔다. 그러나 오늘날의 복잡하게 변화된 기업환경 또는 마케팅 상황, 미디어환경에서 때로는 광고 메시지의 명확성이 오히려 커뮤니케이션 효과를 저해하는 경우가 나타나고 있다. 이 연구의 목적은 국민정서에 반하는 요소가 있는 기업이 경영목표 및 사업특성의 변경 등 정체성을 새롭게 정립할 필요가 있을 때 어떤 광고 메기지를 가지고 수용자와 커뮤니케이션 하는 것이 효과적인지를 검토하는 데 있다. 구체적으로, 전략적으로 모호한 메시지를 발신하는 광고전략이 광고에 대한 인지효과와 감정적 대도, 광고에 대한 신뢰성, 기업에 대한 태도 등에 어떠한 효과를 발휘하는지 검증한다. 이를 위하여 모호한 광고 메시지와 명료한 광고 메시지에 있어 감정적 반응, 신뢰도, 광고에 대한 태도, 기업에 대한 태도는 효과면에서 차이가 있을 것이라는 가설을 설정했다. 이를 바탕으로 2003년부터 집행되고 있는 KT&G의 <상상예찬> 캠페인에서 모호한 광고메시지를 대표하는 3점의 텍스트를 체계적으로 표집하여 설문을 통한 실험을 실시했다. 연구 결과, 연구대상 광고텍스트의 모호한 메시지는 주목도의 차원 및 광고에 대한 호감, 긍정성, 기억성, 공감성 등에서 명료한 메시지에 비해 좋은 반응을 얻었다. 또한 호감, 긍정성, 기억성, 공감성 등을 측정한 광고 자체에 대한 태도 면에서도 모호한 메시지가 명료한 메시지에 비해 일정한 효과를 확보하는 것으로 나타났다. 따라서 국민정서에 반하는 요소가 있는 기업의 정체성 변화를 알리는 데에는 명료한 메시지보다 다소 모호한 메시지가 재인과 회상효과의 측면에서 유리할 것이라는 잠정적 결론을 얻었다. 그러나 광고에 대한 정서적 반응과 신뢰도, 기업에 대한 태도 등을 높이는 데에는 모호한 광고메시지가 명료한 광고 메시지에 비해 유리하다는 증거는 찾아볼 수 없었다. 이는 모호한 메시지 속에 숨어있는 암시적 표현코드에 대해 수용자들이 불편한 감정과 불신하는 마음, 부정적 태도를 가지고 있다는 추론으로 연결될 개연성을 높이고 있다. 논리실증적인 방법으로 이루어진 이 실험연구의 통계수치로 밝혀진 사실의 발견에서 결여하기 쉬운 설명력을 보완하기 위해 현상학적 연구 등의 심층적인 조사가 시도될 필요가 있다.

  • PDF

Ambiguous (((Par(t)(it))((ion))(s))(in)) Thai Text

  • Cooper, Doug
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 1996년도 Language, Information and Computation = Selected Papers from the 11th Pacific Asia Conference on Language, Information and Computation, Seoul
    • /
    • pp.109-118
    • /
    • 1996
  • PDF

Prosody in Spoken Language Processing

  • Schafer Amy J.;Jun Sun-Ah
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.7-10
    • /
    • 2000
  • Studies of prosody and sentence processing have demonstrated that prosodic phrasing can exhibit strong effects on processing decisions in English. In this paper, we tested Korean sentence fragments containing syntactically ambiguous Adj-N1-N2 strings in a cross-modal naming task. Four accentual phrasing patterns were tested: (a) the default phrasing pattern, in which each word forms an accentual phrase; (b) a phrasing biased toward N1 modification; (c) a phrasing biased toward complex-NP modification; and (d) a phrasing used with adjective focus. Patterns (b) and (c) are disambiguating phrasings; the other two are commonly found with both interpretations and are thus ambiguous. The results showed that the naming time of items produced in the prosody contradicting the semantic grouping is significantly longer than that produced in either default or supporting prosody, We claim that, as in English, prosodic information in Korean is parsed into a well-formed prosodic representation during the early stages of processing. The partially constructed prosodic representation produces incremental effects on syntactic and semantic processing decisions and is retained in memory to influence reanalysis decisions.

  • PDF