• Title/Summary/Keyword: 의미 구성

검색결과 4,005건 처리시간 0.028초

한국어 확률 의존문법 학습 (Probabilistic Dependency Grammar Induction)

  • 최선화;박혁로
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.513-515
    • /
    • 2003
  • 본 논문에서는 코퍼스를 이용한 확률 의존문법 자동 생성 기술을 다룬다. 의존문법 생성을 위해 구성성분의 기능어들 간의 의존관계를 학습했던 기존 연구와는 달리. 한국어 구성성분은 내용어와 기능어의 결함 형태로 구성되고 임의 구성성룬 기능어와 임의 구성성분 내용어간의 의존관계가 의미가 있다는 사실을 반영한 의존문법 학습방법을 제안한다. KAIST의 트리 부착 코퍼스 31,086문장에서 추출한 30,600문장의 Tagged Corpus을 가지고 학습한 결과 초기문법을 64%까지 줄인 1.101 개의 의존문법을 획득했고. 실험문장 486문장을 Parsing한 결과 73.81%의 Parsing 정확도를 보였다.

  • PDF

Semantic Hypernetwork 학습에 의한 자연언어 텍스트의 의미 구분 (Scaling Documents' Semantic Transparency Spectrum with Semantic Hypernetwork)

  • 이은석;김준식;신원진;박찬훈;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.289-294
    • /
    • 2008
  • 어떤 자연언어 문서가 전달하려는 의미는 그 텍스트의 성격에 따라 아주 명확할 수도(예: 뉴스 문서), 아주 불분명할 수도 있다(예: 시). 이 연구는 이러한 '의미의 명확성(semantic transparency)'을 정량적으로 측정할 수 있다고 가정하고, 이 의미의 명확성을 판단하는 데에 단어들의 연쇄(word association)의 확률통계적 성질들이 어떻게 기능하는지에 대해 논한다. 이를 위해 특정 단어가 연쇄체를 형성하면서 발생하는 neighboring frequency와 degeneracy를 중심으로 Markov chain Monte Carlo scheme을 적용하여 의미망('Semantic Hypernetwork')으로 학습시킨 후 문서의 구성 단어들과 그 집합들 간의 연결 상태를 파악하였다. 우리는 의미적으로 그 표상이 분명하게 나뉘는 문서들(뉴스와 시)을 대상으로 이 모델이 어떻게 이들의 의미적 명확성을 분류하는지 분석하였다. Neighboring frequency와 degeneracy, 이 두 속성이 언어구조에서의 의미망 기억과 학습 탐색 기제에 유의한 기질로서 제안될 수 있다. 본 연구의 주요 결과로 1) 텍스트의 의미론적 투명성을 구별하는 통계적 증거와, 2) 문서의 의미구조에 대한 새로운 기질 발견, 3) 기존의 문서의 카테고리 별 분류와는 다른 방식의 분류 방식 제안을 들 수 있다.

  • PDF

'유(游)'의 원리로 구성되는 화의(畵意)의 구조 연구 서설 - 『도화견문지(圖畵見聞誌)』, 『임천고치(林泉高致)』를 중심으로 - (The structure of knowledge intended to 'you(游)': case on the 『Dohwaguenmungi』 and 『Limchungochi』)

  • 손보미
    • 동양고전연구
    • /
    • 제41호
    • /
    • pp.445-476
    • /
    • 2010
  • 이 글은 북송대(北宋代) 문인화(文人畵) 이론을 밝힌 "도화견문지(圖畵見聞誌)"와 "임천고치(林泉高致)"에서 화의(畵意)의 구조와 구성 원리를 분석하여, 예술적 독창성이 산출되는 구조를 살펴보는 것이 목적이다. 따라서 화의(畵意)의 구조와 구성 원리를 찾기 위하여 주요개념을 분석하고 의미를 관련시키는 것으로 이루어졌다. 지식인 화가가 화의(畵意)를 구성하는 것은 앎을 구성하는 것에 해당하였으며, "도화견문지"의 경우 유심(游心)의 '유(游)', "임천고치"의 경우 포유어간(飽游?看)의 '유(游)'가 화의(畵意)[앎]를 구성하는 원리로 기능한다는 것을 알 수 있었다. 화가의 마음이 '유(游)'의 원리로 구성하는 화의(畵意)는 "도화견문지"의 경우 물(物)에서 관찰과 궁리(窮理)로 정사(情思)를 구성하는 구조이고, "임천고치"의 경우 물(物)에서 흥(興)을 타고 입의(立意)하여 의사(意思)를 구성하는 구조로, 마음이 구성한 정사(情思)와 의사(意思)가 화의(畵意)에 해당하였다. 그리고 "도화견문지"의 경우 관찰과 궁리(窮理)단계, "임천고치"의 경우 흥(興)을 타는 입의 단계에서 지각작용을 기초로 화가는 주체적으로 새로운 내용을 구성하고 추가하여 화의(畵意)를 구성한다. 또한 화의(畵意)가 심미적 개별성과 예술적 독창성을 담보하게 하는 동인(動因)은 정(精)으로, 화가의 역량이라는 측면에서 살펴보면, "도화견문지"에서 정(精)은 기운생동(氣韻生動)의 경계를 얻는 역량을 의미하고, "임천고치"에서 정(精)은 사리(事理)를 분별하고 선택하는 역량을 의미한다는 것도 알 수 있었다. 이상으로, 두 화론의 창작원리는 회화예술 자체의 논리와 앎을 탐구하는 방향에 근거하고 있었음을 확인할 수 있었는데, 이는 송학(宋學)에서 주자학(朱子學)으로 이어지는 성리학(性理學)이 경전과 성인의 말씀을 모범으로 삼아 그것을 반복하는 앎의 방향을 추구한 것과는 분명한 차이를 가진다. 이글은 北宋의 지식인 화가들이 화의(畵意)를 구성하는 '유(游)'의 원리는 세계를 인식하는 한 가지 원리로 기능하였다는 것을 적극적으로 논의한 연구로서 의의를 가지며 이어지는 연구의 토대로 삼고자 한다.

시멘틱 검색 엔진 설계 및 구현 (A Design and Implementation of the Semantic Search Engine)

  • 허선영;김은경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.331-335
    • /
    • 2008
  • 시맨틱 웹은 정보의 의미를 개념으로 정의하고 개념들 간의 관계성을 표현함으로써, 문서들 간의 단순 연결이 아닌 의미 연결을 통해서 보다 정확하고 효율적인 정보 검색이 가능하게 된다. 이러한 시맨틱 웹의 비전이 구체화되기 위해서는 웹 온톨로지(Web Ontology)를 기반으로 의미 정보로 구성된 시맨틱 문서들에 대한 추론을 통해서 웹상에 존재하는 엄청난 정보들 간의 관련성을 파악하고 사용자가 요구하는 정보를 보다 효율적으로 검색할 수 있는 시스템이 필수적이다. W3C에서 제안한 OWL은 대표적인 온톨로지 언어이다. 시맨틱 웹 상에서 OWL 데이타를 효율적으로 검색하기 위해서는 잘 구성되어진 저장 스키마를 구축해야 한다. 본 논문에서는 Jena2의 경우, 단일 테이블에 문서의 정보를 저장하기 때문에 단순 선택 연산 (Simple Selection), 조인 연산이 요구되는 질의에 대한 성능이 저하되고 대용량의 OWL데이터의 처리에 있어 성능이 저하되는 문제를 해결하기 위하여 본 논문에서는 OWL 문서의 의미를 Class, Property, Individual로 분류하여 각각의 데이터 정보들을 테이블에 저장하기 위한 다중 변환기와 OWL 변환기 기능을 가진 시멘텍 검색 엔진을 설계 및 구현하였다. 본 검색 엔진을 테스트한 결과, 단순정보검색 질의 시 Jena2에서 비정규화된 테이블 구조로 저장할 때보다 질의 응답 속도를 향상 시킬 수 있었고, 조인 연산 시 두 테이블의 크기로 인한 조인비용이 발생하는 문제점을 해결함으로써 빠른 검색 및 질의 속도를 보장할 수 있었다.

  • PDF

한국어 관계관형절의 전산처리 (Processing Korean Relative Adnominal Clauses)

  • 홍정하;이기용
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.265-271
    • /
    • 1999
  • 이 논문은 한국어 관계관형절(relative adnominal clause)의 전산처리에 적합한 통사 의미 표상 모형을 제시하고, 그 결과를 전산적 구현을 통해서 검증하는 것이 목적이다. 이를 위해 이 논문에서는 다음의 두 가지 문제를 중심으로 관계관형절의 통사 의미 표상과 전산적 구현 문제를 다룬다. 첫째, 관계관형절의 수식을 받는 머리 명사(head noun)는 관계관형절과 모문(matrix sentence)에서 각각 다른 의미역할을 하는 논항이다. 즉, 하나의 논항이 두 개의 의미역을 표상한다. 이 논문의 첫째 과제는 이러한 관계관형절 구문에서 머리 명사의 이중의미역을 표상하는 방법을 모색하는 것이다. 둘째, 관계관형절이 일항술어로 구성될 때, 서술어 단독으로 머리 명사를 수식할 수 있을 뿐만 아니라, 주격중출 구문을 관계화하여 미리 명사를 수식할 수도 있다. 그러나 모든 일항술어가 주격중출 구문을 구성할 수 있는 것은 아니기 때문에 주격중출 구문의 관계화가 가능한 경우와 그렇지 않은 경우를 구별할 필요가 있다. 이 논문의 둘째 과제는 이러한 주격중출 구문의 관계화와 그 표상의 문제를 다루는 것이다. 이 논문에서는 이러한 문제들을 단순히 기술하는 데 그치지 않고 전산 구현을 통해 문제해결을 제시한다. 이를 위해 구현 도구로 C-언어를 보강하여 개발한 문법개발 도구언어인 말라가(Malaga)를 사용하며, 분석결과를 자질구조(feature structure)로 명시하여 그 타당성을 검토한다.

  • PDF

통합수자원관리 기법 연구 (Study on Technology for Integrated Water Resources Management)

  • 김승;심규철;김학수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2005년도 학술발표회 논문집
    • /
    • pp.487-491
    • /
    • 2005
  • 오늘날 우리들이 직면하고 있는 물에 대한 주요 이슈는 인간과 환경의 요구를 동시에 충족시킬 수 있는 효율적 관리방안의 모색으로 볼 수 있고, 물관리의 위기를 극복하는 가장 효율적인 방법은 물관리 기술을 발전시켜 좀더 효율적으로 물을 이용하는 것이다. 통합수자원관리는 이러한 요구조건을 충족시켜줄 수 있는 대안으로 자국 혹은 유역 현실에 적합한 통합수자원관리 계획수립을 바탕으로 통합수자원관리시스템을 구성함으로써 구현되어질 수 있다. 통합수자원관리는 정책수행과정의 포괄적 의미와 시스템 구성요소에 입각한 협의적 의미로 정의되어질 수 있다. 그러나 통합수자원관리는 다차원적 요소(인문, 사회, 환경, 경제, 제도 등)를 포함함으로 인해 그 절차가 복잡하며, 국가별 유역별 상황에 맞추어 다양한 형태로 계획$\cdot$이행되어질 필요가 있다. 이를 위하여 통합수자원관리 계획수립 시 상존하는 구성요소의 다양성과 상충적 이해요소를 반영할 수 있는 전략으로 한국형 통합수자원관리 계획 기법수립을 위한 연구회 설립방안을 마련하였다.

  • PDF

코퍼스로부터 형태소 분석을 위한 사전 구성 (A Dictionay Composition for Morphological Analyzer from Corpus)

  • 정민수;정규철;조원홍
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.316-320
    • /
    • 1998
  • 한국어나 일본어처럼 문법형태소의 기능에 의해 단어의 통사적, 의미적 역할이 결정되는 교착어에서는 형태소 분석이 통사 분석과 의미 분석에 미치는 영향이 크기 때문에 한국어의 분석에 있어서 형태소 분석은 아주 중요하다. 관형적 표현이 많은 한글은 문법 규칙만으론 분석하기가 쉽지 않고, 분기가 많이 생성되므로 오류가 발생할 확률도 높다. 이러한 문제점을 해결하기 위해 본 논문에선 사전을 중심으로 해결하고자 한다. 그러기 위해선 방대한 용량의 사전이 필요로 하게 되고 이를 구축하기 위한 시간과 노력이 요구되므로 이미 구성된 코퍼스를 이용해 사전을 구성하여 많은 시간과 노력을 줄일 수 있도록 한다. 그리고 생성되는 많은 분기 가운데 올바른 경로를 찾아 가기 위해 코퍼스내의 각 태그 결합정보를 추출하고 추출한 결합정보의 통계정보-코퍼스내에서 사용된 빈도수-포함하여 우선순위를 정하도록 한다.

  • PDF

웹기반 온라인 토론에서 외향성과 내향성 (Extroversion and Introversion in Web-Based On line Discussion)

  • 강오한;류수영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.697-699
    • /
    • 2002
  • 본 논문에서는 웹기반 실시간 온라인 토론에서 집단구성을 내향성 집단, 외향성 집단 내향성/외향성 혼합집단으로 분류하고 집단구성방식이 토론 내용에 어떤 영향을 미치는지 연구하였다. 이를 위하여 학습자를 대상으로 MBTI(Myers Briggs Type Indicator) 성격유형 검사를 실시하고 온라인 토론을 수행한 후, 토론 내용을 Henri의 메시지 분석 모친에 기초한 지표를 기준으로 각 차원별 의미단위로 분석하였다. 그 차원들 중 사회적 차원과 상호작용적 차원을 토론 내용의 상호의존성으로, 인지적 차원과 메타 인지적 차원을 토론 내용의 과제관련성으로 범주화하였다. 실험 결과에 따르면 토론 내용의 총 의미단위 수, 상호의존성, 과세관련성 모두에서 이질적으로 구성된 내향성/외향성 혼합집단이 가장 긍정적인 영향을 미친 것을 확인하였다.

  • PDF

국내 언론매체의 이념성향과 뉴스구성에 대한 연구 : 미 대선 후보 '버니 샌더스' 관련 보도의 의미연결망 분석을 중심으로 (A Study on Ideological Orientation and the Construction of News about Korean News Media : Focused on a Semantic Network Analysis for Articles about 'Bernie Sanders')

  • 이혜미;김혜영;유승호
    • 한국콘텐츠학회논문지
    • /
    • 제16권8호
    • /
    • pp.180-191
    • /
    • 2016
  • 본 연구는 국내 주요언론이 이념성향에 따라 보도 프레임을 달리할 것이라는 가정 하에 미국 대선 후보 주자였던 '버니 샌더스'를 대상으로 뉴스보도의 의미연결망을 분석하였다. 버니 샌더스라는 인물은 '미국'이라는 보수의 가치와 '불평등 해소'라는 진보의 가치를 동시에 지닌 인물이이서 언론의 이념적 차이가 잘 드러날 수 있는 대상이기도 하다. 보수언론과 진보언론의 빈도순위를 비교해 본 결과, 보수언론은 '사회주의자'와 '흑인'이라는 단어를, 진보언론은 '불평등'과 '문제'라는 단어를 많이 사용한 것으로 나타났다. 특히 보수언론과 진보언론은 '한국'이라는 동일한 단어를 가지고 전혀 다른 의미구성을 보였다. 진보언론은 샌더스가 지적하는 사회문제와 기성정치에 대한 비판을 '한국'사회에 접목하여 이야기하고자 했다면, 보수언론은 '한국'이라는 단어와 구체적인 정당, 그리고 정치인의 이름을 거론해 샌더스와 닮았다고 한 발언에 대해 노골적인 표현으로 비난했다. 이는 동일한 단어를 사용함에도 전혀 다른 관점과 맥락에서 보도하는 경향성을 파악한 것으로, 사안에 대한 언론사의 의미구성이 이념적 지향에 따라 확연한 차이를 보인다는 것을 알 수 있다. 또한 본 연구는 의미연결망 분석을 통해 주요 단어들의 사용빈도 뿐만 아니라 단어들 간의 연결 강도와 중심성을 토대로 뉴스구성의 맥락을 해석했다는 점에서 보도분석을 위한 방법론의 확장에도 기여하고자 하였다.

한국 신문 속 명명하기의 수사학: 승부수 언어(ultimate term)로서의 '국론 분열'의 사회구성적 의미 (A Rhetoric of Naming in Korean Newspapers: A Socio-Constructive Meaning of the 'Split of National Opinion' As an Ultimate Term)

  • 남궁은정;신성진;이인희
    • 한국언론정보학보
    • /
    • 제43권
    • /
    • pp.314-358
    • /
    • 2008
  • 신문에서는 사회의 커다란 갈등이 생겼을 시 '국론분열'이라는 표현을 사용한다. 하지만 이 말은 매체 속에서 사회적으로 특정한 의미를 구성하고 있는 사회맥락적인 언어이다. 본 논문에서는 우리 사회에서 '국론 분열'이라는 표현이 함축하고 있는 의미는 무엇이며 이것이 우리 사회에서 맡고 있는 역할은 무엇인지를 살펴보았다. 특히 이 단어가 특정한 상황을 명명하고 있으며, 그중에서도 특히 사회 내의 최고 위계를 갖는 사회적 단어인 승부수 언어라는 점에서 '국론 분열'의 쓰임을 분석하였다. 연구대상으로는 세계, 중앙, 문화, 동아, 서울, 국민, 한국, 경향, 조선, 한겨레 등 총 10개의 주요 일간지를 선정하였다. 그리고 각 신문에서 나타나는 '국론 분열'이라는 단어의 텍스트적 의미를 밝히기 위해 은유와 등치된 단어들의 빈도를 살펴보았다. 그리고 사회적 맥락속에서 구성되는 의미를 알아보기 위해 각 신문에서 지칭한 '국론 분열'적 사건과 '국론분열'의 주체를 찾아 빈도를 측정하였다. 결과는 다음과 같다. 첫째 '국론 분열'은 병, 재앙, 비용의 은유로 주로 표현되고 있었으며, 이에 대한 태도나 제시하는 대처행동은 부정적이면서 수동적이었다. 둘째 '국론 분열'은 국정, 국가적 손실, 사회문제, 이념 등과 같은 단어들과 같은 위계를 가지고 있었다. 셋째 '국론 분열'적 사건과 '국론 분열'의 주체는 각 신문사마다 각기 다르게 지칭되어 신문사에 따라 승부수 언어를 다르게 의미 구성하고 있음을 알 수 있었다. 그리고 이러한 승부수 언어는 참여자들과 기존 행위자간의 권력 불균형을 만들고 일부 개인이나 집단을 배제시킨다는 점에서 수사적 힘을 갖게 된다는 논의 또한 이뤄졌다.

  • PDF