• 제목/요약/키워드: 언어적 유추

검색결과 42건 처리시간 0.023초

계산주의적 모델을 이용한 한국어 어휘습득 모텔 설계 및 구현 (Design and Implementation of Korean Lexical Acquistion Model using Computational Model)

  • 유원희;박기남;류기곤;임희석
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2007년도 춘계학술발표논문집
    • /
    • pp.230-232
    • /
    • 2007
  • 본 논문은 인간의 언어정보처리과정 중 초기 어휘획득(lexical acquisition) 과정을 한국어에 적용시켜 Full-List 모형과 Decomposition 모형의 하이브리드한 형태의 계산주의적 (computational) 어휘정보처리 모델을 구현하고 실험하였다. 실험결과 학습을 통한 언어적 입력의 인간의 어휘획득 과정을 모사(simulate) 할 수 있었고, 특정 문법범주 습득 순서에 대한 이론적 근간을 제시할 수 있었다. 또한 본 연구의 모델에서 자동으로 생성된 Full-List 사전과 Decomposition 사전을 통해 인간의 대뇌 심성표상(mental representation) 형태를 유추할 수 있는 증거를 보였다.

  • PDF

토픽-코멘트 구조에 기반한 한국어 표층 생성기 (Korean Surface Realizer Based on Topic-Comment Structure)

  • 김정은;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.503-508
    • /
    • 2001
  • 본 논문은 자연언어생성 기술을 이용하여 질병에 대한 기술문을 생성해 내는 시스템에서 사용되는 표층 생성기에 대해서 다루고 있다. 표층 생성기는 문장의 추상적인 표현으로부터 통사적으로, 형태론적으로 올바른 텍스트로 생성하여 내는 것을 목표로 한다. 질병에 관한 기술문에 있는 문장들은 두가지 특징을 가지고 있다. 첫번째로, 질병 기술문의 문장들은 토픽-코멘트 구조로 나타내어질 수 있다. 두번째로, 같은 의미 범주에 속하는 문장들은 같은 토픽을 가진다. 따라서, 토픽은 의미범주로부터 유추될 수 있으므로 표층 생성기의 입력인 구 명세 (phrase specification)에 표현될 필요가 없다. 본 논문에서는 이런 특징을 이용하여 효율적인 표층 생성기를 만들기 위하여 표층 생성의 단계를 내부 표현 생성과 외부 문장 생성의 두 단계로 나누었다. 내부 표현 생성 단계에서는 코멘트에 해당하는 부분을 생성하고 외부 문장 생성 단계에서 의미범주 태그에 따라 토픽을 첨가하여 최종 문장으로 생성하였다. 이런 방법으로 실험한 결과, 본 표층 생성기는 문법에 맞으면서 자연스러운 텍스트를 생성해 낸다는 것을 알 수 있었다.

  • PDF

빌헬름 폰 훔볼트의 언어사상 (W. v. Humboldt′s Thought)

  • 안정오
    • 인문언어
    • /
    • 제6권
    • /
    • pp.77-108
    • /
    • 2004
  • 훔볼트의 언어관을 테마별로 요약하면 다음과 같이 도표로 나타낼 수 있다. 언어생성 : 언어원형 \$\longrightarrow$ 에네르게이아, 내적언어형식 \$\longrightarrow$ 유추와 통합 \$\longrightarrow$ 언어본질 사회성/화용성 \$\longrightarrow$ 언어적 세계관 =민족 \$\longrightarrow$ 번역의 문제 \$\longrightarrow$ 언어와 사고 훔볼트에서 언어문제는 먼저 생성문제로부터 출발해야 한다. 그의 생성관을 이해할 때 언어의 본질이 이해되고 그리고 언어의 생성과정을 통하여 문법과 하드웨어적인 언어형태를 이해할 수 있다. 그리고 나서 그 언어의 사용처인 사회와의 관계를 조망하면서 민족의 필요성과 언어의 화용성이 동시에 풀리게 된다. 각기 다른 민족의 언어는 다른 세계관을 형성하는데 그 세계관이 즉 민족이다. 이렇게 언어는 상이한 환경과 문화에서 생성 발전됨으로 각각 다른 현상은 음의 현상이나 외관의 현상이 아니고 세계관의 상이성에서 기인하므로 절대 서로 서로 완전한 번역을 불가능하다. 이런 언어는 결국에는 민족의 언어를 통해 개인으로 넘어가고 개인은 각각 자신만의 언어를 가지게된다. 그래서 훔볼트가 말하는 개별성과 보편성의 문제에서 민족마다의 차이점을 그는 개별성으로 이해하기도 하지만 실은 각 개인의 개별성의 의미도 포함하고 있다.

  • PDF

행위성/비대격성 동사의 연쇄 (Serialization of Verbs wi th Activity/Unaccusativity)

  • 김층명;이정민
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.290-296
    • /
    • 1995
  • 본고는 한국어에 나타나는 동사의 연쇄현상(serialization in verbals)에 있어서 단일절(mono-clausal)내에서 소위 복합동사(compound verb)라 불리는 일련의 동사들의 결합 현상을 고찰한다. 연결사(linker/connective)를 매개로 서로 결합하는 동사 연쇄증에는, 일반적으로 동사하나가 하나의 사건을 나타내는데 비해 2개 이상의 동사가 배열됨에도 동시에 일어나 묶여질 수 있는 하나의 사건(single event)을 지칭하는 동사부류가 존재하는데, 이를 통해 동사 결합간 긴밀성을 우선적으로 유추할 수 있고, 역으로 통사적 현상에 의해 그 긴밀성이 확인된다는 점에서 문장 접속의 통어적 구성과는 다른 문법범주 형성을 뒷받침하는 개념적 근거가 된다. 여기에서는, 이러한 연속동사구성(연쇄동사)에 있어 행위성/비대격성을 지니는 동사들간의 연쇄현상을 제약하는 여러 원인들을 검토하고 아울러 이들의 의미적 범주선택을 고려한 거르개로서의 생성여과 규약을 제안한다.

  • PDF

소속함수 수정 알고리즘에 의한 퍼지 제어의 성능 향상 (Performance Improvement of the FLC by Membership Function Modification Algorithm)

  • 최완규;정문재
    • 정보처리학회논문지B
    • /
    • 제8B권2호
    • /
    • pp.123-129
    • /
    • 2001
  • 본 연구에서는 전문가와 운전자의 제어 지식을 더 정확하게 표현하여 퍼지 논리 제어기의 성능을 향상시킬 수 있는 소속함수 수정 알고리즘을 제안한다. 제안된 알고리즘은 제어지식을 더 정확히 표현할 수 있도록 직관적인 지식과 경험으로부터 유추된 대략적인 제어지식을 평가기준으로 하고 입출력 데이터 클러스터링에 의해 소속함수의 형태와 위치를 수정한다. 제안된 방법을 수위 조절 모델과 교통신호 제어 모델에 적용한 실험을 통해서, 제안된 알고리즘이 기존 제어기의 성능을 향상시킬 수 있고, 퍼지 제어기에서 언어적 변수에 대한 구간 설정의 어려움을 해결할 수 있음을 알 수 있었다.

  • PDF

사상의학(四象醫學) 장부론(臟腑論)의 현대적 접근과 퇴행성질환의 조건 (Modern approach of the discourse on viscera and bowels and retrogressive disorder)

  • 조황성
    • 사상체질의학회지
    • /
    • 제12권1호
    • /
    • pp.84-100
    • /
    • 2000
  • 1. 연구목적 "동의수세보원"의 장부론은 사상의학의 생리론에 해당된다. 이에 대한 현대적 접근은 철학적-관념적 언어로 구성된 사상의학의 표현을 오늘의 시각에서 어떻게 접근하고 해석하여야 하는가 하는 문제와, 더 나아가 생화학적-유전적 측면에서 체질의 객관화 지표선정을 위하여 매우 필요한 일이다. 2. 연구방법 사상의학 장부론에 나오는 용어 및 이론을 현대생리의 입장에서 어떻게 접근될 수 있는 가를 뇌의 기능, 신경계, 내분비계 등의 이론과 연계하여 전개하였다. 3. 연구결과 및 결론 1) 장부론의 현대적 접근<표2> 1. 사부지력(四腑之力)은 구강, 위, 십이지장, 노장, 대장의 소화액, 소화효소 등을 포함한 기능으로 사려된다. 2. 진고유액(津膏油液)의 유추<표3>-탄수화물, 단백질, 지방, 무기질 비타민 수분대사를 상징하는 것으로 가정할 수 있다. 3. 진고유액지해(津膏油液之海)의 유추<표3>-흡수된 영양분(진고유액(津膏油液))이 호르몬(막혈정(膜血精))으로 이용되는 전(前)단계의 물질집단이며 뇌기능에서 사용될 전구물질이라 할 수 있다. 4. 폐비간신지용(肺脾肝腎之用)의 유추<표4><표5>-자율신경계의 조절기능과 같다. 폐비간신지력(肺脾肝腎之力)인 애노희락지기(哀怒喜樂之氣)(정기(情氣))의 흥분과 이완이란 곧 교감-부교감신경계의 작용과 유사하다. 5. 막혈정지해(膜血精之海)의 청즙(淸汁)의 유추<표7>-진고유액(津膏油液)의 대사에 영향을 주는 호르몬으로 이는 각각 포도당 단백질 지방 및 기타 무기염류 등의 대사 조절에 직간접적으로 관여하는 호르몬으로 추정된다. 6. 청시후미지력(聽視嗅味之力)의 유추<표6><표7>-뇌의 지적(知的)반경을 포괄하는 의미로 이해된다. 7. 신기혈정(神氣血精)의 기능 유추<표7>-진고유액지해(津膏油液之海)의 청기(淸氣)가 뇌의 기능에 의한 전신발현을 의미한다. 8. 니막혈정의 기능 유추<표7>-인체기능 조절자로서의 기능과 피근육골(皮筋肉骨) 생산자로서의 기능은 호르몬의 역할과 유사하다. 9. 두수요족지력(頭手腰足之力)의 유추<표8>-신체의 감각과 운동기능을 주관하는 동시에 니막혈정지해의 탁재를 원료로 피근육골(皮筋肉骨)을 형성한다고 볼 수 있다. 10. 진고유액지해(津膏油液之海)의 탁재(濁滓)와 막혈정지해(膜血精之海)의 탁재(濁滓)의 유추<표9> (1) 진고유액지해(津膏油液之海)의 탁재(濁滓)는 오로지 사부(四腑)를 활성화하는 물질이다(아밀라제와 뮤신 등...) (2) 니막혈정지해의 탁재(濁滓)는 콜라겐(대표적 구조단백질)처럼 반감기가 길어 장기간 몸속에 존재하여 구조(構造)를 결정하는데 사용되는 물질을 탁재(濁滓)라 하였다. 11. 이목비구지력(耳目鼻口之力)과 폐비간신지력(肺脾肝腎之力)의 상호관계<표13 참조>-neuroendoctrine system이란 의미와 같으며 이들의 상호관계 역시 생리적 통합(Psysiological intergration)을 통하여 성장, 성숙 및 생식을 조절한다고 볼 수 있다. 12. 피근육골(皮筋肉骨)의 현대적 해석 유추 - 피근육골(皮筋肉骨)은 조직학적으로 다음과 같이 가정할 수 있다<표10>. 13. 이상과 같이 체질의 특성이란 영양대사-뇌의 기능-인체조직의 형성-장부생리기능의 차별성으로 나타나므로 체질객관화에 대한 지표를 예측 가능하다. 2) 퇴행성질환의 조건 l. 퇴행성질환의 생리원인(生理原因) 및 치법(治法) (1) 직접적으로는 이목비구지용(耳目鼻口之用)(대뇌의 전달물질)에 의함 (2) 간접적으로는 자율신경계(肺脾肝腎之用)의 영향 (3) 두수요족지력(頭手腰足之力)(감각-운동계)의 영향 ${\Rightarrow}$ 두수요족지력(頭手腰足之力)의 단련(鍛鍊).

  • PDF

차원감소 단어벡터 시각화를 통한 어휘별 관계 분석 (Analysis of Vocabulary Relations by Dimensional Reduction for Word Vectors Visualization)

  • 고광호;백주련
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.13-16
    • /
    • 2022
  • LSTM과 같은 딥러닝 기법을 이용해 언어모델을 얻는 과정에서 일종의 부산물로 학습 대상인 말뭉치를 구성하는 어휘의 단어벡터를 얻을 수 있다. 단어벡터의 차원을 2차원으로 감소시킨 후 이를 평면에 도시하면 대상 문장/문서의 핵심 어휘 사이의 상대적인 거리와 각도 등을 직관적으로 확인할 수 있다. 본 연구에서는 기형도의 시(詩)을 중심으로 특정 작품을 선정한 후 시를 구성하는 핵심 어휘들의 차원 감소된 단어벡터를 2D 평면에 도시하여, 단어벡터를 얻기 위한 텍스트 전처리 방식에 따라 그 거리/각도가 달라지는 양상을 분석해 보았다. 어휘 사이의 거리에 의해 군집/분류의 결과가 달라질 수 있고, 각도에 의해 유사도/유추 연산의 결과가 달라질 수 있으므로, 평면상에서 핵심 어휘들의 상대적인 거리/각도의 직관적 확인을 통해 군집/분류작업과 유사도 추천/유추 등의 작업 결과의 양상 변화를 확인할 수 있었다. 이상의 결과를 통해, 영화 추천/리뷰나 문학작품과 같이 단어 하나하나의 배치에 따라 그 분위기와 정동이 달라지는 분야의 경우 텍스트 전처리에 따른 거리/각도 변화를 미리 직관적으로 확인한다면 분류/유사도 추천과 같은 작업을 좀 더 정밀하게 수행할 수 있을 것으로 판단된다.

  • PDF

의미적 계층정보를 반영한 단어의 분산 표현 (Distributed Representation of Words with Semantic Hierarchical Information)

  • 김민호;최성기;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.941-944
    • /
    • 2017
  • 심층 학습에 기반을 둔 통계적 언어모형에서 가장 중요한 작업은 단어의 분산 표현(Distributed Representation)이다. 단어의 분산 표현은 단어 자체가 가지는 의미를 다차원 공간에서 벡터로 표현하는 것으로서, 워드 임베딩(word embedding)이라고도 한다. 워드 임베딩을 이용한 심층 학습 기반 통계적 언어모형은 전통적인 통계적 언어모형과 비교하여 성능이 우수한 것으로 알려져 있다. 그러나 워드 임베딩 역시 자료 부족분제에서 벗어날 수 없다. 특히 학습데이터에 나타나지 않은 단어(unknown word)를 처리하는 것이 중요하다. 본 논문에서는 고품질 한국어 워드 임베딩을 위하여 단어의 의미적 계층정보를 이용한 워드 임베딩 방법을 제안한다. 기존연구에서 제안한 워드 임베딩 방법을 그대로 활용하되, 학습 단계에서 목적함수가 입력 단어의 하위어, 동의어를 반영하여 계산될 수 있도록 수정함으로써 단어의 의미적 계층청보를 반영할 수 있다. 본 논문에서 제안한 워드 임베딩 방법을 통해 생성된 단어 벡터의 유추검사(analog reasoning) 결과, 기존 방법보다 5%가 증가한 47.90%를 달성할 수 있었다.

세종 말뭉치로부터 용언연어 추출 (Verbal Collocation Extraction from Sejong Tagged Corpus)

  • 이정태;천민아;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.121-123
    • /
    • 2015
  • 연어는 둘 이상의 단어로 구성된 표현으로 연어에 속하는 개개의 단어의 의미로써 연어의 의미를 유추할 수 없다. 따라서 연어의 의미를 분석하거나 번역할 경우 개개의 단어보다는 연어 그 자체를 하나의 분석 단위로 간주하는 것이 훨씬 더 효과적이다. 이를 위해 본 논문에서는 통계기법을 활용하여 세종 말뭉치로 부터 용언연어의 추출 방법을 제시하고 그 성능을 평가한다. 연어 패턴과 통계 정보를 이용해서 연어를 추출한다. 평가를 위해서 연어 사전과 전문가의 주관적 평가를 동시에 수행했다.

  • PDF

수식 관계를 이용한 검색 결과 랭킹 시스템과 향상된 검색 엔진 인터페이스를 통한 검색 과정의 효율성 향상 (Search Ranking System Using Modification Relation and Improved Search Engine Interface to Enhance Search Experience)

  • 문욱성;최주원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.250-253
    • /
    • 2007
  • 본 논문에서는 현재 검색 엔진의 랭킹 방식의 문제점과 인터페이스의 문제점을 해결하기 위하여 노력하였다. 기존의 페이지간 링크와 같은 부가적 정보를 이용한 인기도 기반 랭킹의 문제점을 단어간의 수식 관계를 이용한 의미 기반 랭킹 알고리즘의 제시를 통해 해결하였다. 또한 검색어와 연관된 단어를 수식 관계를 이용하 계산, 시각화하여 제공함으로써 사용자가 잘못된 검색어로 검색을 시작하였더라도 항상 올바른 검색 결과를 얻을 수 있도록 도왔으며 각 검색 결과와 함께 원문을 요약해 제공함으로써 검색 결과를 일일이 클릭해 보지 않고도 내용을 쉽게 유추할 수 있도록 도왔다.

  • PDF