• 제목/요약/키워드: 어휘유형

검색결과 171건 처리시간 0.034초

채팅 시스템 구현을 위한 3단계 문장 검색 방법 (A three-step sentence searching method for implementing a chatting system)

  • 전원표;송영길;김학수
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제37권2호
    • /
    • pp.205-212
    • /
    • 2013
  • 기존 채팅 시스템은 일반적으로 사용자 입력 문장과 데이터베이스 내 목표 문장들 사이의 어휘 일치도에 기반을 둔 방법을 사용한다. 그러나 이러한 방법은 어휘 불일치 문제를 자주 일으킨다. 이러한 문제를 해결하기 위해 순차적으로 적용되는 3단계 문장 검색 방법을 제안한다. 첫 번째 단계는 어휘 수준에서 사용자 입력 문장과 목표 문장들 사이의 공통 키워드 열을 비교하는 것이다. 두 번째 단계는 의미 수준에서 사용자 입력 문장과 데이터베이스 내 문장들 사이의 문장 유형과 의미 표지를 비교하는 것이다. 마지막 단계는 미리 정의된 어휘-구문 패턴을 사용자 입력 문장과 매칭하는 것이다. 실험에서 제안된 방법은 단순 키워드 매칭 방법 보다 더 나은 응답 정확도와 사용자 만족도를 보였다.

브렉시트 캠페인 기간 동안 영어 미디어에 나타난 이민자들 (Migrant Representation in the English-language Media during the Brexit Campaign)

  • 이재승
    • 비교문화연구
    • /
    • 제45권
    • /
    • pp.325-348
    • /
    • 2016
  • 본 논문은 브렉시트 캠페인 기간 동안 영어권 국가, 영국, 미국, 캐나다, 그리고 호주의 미디어에서 이민자들이 어떻게 표현되는지 살펴본다. 코퍼스 지원 담화연구의 틀을 사용한 본 연구는 브렉시트 국민투표 캠페인이 시작된 날부터 국민투표가 실시되기 전 날까지(2016년 4월 15일-6월 22일) 검색기간으로 설정하고, 검색어 'Brexit'가 포함된 모든 기사를 수집하여 브렉시트 캠페인 코퍼스를 구축하였다. 수집된 코퍼스 자료를 통해서 이민자를 나타내는 어휘들, IMMIGRANT, MIGRANT, 그리고 REFUGEE의 빈도를 관찰하고, 이 어휘들과 함께 나타나는 연어를 분석하였다. 또한 세 어휘의 연어들을 사회적 행위자 범주에 따라 분류 및 분석하였다. 분석 결과, IMMIGRANT의 연어는 법적 상태 및 출신지역 어휘들과 연관성이 있고, MIGRANT는 경제적인 용어들과 주로 연어 관계에 있으며, REFUGEE는 큰 수를 나타내는 어휘와 관련성이 있는 것으로 나타났다. 그리고 이민자들은 기능범주, 유형범주, 그리고 평가범주를 통해서 묘사되며, 특히 영국과 미국의 미디어에서 이민자들이 부정적으로 그려지고 있는 것으로 관찰되었다. 본 연구를 통하여 특정 현상 및 특정 집단의 사람들을 가리킬 때 특정 어휘가 사용되며, 코퍼스 지원 언어분석이 해당 사회의 사회 문화 정치적 상황을 파악하는데 도움이 된다는 것을 확인할 수 있었다.

대학 교양영어 FnF수업유형이 목표어휘와 목표문법의 습득에 미치는 효과 (Effects of College English FnF (Focus on Form) Class Types on Target Vocabulary and Grammar)

  • 김영희
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권12호
    • /
    • pp.371-380
    • /
    • 2017
  • 본 연구는 대학 교양영어 교육에서 영어학습 부진아 학생들을 대상으로 목표어의 유창성과 정확성을 모두 얻기 위해서 언어의 형식적인 특성을 체계적으로 지도해야 할 필요성을 느끼고 기능 중심의 교양영어 교육을 하면서 기본적인 언어 요소인 문법과 어휘를 강화시키는 방법인 'focus on form'(FnF)를 투입하여 그 효과성을 알아보고자 하였다. 동질성이 검증된 3개 집단을 선정하여 의미중심의 의사소통 수업의 비교반과 FnF의 입력 강화 과제 방식 수업의 실험 A반, FnF의 출력 강화 수업의 실험 B반으로 구성하여 13주 실험을 실시하였다. 그 결과, 입력 강화의 실험 A반은 비교반에 비해 문법 습득에 유의한 효과가 있었고, 출력 강화의 실험 B반은 비교반에 비해 어휘 습득에 유의한 효과가 있었다. 그러나 어휘와 문법 습득에서 FnF의 두 방식의 통계적 차이는 나타나지 않았다. 따라서 교양영어수업에서 부진아 학생들에게 문법 항목과 관련해서는 인지적 부담이 낮은 입력 강화를 적용한 수업을 하고, 어휘 항목은 출력 강화를 적용한 FnF수업을 섞어서 할 필요가 있다는 것을 본 연구의 결과가 시사한다.

지각 변동을 학습하는 과정에서 나타나는 중학생들의 중간 언어 유형 (The Types of Interlanguage of Middle School Students in the Process of Learning Diastrophism)

  • 강도영;신명환;신필여;위햇님;윤경욱;양찬호;김지영;민현식;노태희;김찬종
    • 한국지구과학회지
    • /
    • 제33권1호
    • /
    • pp.59-72
    • /
    • 2012
  • 이 연구의 목적은 지각 변동을 학습하는 과정에서 나타나는 중학생들의 중간 언어의 유형을 도출하는 것이다. 서울의 한 중학교 2학년 2학급에서 18명의 학생들을 선정하였다. 각 학생들은 총 네 차례에 걸쳐 개별 면담을 실시하였으며, 수집된 자료는 의미 관계와 주제 구조를 중심으로 분석되었다. 연구 결과, 일상 언어를 자원으로 하는 경우, 과학 어휘와 일상 어휘를 병용하는 경우, 그리고 과학 언어를 활용하지만 불충분한 경우와 의미 관계가 부적절한 경우를 합하여 총 8개의 중간 언어 유형이 도출되고 서술되었으며, 이를 바탕으로 조사된 중간언어의 함의를 토의하였다.

Lexico-Semantic Pattern을 이용한 오픈 도메인 질의 응답 시스템 (Open-domain Question Answering Using Lexico-Semantic Patterns)

  • 이승우;정한민;곽병관;김동석;차정원;안주희;이근배;김학수;김경선;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.538-545
    • /
    • 2001
  • 본 연구에서는 오픈 도메인에서 동작할 수 있는 질의 응답 시스템(Open-domain Question Answer ing System)을 구현하고 영어권 TREC에 참가한 결과를 기술하였다. 정답 유형을 18개의 상위 노드를 갖는 계층구조로 분류하였고, 질문 처리에서는 LSP(Lexico-Semantic Pattern)으로 표현된 문법을 사용하여 질문의 정답 유형을 결정하고, lemma 형태와 WordNet 의미, stem 형태의 3가지 유형의 키워드로 구성된 질의를 생성한다. 이 질의를 바탕으로, 패시지 선택에서는 문서검색 엔진에 의해 검색된 문서들을 문장단위로 나눠 정수를 계산하고, 어휘체인(Lexical Chain)을 고려하여 인접한 문장을 결합하여 패시지를 구성하고 순위를 결정한다. 상위 랭크의 패시지를 대상으로, 정답 처리에서는 질문의 정답 유형에 따라 품사와 어휘, 의미 정보로 기술된 LSP 매칭과 AAO (Abbreviation-Appositive-Definition) 처리를 통해 정답을 추출하고 정수를 계산하여 순위를 결정한다. 구현된 시스템의 성능을 평가하기 위해 TREC10 QA Track의 main task의 질문들 중, 200개의 질문에 대해 TRIC 방식으로 자체 평가를 한 결과, MRR(Mean Reciprocal Rank)은 0.341로 TREC9의 상위 시스템들과 견줄 만한 성능을 보였다.

  • PDF

평면적 어휘 자질들을 활용한 확장 혼합 커널 기반 관계 추출 (Relation Extraction based on Extended Composite Kernel using Flat Lexical Features)

  • 최성필;정창후;최윤수;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권8호
    • /
    • pp.642-652
    • /
    • 2009
  • 본 논문에서는 기존의 관계 추출 성능을 향상시키기 위해서 기존의 자질 기반 방법에서 추구하였던 개체 주변 문맥 다양성 정보의 추출 및 적용과 커널 기반 방법의 강점인 관계 인스턴스에 대한 구문 구조적 자질 정보의 통합 활용을 통한 확장된 혼합 커널을 제안한다. ACE RDC 코퍼스를 활용한 실험에서, 기존의 합성곱 구문 트리 커널 기반 혼합 커널을 기반으로 총 9 종류의 평면적 어휘 자질 집합을 정의하고 이를 적용함으로써 성능 향상에 기여하는 어휘 자질 유형을 파악할 수 있었으며, 적은 규모의 학습 집합으로도 현재 최고 수준의 성능에 필적하는 결과를 얻을 수 있었다. 결론적으로 관계 추출을 위한 세 가지 핵심 정보, 즉 개체 자질, 구문 구조적 자질, 주변 문맥 어휘 자질을 통합 적용하면 관계 추출의 성능을 향상시킬 수 있음을 알 수 있었다.

아동영문어휘책에 제시된 그림과 문자의 사용에 대한 분석 (Analysis on the Use of Picture and Letter Used in the Books of English Vocabulary for Children)

  • 이미영
    • 한국콘텐츠학회논문지
    • /
    • 제14권1호
    • /
    • pp.150-157
    • /
    • 2014
  • 본 논문은 현재 출간된 아동영문어휘책의 현황분석을 통해 그림과 문자의 관계적 속성을 이해하고 사용자인 아동을 고려해 시각적 심상을 얼마나 잘 활용하고 있는가를 파악하고자 하였다. 이에 아동영문어휘책에 사용된 그림의 유형과 그림의 활용도, 그림과 문자의 결합 형태, 그림과 문자와의 의미일치도 정도를 살펴보았다. 분석결과 그림의 활용도는 일러스트, 만화, 일러스트와 만화의 혼용 순으로 전반적으로 높은 것으로 나타났다. 그림과 문자의 결합 형태에서는 그림+어휘형, 일러스트가 없는 문자형, 그림문자형 순으로 나타났다. 특히나 그림과 문자의 의미일치도가 높을수록 학습에 효과적인데 반해 의미일치도는 전반적으로 낮게 나타났다. 의미일치도가 높게 나타난 5개의 그룹 중 그림문자형이 가장 높은 결합형태 빈도를 보이고 있었다. 따라서 현재 출간된 아동영문어휘책에 나타난 그림과 문자의 제시형태는 비슷한 형태로 출판사별로 출간되고 있음을 알 수 있었고 아동의 다양한 수준을 바탕으로 한 효과적인 디자인연구가 필요하다고 보아진다.

건물 파사드의 디자인 패턴과 감성 디자인 특성의 상관관계 분석 (Correlation Analysis of Design Pattern and Emotional Design Characteristics on the Building Facade)

  • 오영은;이현수
    • 디자인융복합연구
    • /
    • 제14권2호
    • /
    • pp.51-65
    • /
    • 2015
  • 본 연구의 목적은 건물 파사드 디자인을 효과적으로 지원 할 수 있는 패턴의 감성적인 디자인 특성을 도출하여 그 특성들의 상관관계를 분석하는 것이다. 본 논문에서 다루어지는 디자인 패턴은 Ben Pell이 제시한 5가지, 즉 응용 패턴, 다공 패턴, 레이어드 패턴, 캐스트 패턴, 타일 패턴 이다. 본 논문은 5가지 패턴 유형의 예비 조사 후 50명을 대상으로 10쌍의 형용사 어휘를 가지고 Likert 7단계의 SD척도로 감성 어휘 조사 하였다. 본 논문은 예비조사에서 감성 어휘의 감성 치수가 가장 높은 응용 패턴의 디자인 특성을 분석하고 있다. 응용 패턴은 '연속적인'과 감성 상관성이 높다. 이 '연속적인'과의 상관관계가 높은 감성 어휘는 '비연속적인' 과 '규칙적인' 으로 도출 되었다. 본 논문에서 최종 도출한 응용패턴의 감성 디자인 특성은 '연속적인-비연속적인' 과 '불규칙적인-규칙적인' 등의 감성 어휘 쌍과 상대적으로 높은 상관관계를 갖는 것으로 요약될 수 있다. 디지털 기술의 지원에 의해 디자인된 파사드의 디자인 특성을 분석했다는 점과 도출된 디자인 특성의 활용 방향을 논의하고 있다는 점이 본 논문이 갖는 가치이다.

중국어 모어 화자의 한국어 학습자의 쓰기에 나타난 오류 분석 -어휘 오류를 중심으로- (Error Analysis of Chinese Learners of the Korean Language: Focus on Analysis of Vocabulary)

  • 노병호
    • 한국융합학회논문지
    • /
    • 제6권5호
    • /
    • pp.131-142
    • /
    • 2015
  • 본 연구는 중국어 모어 화자 한국어 학습자의 쓰기에 나타난 오류 분석을 실시하여 오류의 원인을 살펴보고 이를 분석한 내용을 바탕으로 학습자들이 생산해 내는 오류에 효과적인 교육 방안을 제시하는데 있다. 본 연구의 분석 대상 자료는 '내가 생각하는 한국', '중국과 한국의 문화융합에 대하여', '친구' 등의 주제로 작문한 것을 바탕으로 모든 문장을 입력하고 이들 문장 중에서 어휘 오류를 추출하여 수정한 후, 본 연구자가 설정한 오류 유형의 범주에 의하여 재분류하였으며 분류한 오류의 빈도수를 작성하였다. 연구의 결과, 대치 오류 > 철자 오류 > 오형태 > 누락 오류 > 첨가 오류 의 순으로 오류의 유형이 나타났다. 오류 방지를 위한 교육 방안으로 문법적인 요소나 어휘의 형태적인 면을 제시할 경우에는 그 부분의 제약이 되는 점을 같이 제시해줘야 오류를 미연에 방지할 수 있을 것이다.

지식검색의 답변 추천 시스템 (Answer Suggestion for Knowledge Search)

  • 이호창;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.201-205
    • /
    • 2012
  • 지식검색은 방대한 지식정보 데이터를 바탕으로 사용자의 질문에 대한 답변을 검색하는 시스템이다. 이러한 사용자 참여로 구축된 지식정보는 잘못된 답변으로 인한 신뢰성 부족과 중복 답변 등의 문제점이 있어, 원하는 답변을 찾기 위해서는 지식검색에서 다수의 답변을 읽고 그 답변의 진위여부를 판단해야만 한다. 만일 정답에 포함되는 단어나 어구가 답변들에서 나타내는 통계적 특성을 활용하여 사용자가 원하는 답변을 제시할 수 있다면, 지식검색의 효용성과 신뢰성이 크게 향상될 수 있다. 본 논문에서는 지식정보 데이터 분석을 통해 사용자의 질문의 유형을 단어, 목록, 도표, 글의 4가지 유형으로 분류하고, 각 분류에 대한 사용자 질의어의 답변을 요약하는 방식을 제안한다. 단어, 목록, 글 유형은 TF와 IDF, 어휘 간의 거리 정보를 통해서 중요 단어를 추출하여 각 유형에 적합한 형식의 답변을 사용자에게 제시한다. 도표형은 답변들에서 사용자의 의견 정보를 추출하여 의견 통계를 도표로서 제시한다.

  • PDF