• 제목/요약/키워드: 어휘적 특징

검색결과 144건 처리시간 0.025초

형식적 및 비형식적 어휘 정보를 반영한 문장 감정 분류 (A Sentence Sentiment Classification reflecting Formal and Informal Vocabulary Information)

  • 조상현;강행봉
    • 정보처리학회논문지B
    • /
    • 제18B권5호
    • /
    • pp.325-332
    • /
    • 2011
  • 최근 트위터, 페이스북과 같은 소셜 네트워크 서비스(Social Network Service : SNS)가 활성화됨에 따라 서비스 사용자들에 의해 작성된 막대한 텍스트들로부터 의미 있는 정보를 찾기 위한 연구가 많은 주목을 받고 있다. 특히 문장에 담겨 있는 감정은 활용 범위가 매우 넓은 정보로서 문장에 대한 감정을 분류하는 일은 매우 유용한 일이라고 할 수 있다. 본 논문에서는 문장의 감정을 분류하기 위해 문장에 포함되어 있는 형식적 어휘 정보와 이모티콘이나 인터넷 용어와 같은 온라인상에서 많이 이용되는 다양한 형태의 비형식적 어휘 정보를 이용한 새로운 문장 감정 분류 방법을 제안한다. 기존에는 문장의 감정을 분류하기 위해 사전을 기반으로 한 형식적 어휘 정보를 이용했지만, 최근 인터넷 사용자들은 인터넷 용어나 이모티콘과 같은 비형식적 어휘를 많이 사용해 기존의 형식적 어휘 정보만으로는 정확한 감정 분류가 어렵다. 제안한 방법은 형식적 어휘 정보와 비형식적 어휘 정보를 이용해 다양한 형태의 어휘를 포함하는 인터넷 상의 문장들에 대해 보다 정확한 감정 분류 결과를 보여준다. 또한, 같은 어휘라도 도메인별로 다른 감정을 나타내는 경우가 많으므로 제안한 방법에서는 도메인별로 다른 감정 어휘정보를 이용했다. 각 감정 어휘 정보를 통해 특징벡터로 표현된 문장은 Support Vector Machine(SVM) 분류 방법을 통해 감정을 분류하고 그 성능을 평가했다.

한국어 기능동사 연구의 한 국면 (Un aspect do la recherche lexico-syntaxique doe constructions $\grave{a}$ verbs support on $cor{\acute{e}}en$)

  • 홍재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.527-532
    • /
    • 1993
  • 한국어 어휘부 구성에 기능동사(경동사) 구문에 관한 언어정보의 수록은 필수적이다. 범용적 대규모 한국어 어휘자료 database 구축을 위한 기능동사 구문과 언어학적 분석 기술과 관련하여 제기되는 여러 문제들 중에서 기능동사의 어휘적 한정의 문제는, 어휘부 중심의 논의를 펼칠 때, 각별한 중요성을 갖는다. 본 발표에서는 우선 확장된 기능동사 개념에 의거하여 기능동사 정보를 어휘부에 반드시 수록해야 할 논거를 제시하고, 기능동사의 어휘적 한정의 문제를 집중적으로 거론하고자 한다. 요점은 기능동사 구문이 서술명사와 기능동사의 결합에 의해 성립된다고 볼 때 이 두 범주의 어휘적 실현은 예측불가능한 제한적 결합관계에 의해 특징지어지므로, 일정한 서술명사와 결합 가능한 기능동사의 어휘적 형태를 어휘부에서 낱낱이 한정하고 기재하여야 하리라는 것이다. 이를 위한 필수적인 연구작업은 크게 상호보완적인 두 부분으로 이루어진다. 한편 한국어 서술명사의 총체를 목록화하고, 그 개별어휘 하나하나에 대해 가능한 기능동사 구문과, 구체적인 기능동사 어휘를 한정하는 것이 필요하다. 또 한편으로는 한국어 동사의 총체를 목록화하여, 그 개별어휘 하나하나의 가능한 통사적 실현을 체계화하는 과정에서 기능동사 용법을 빠짐없이 가려내는 작업이 요구된다고 보겠다.

  • PDF

구조적 속성과 어휘적 특징에 기반한 안전기준 고찰 (A Review of Safety Standards in Korea based on Structural Attributes and Lexical Characteristics)

  • 임수정;박덕근
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.353-366
    • /
    • 2019
  • 사회발달로 인해 안전기준이 세분화 전문화되면서 관련 법령 또한 그 수가 점차 증가하여 법령 내에서 중복 또는 상충의 문제점이 나타나고 있다. 우리나라 법령에 존재하는 모든 안전기준을 수집한 후 중복 또는 상충문제를 찾아내기 위해서는 우선 안전기준이 가지는 특성들을 분석할 필요가 있다. 본 연구에서는 모든 안전기준에서 나타나는 공통요소와 특정 안전기준에서만 나타나는 특이점을 추출하면서 안전기준의 특성을 크게 구조적, 어휘적 부분으로 구분하였다. 분석결과, 안전기준의 구조적 속성은 2가지, 어휘적 특징은 4가지로 도출되었다. 이러한 특성들이 안전기준을 관리할 향후 시스템에 미치는 영향에 대해서도 추가로 검토하였다. 본 연구를 기반으로 향후 더 많은 안전기준의 구조 및 어휘적 특성들이 축적된다면 효율적인 안전기준의 수집.분석 알고리즘 개발이 가능해져 결국 법령내 안전기준의 중복 상충 문제점 해소에 도움이 될 것이다.

한국어에서 Attention 모델과 Naïve Bayes 모델 기반의 어휘 말뭉치 구축 및 응용에 관한 연구 (Attention and Naïve Bayes Models based Lexicon Corpus and Applications for Korean)

  • 윤주성;김현철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.13-16
    • /
    • 2017
  • 감성 분석에서 어휘 말뭉치는 기존의 전통적인 기계학습 방법에서 중요한 특징으로 사용되었다. 최근 딥러닝의 발달로 hand-craft feature를 사용하지 않아도 되는 End-to-End 방식의 학습이 등장했다. 하지만 모델의 성능을 높이기 위해서는 여전히 어휘말뭉치와 같은 특징이 모델의 성능을 개선하는데 중요한 역할을 하고 있다. 본 논문에서는 이러한 어휘 말뭉치를 Attention 모델과 Naïve bayes 모델을 기반으로 구축하는 방법에 대해 소개하며 구축된 어휘 말뭉치가 성능에 끼치는 영향에 대해서 Hierarchical Attention Network 모델을 통해 분석하였다.

  • PDF

한국어에서 Attention 모델과 Naïve Bayes 모델 기반의 어휘 말뭉치 구축 및 응용에 관한 연구 (Attention and Naïve Bayes Models based Lexicon Corpus and Applications for Korean)

  • 윤주성;김현철
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.13-16
    • /
    • 2017
  • 감성 분석에서 어휘 말뭉치는 기존의 전통적인 기계학습 방법에서 중요한 특징으로 사용되었다. 최근 딥러닝의 발달로 hand-craft feature를 사용하지 않아도 되는 End-to-End 방식의 학습이 등장했다. 하지만 모델의 성능을 높이기 위해서는 여전히 어휘말뭉치와 같은 특징이 모델의 성능을 개선하는데 중요한 역할을 하고 있다. 본 논문에서는 이러한 어휘 말뭉치를 Attention 모델과 $Na{\ddot{i}}ve$ bayes 모델을 기반으로 구축하는 방법에 대해 소개하며 구축된 어휘 말뭉치가 성능에 끼치는 영향에 대해서 Hierarchical Attention Network 모델을 통해 분석하였다.

  • PDF

시각적 형태 정보에 관한 감성어휘 분류 (Classification of KANSEI Vocabulary according to Visual Shape Information)

  • 백선경;황광수;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.76-78
    • /
    • 2006
  • 인간의 주관적이고 애매한 감성은 차세대 컴퓨팅의 다양한 분야에서 연구되며. 인간의 감성을 이해하고 감성의 변화에 능동적으로 반응하는 사용자 중심의 정보 처리에 대한 요구가 급격히 증가하고 있다. 우리는 감성기반 이미지 검색을 위해 저차원 시각정보에 대한 강성처리를 연구하고 있다. 기존의 저차원 시각정보 특징을 고려한 내용기반 이미지 검색 방법은 사용자의 취향이나 감성 요구에 적합한 결과를 검색하기에는 많은 어려움이 있다. 본 논문에서는 인간의 감성을 이해, 검색, 인식하기 위한 시각정보와 감성간의 관계 연구 중 우리의 기존 연구인 시각적 형태 정보의 감성어휘 공간에서 형태와 어휘간의 감성거리를 이용한 분류방법을 제안한다. 그리고 분류된 각 영역에서의 대표 어휘를 추출하여 시각적 형태에 따른 감성어휘간의 구체적 계층 관계를 정의한다. 이는 감성기반 이미지 검색 분야에 활용 가능한 연구이며, 우리가 사용하는 언어에 내재된 감성정보를 해석하고 그 어휘들의 체계적인 시각적 감성관계를 정의하는 의의를 갖는다.

  • PDF

효율적인 개방형 어휘 3차원 개체 분할을 위한 클래스-독립적인 3차원 마스크 제안과 2차원-3차원 시각적 특징 앙상블 (Class-Agnostic 3D Mask Proposal and 2D-3D Visual Feature Ensemble for Efficient Open-Vocabulary 3D Instance Segmentation)

  • 송성호;박경민;김인철
    • 정보처리학회 논문지
    • /
    • 제13권7호
    • /
    • pp.335-347
    • /
    • 2024
  • 개방형 어휘 3차원 포인트 클라우드 개체 분할은 3차원 장면 포인트 클라우드를 훈련단계에서 등장하였던 기본 클래스의 개체들뿐만 아니라 새로운 신규 클래스의 개체들로도 분할해야 하는 어려운 시각적 작업이다. 본 논문에서는 중요한 모델 설계 이슈별 기존 모델들의 한계점들을 극복하기 위해, 새로운 개방형 어휘 3차원 개체 분할 모델인 Open3DME를 제안한다. 첫째, 제안 모델은 클래스-독립적인 3차원 마스크의 품질을 향상시키기 위해, 새로운 트랜스포머 기반 3차원 포인트 클라우드 개체 분할 모델인 T3DIS[6]를 마스크 제안 모듈로 채용한다. 둘째, 제안 모델은 각 포인트 세그먼트별로 텍스트와 의미적으로 정렬된 시각적 특징을 얻기 위해, 사전 학습된 OpenScene 인코더와 CLIP 인코더를 적용하여 포인트 클라우드와 멀티-뷰 RGB 영상들로부터 각각 3차원 및 2차원 특징들을 추출한다. 마지막으로, 제안 모델은 개방형 어휘 레이블 할당 과정동안 각 포인트 클라우드 세그먼트별로 추출한 2차원 시각적 특징과 3차원 시각적 특징을 상호 보완적으로 함께 이용하기 위해, 특징 앙상블 기법을 적용한다. 본 논문에서는 ScanNet-V2 벤치마크 데이터 집합을 이용한 다양한 정량적, 정성적 실험들을 통해, 제안 모델의 성능 우수성을 입증한다.

어휘의미분석 말뭉치 구축의 절차와 문제 (Procedures and Problems in Compiling a Disambiguated Tagged Corpus)

  • 신지현;최민우;강범모
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.479-486
    • /
    • 2001
  • 동음이의어 간의 서로 다른 의미를 효율적으로 변별해 줄 수 있는 방법 중 하나로 어휘의미분석 말뭉치의 활용을 들 수 있다. 이는 품사 단위의 중의성을 해소해 줄 수 있는 형태소 분석 말뭉치를 기반으로, 이 단계에서 해결하지 못하는 어휘적인 중의성을 해결한 것으로, 보다 정밀한 언어학적 연구와 단어 의미의 중의성 해결(word sense disambiguation) 등 자연언어처리 기술 개발에 사용될 수 있는 중요한 언어 자원이다. 본 연구는 실제로 어휘의미분석 말뭉치를 구축하기 위한 기반 연구로서, 어휘의미분서 말뭉치의 설계와 구축 방법론상의 제반 사항을 살펴보고, 중의적 단어들의 분포적 특징과 단어의 중의성 해결 단계에서 발생할 수 있는 문제점을 지적하고, 아울러 그 해결 방법을 모색해 의는 것을 목적으로 한다.

  • PDF

키워드 분석에 대한 최신 접근법 비교 연구: 성경 코퍼스를 중심으로 (A Comparative Study of a New Approach to Keyword Analysis: Focusing on NBC)

  • 하명호
    • 디지털융복합연구
    • /
    • 제19권7호
    • /
    • pp.33-39
    • /
    • 2021
  • 본 연구는 구약 성경 코퍼스와 신약 성경 코퍼스, 그리고 구약과 신약 성경을 통합한 코퍼스에서 추출된 키워드 목록의 어휘적 특징을 분석하고, 또 사용빈도 기반의 키워드 분석보다 분포도 기반 키워드 분석이 더 우수한 분석 방식임을 밝히고자 하였다. 이를 위해 Bible Hub의 NLT 웹사이트에서 성경 파일을 다운받아 약 57만 어절의 구약 성경 코퍼스와 약 20만 어절의 신약 성경 코퍼스를 구축하였다. 목표 코퍼스와 참조 코퍼스의 비교를 통한 키워드 목록을 추출하기 위해서 Scott(2020)의 WordSmith 8.0 프로그램을 사용하였다. 그 결과, 분포도 기반 키워드 분석이 사용빈도 기반의 키워드 분석보다 키워드 목록의 어휘적 특징을 보다 더 잘 나타낼 수 있었고, 또 코퍼스 내용의 대표성과 변별성을 충분히 충족시킬 수 있는 최적의 키워드 목록을 추출하기 위해서는 분포도 기반 키워드 분석이 더 우수한 방식임을 밝혔다.

약속의 문법 : 서술명사의 통사.어휘적 기술과 사전 (Grammaire du nom $pr{\acute{e}}dicatif$ : $\underline{yaksok}$ et dictionnaire)

  • 홍지성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.361-366
    • /
    • 1992
  • 이 발표에서는 공시적 기술 위주의 대규모 언어사전으로서의 현대한국어 사전을 구상할 때 성찰이 요구되는 서술명사의 처리방안을 생각해 보고자 한다. 보통명사의 한 하류부류인 서술명사로 특징지어지는 명사 약속을 실례로, 그 통사 어휘적 기술을 시도하고, 그 결과를 활용하는, 언어학적으로 근거있는 명사의 사전항목 구성을 검토해 보는 것이다. 약속의 항목에 명시적으로 표시되어야 할 주요 어휘 통사적 속성을 제시하고 또 이들의 사전적 표상을 위한 몇 가지 실제적 제안을 소개하려고 한다.

  • PDF