• Title/Summary/Keyword: 태깅 도구

검색결과 30건 처리시간 0.023초

ManiFL : 얕은 학습 기반의 더 나은 자연어처리 도구 (ManiFL : A Better Natural-Language-Processing Tool Based On Shallow-Learning)

  • 신준철;김완수;이주상;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.311-315
    • /
    • 2021
  • 근래의 자연어처리 분야에서는 잘 만들어진 도구(Library)를 이용하여 생산성 높은 개발과 연구가 활발하게 이뤄지고 있다. 이 중에 대다수는 깊은 학습(Deep-Learning, 딥러닝) 기반인데, 이런 모델들은 학습 속도가 느리고, 비용이 비싸고, 사용(Run-Time) 속도도 느리다. 이뿐만 아니라 라벨(Label)의 가짓수가 굉장히 많거나, 라벨의 구성이 단어마다 달라질 수 있는 의미분별(동형이의어, 다의어 번호 태깅) 분야에서 딥러닝은 굉장히 비효율적인 문제가 있다. 이런 문제들은 오히려 기존의 얕은 학습(Shallow-Learning)기반 모델에서는 없던 것들이지만, 최근의 연구경향에서 딥러닝 비중이 급격히 증가하면서, 멀티스레딩 같은 고급 기능들을 지원하는 얕은 학습 기반 언어모델이 새로이 개발되지 않고 있었다. 본 논문에서는 학습과 태깅 모두에서 멀티스레딩을 지원하고, 딥러닝에서 연구된 드롭아웃 기법이 구현된 자연어처리 도구인 혼합 자질 가변 표지기 ManiFL(Manifold Feature Labelling : ManiFL)을 소개한다. 본 논문은 실험을 통해서 ManiFL로 다의어태깅이 가능함을 보여주고, 딥러닝과 CRFsuite에서 높은 성능을 보여주는 개체명 인식에서도 비교할만한 성능이 나옴을 보였다.

  • PDF

Folksonomy를 위한 POI 관리도구 개발 (Development of POI Management Tool for Folksonomy)

  • 김흠;박용진;송은하;안시훈;남승훈;정영식
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권7호
    • /
    • pp.694-702
    • /
    • 2008
  • 오늘날 웹은 가장 폭넓게 사용되는 기술이고 과거 몇 년 동안 웹은 여러 단계를 통해 진화되고 성숙된 기술이다. 특히 폭소노미, 태깅, RSS 등의 웹 인터페이스 기술이 사용자 중심적으로 발전, 변화하고 있다. 본 논문에서는 POI 정보 관리를 일반적인 구조적 관리 방법 뿐만 아니라, 태깅 기술을 적용하여 POI 정보관리를 위한 POIM(POI Management tool)를 개발한다. 사용자 중심의 POI 서비스를 위하여 사용자가 직접 POIM를 이용하여 특정 POI 객체들에 XML 기반 태깅 정의, 수정, 삭제 등을 수행하면 각 POI 객체들이 GML로 저장된다.

크라우드소싱 기반 이미지 태깅 시스템 구축 연구 (Development of an Image Tagging System Based on Crowdsourcing)

  • 이혜영;장윤금
    • 한국비블리아학회지
    • /
    • 제29권3호
    • /
    • pp.297-320
    • /
    • 2018
  • 본 연구는 이미지에 대한 접근 및 검색을 향상시키고, 이미지에 대한 설명 제공 도구로서의 태그를 효과적으로 생성하기 위한 방안을 모색하는데 목적이 있다. 이를 위해 이미지 태그를 생성하는 두 가지 방법인 휴먼 태깅과 머신 태깅의 특징을 조사하고 휴먼 태그와 머신 태그의 속성을 비교 분석하였다. 머신 태그는 일반적 속성이 가장 높았으며, 특정적 속성과 시각적 요소는 일부 나타났고, 추상적 속성은 거의 나타나지 않았다. 휴먼 태그도 일반적 속성이 가장 높았으나 휴먼 태그 생성자가 명칭을 알 수 있는 객체 및 장면에 대해서는 특정적 속성의 비중이 높았으며, 감정과 정서, 추상적 개념의 주제뿐 아니라 사건, 장소, 시간, 관계 등이 다양한 태그로 표현되었다. 본 연구를 통해 생성된 태그 집합은 머신러닝 알고리즘을 개선하기 위한 트레이닝 데이터세트를 구성하는데 기초 자료로 활용될 수 있을 것이다.

태스크 기반 대화 시스템 구축 도구 (Workbench for building Task based Dialog System)

  • 박은진;권오욱;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.209-211
    • /
    • 2012
  • 본 논문의 대화시스템 구축도구는 태스크 기반 대화 시스템을 구축하는데 필요한 대화 시나리오 지식과 이를 처리하는 태스크 그래프, 슬롯 체계, 대화 라이브러리 등을 생성하고 관리할 수 있는 웹기반 대화 시스템 구축 도구이다. 이 도구는 태스크 그래프를 시각적으로 대화 모델 설계자에게 표시하고, 대화 모델 설계자는 시각적으로 표시된 태스크 그래프를 보며 태스크의 흐름을 한눈에 파악하고 대화 시스템의 시나리오 흐름을 생성하고 편집할 수 있도록 한 것이 특징이다. 또한 대화 모델 설계자와 시나리오 태깅 작업자들 모두는 자신이 구축한 지식이나 대화 태스크를 시스템에 직접 반영하고 실시간으로 대화 시스템에 적용해 봄으로써 대화 시스템의 이해를 높이고 고품질의 대화 시스템을 구축할 수 있다.

  • PDF

뉴스 기사 키워드 추출을 위한 구묶음 주석 말뭉치 구축 (Chunking Annotation Corpus Construction for Keyword Extraction in News Domain)

  • 김태영;김정아;김보희;오효정
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.595-597
    • /
    • 2020
  • 빅데이터 시대에서 대용량 문서의 의미를 자동으로 파악하기 위해서는 문서 내에서 주제 및 내용을 포괄하는 핵심 단어가 키워드 단위로 추출되어야 한다. 문서에서 키워드가 될 수 있는 단위는 복합명사를 포함한 단어가 될 수도, 그 이상의 묶음이 될 수도 있다. 한국어는 언어적 특성상 구묶음 개념이 적용되는 데, 이를 통해 주요 키워드가 될 수 있는 말덩이 추출이 가능하다. 따라서 본 연구에서는 문서에서 단어뿐만 아니라 다양한 단위의 키워드 묶음을 태깅하는 가이드라인 정의를 비롯해 태깅도구를 활용한 코퍼스 구축 방법론을 고도화하고, 그 방법론을 실제로 뉴스 도메인에 적용하여 주석 말뭉치를 구축함으로써 검증하였다. 본 연구의 결과물은 텍스트 문서의 내용을 파악하고 분석이 필요한 모든 텍스트마이닝 관련 기술의 기초 작업으로 활용 가능하다.

  • PDF

학습기능을 가진 효율적인 품사 부착 도구 설계 및 구현 (Design and implementation of an efficient part-of-speech annotation tool that has the study facility)

  • 안유미;오진영;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.191-196
    • /
    • 2009
  • 본 논문에서는 자바 기반의 품사부착 코퍼스 작성 도구를 제안 및 구현한다. 본 시스템에서는 각 사용자가 독립적으로 실행하지만 주요 데이터베이스는 서버에서 관리함으로서 지식을 공유할 수 있고, 품사부착 작업에 있어 사전에 만들어진 어절 후보로부터의 선택 및 사용자 입력이 가능하도록 한다. 고빈도 오류어절의 자동 표시 기능, 용례 검색을 통한 도움말 기능, 코멘트를 기반으로 구성된 집단 지식을 이용한 도움말 확장 기능 및 사전 검색 기능을 구현한다. 또한, 일관성 검사를 통해 품사부착 결과에 대한 신뢰도 증가 및 작업의 편의성을 증대시킬 수 있도록 설계한다.

  • PDF

WordNet어휘계층구조 기반의 태그/사용자 분류체계 구축지원도구의 개발 (A Development of Tag/User Classification System Based on WordNet Hierarchies)

  • 황석형;최성희;김한수;김정래
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.1023-1026
    • /
    • 2013
  • 오늘날 인터넷의 발달과 더불어 스마트기기의 보급이 급성장하면서, 다양한 웹사이트에서 데이터가 기하급수적으로 발생되고 있고, 수 많은 다종다양한 데이터를 효율적으로 저장/관리/분석하기 위한 유용한 어노테이션(Anotation) 기법으로서, 리소스에 대한 사용자의 태깅(Tagging)기능이 널리 활용되고 있다. 본 연구에서는, 사용자들의 공통 태그 데이터를 수집하여, WordNet을 기반으로 다양한 수준의 태그/사용자 분류체계를 구축하기 위한 지원도구개발에 관한 연구결과를 보고한다.

영화 대본에서 감정 및 정서 분석: 사례 연구 (Emotion and Sentiment Analysis from a Film Script: A Case Study)

  • 유혜연;김문현;배병철
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권8호
    • /
    • pp.1537-1542
    • /
    • 2017
  • 감정은 서사 생성과 이해 모두에서 중요한 역할을 한다. 본 논문은 플루칙의 감정 모델을 기반으로 영화 대본에서 8가지 감정 표현을 분석하였다. 먼저 각 장면별 수동으로 감정을 태깅하였고, 이 때 8가지 감정 중 분노, 공포, 그리고 놀람이 가장 우세하게 나타났는데, 이는 스릴러 영화 장르를 고려할 때 의미있다고 할 수 있다. 또한, 스토리에서 긴장이 가장 고조되는 클라이맥스에서 다양한 감정이 복합적으로 나타난다고 가정하였고, 대본 상에서 3 부분의 클라이맥스를 확인할 수 있었다. 그 다음으로 파이썬 (Python) 프로그래밍 언어 기반 자연어처리 도구인 NLTK (Natural Language ToolKit)의 감성 분석 도구를 이용하여 수동 감정 태깅과 비교한 결과, 분노와 공포 감정에서 높은 일치율을, 그리고 놀람, 기대, 혐오 감정에서는 낮은 일치율을 보임을 확인하였다.

대학 수업에서 소셜 북마킹의 활용: 학생 인식 및 행태를 중심으로 (Social Bookmarking Use in University Courses: Student Perceptions and Behaviors)

  • 박옥남;정영숙
    • 정보관리학회지
    • /
    • 제26권2호
    • /
    • pp.65-82
    • /
    • 2009
  • 본 연구에서는 대학강좌에서 학생들의 소셜 북마킹 도구에 대한 인식 및 사용 행태를 분석하였다. 소셜 북마킹의 가치에 대한 최근 활발한 논의에도 불구하고 실제 이용자들이 어떻게 소셜 북마킹을 사용하는가에 대해서는 알려진 바가 많지 않다. 본 연구는 수업에서 학생들의 소셜 북마킹 도구인 딜리셔스 사용 행태와 인식을 바탕으로 소셜 북마킹이 제시하는 가치들이 실제에서 어떻게 나타나는지를 조사하였다. 학생들은 태깅, 기술, 네트워크의 기능을 소극적으로 사용하고 있었다. 이용자는 여전히 개인 정보 수집 및 관리의 도구로써 소셜 북마킹을 사용하고 있었으며, 소셜 북마킹 도구는 정보의 사용 및 재사용성은 향상시키고 있었으나 소셜 북마킹 도구가 지향하는 협력기반 정보공유, 협력기반 커뮤니티 구축 및 도메인 검색의 가치는 충분히 실현되지 못하고 있는 것으로 나타났다.

구문적 언어지식 획득 과정의 문제점 분석 및 지원도구 설계 (Problem Analysis on Syntactic Linguistic Knowledge Acquisition and Design of a Supporting Tool)

  • 이현아;박재득;장명길;박수준;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.489-496
    • /
    • 1996
  • 자연어 처리에서 언어에 대한 지식은 전자사전과 문법규칙으로 구성되어 서로 상보적 관계에 있고, 각 어휘에 대한 품사 및 기타 자질-값에 의해 매개된다. 이러한 언어지식을 전통적인 방법에서는 국어자료의 분석에 경험이 많은 언어전문가의 직관에 다분히 의존하여 정의하였고, 말뭉치를 이용한 자동 획득 기법에서는 태그세트를 먼저 설정하고, 이 태그를 원시 말뭉치에 부착하여 태깅된 말뭉치로부터 자동으로 통계적 분석을 통하여 획득한다. 그런데 두가지 접근방법이 가지고 있는 공통적인 문제점은 품사나 자질-값의 정의 및 할당기준, 선악의 평가기준, 튜닝에 대한 적극적 대처 등이 마련되어 있지 않다는 점이다. 이 연구에서는 이러한 문제점의 발생원인을 말뭉치 분석 과정에서 살펴보고, 품사 및 자질-값의 설정과 할당기준을 마련하는 방법론 및 이를 적극적으로 지원하는 도구를 설계한다.

  • PDF