• 제목/요약/키워드: 태깅 시스템

검색결과 197건 처리시간 0.021초

최대 엔트로피 모텔 기반 품사 태거의 성능 향상 기법 (Techniques for improving performance of POS tagger based on Maximum Entropy Model)

  • 조민희;김명선;박재한;박의규;나동열
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.73-81
    • /
    • 2004
  • 한국어에서의 품사 결정 문제는 형태론적 중의성 문제도 있지만, 영어에는 발생하지 않는 동품사 중의성 문제로 더 까다롭다. 이러한 문제들은 어휘 문맥을 고려하지 않고서는 해결하기 어렵다. 통계 자료 부족 문제에 쉽게 대처하는 모델이 필요하며 문맥에 따른 품사를 결정하고자 할 때 서로 다른 형태의 여러 가지 어휘 문맥 정보를 반영할 수 있는 모델이 필요하다. 본 논문에서는 이런 점에 가장 적합한 최대 엔트로피(maximum entropy : ME) 모델을 품사태깅 작업에 이용하는 문제에 대해 다룬다. 어휘 문맥 정보를 이용하기 위한 자질함수가 매우 많아지는 문제에 대처하기 위해 필요에 따라 어휘 문맥 정보를 사전화 한다. 본 시스템의 특징으로는 어절 단위 품사 태깅을 위한 처리 기법. 어절의 형태소 분석열에 대한 어절 내부 확률 계산. ME 모델의 정규화 과정 생략에 의한 성능 향상, 디코딩 경로의 확장과 같은 점들이 있다. 실험을 통하여 본 연구의 기법이 높은 성능의 시스템을 달성할 수 있음을 알게 되었다.

  • PDF

태그의 문맥 정보를 이용한 웹 자원 추천 시스템 (Tag Based Web Resource Recommendation System)

  • 송제인;정옥란
    • 인터넷정보학회논문지
    • /
    • 제17권6호
    • /
    • pp.133-141
    • /
    • 2016
  • 최근의 여러 웹서비스에서는 태깅 기능을 제공함으로써 사용자가 작성하는 게시물의 주제를 표현하도록 유도하고 있다. 태그를 이용하면 글이나 사진에 대한 글쓴이의 감정과 같은 문맥적인 정보의 효과적인 추출이 가능하기 때문에, 기계적인 방식보다 글의 내용에 대해서 더 나은 의미 파악이 가능하다. 따라서 이를 추천시스템에 적용한다면 사용자의 만족도를 높일 수 있는 추천이 가능할 것이다. 본 논문에서는 게시글에 속한 태그들 간의 관계를 계산하고, 효율적인 유사도 측정 알고리즘을 통해 게시글과 사용자등의 웹 자원을 추천하는 방법을 제안한다. 마지막으로, 실험을 통해 제안한 방법의 유효성을 검증하고, 사용자의 만족도를 측정하였다.

정보검색의 시맨틱웹 지향 설계에 관한 연구 - 온톨로지와 소셜태깅을 활용한 탐험적 발견행위 모델개발을 중심으로 - (A Study of a Semantic Web Driven Architecture in Information Retrieval: Developing an Exploratory Discovery Model Using Ontology and Social Tagging)

  • 조명대
    • 한국비블리아학회지
    • /
    • 제21권3호
    • /
    • pp.151-163
    • /
    • 2010
  • 이 논문에서는 기존 정보검색모델에서의 문제점을 살펴보고 그 대안을 제시하고 있다. 정보환경의 변화에 따라 '개념'중심의 새로운 정보조직인 온톨로지와 소셜태깅은 탐험적 발견행위를 가능하게 해줄 수 있다. 이들을 통해 어느 한 이용자의 머릿속에 있는 생각을 인터넷상의 수많은 사람의 머릿속에 있는 생각을 연결해주고 있다. 이러한 상호작용을 통한 연결고리를 통해서 이젠 이용자들이 탐험적으로, 적극적으로 정보를 찾아 나서고 있다. 이에 본 연구의 목적은 질적인 연구방법론으로 온톨로지와 소셜태깅에서 제공되는 수많은 탐색촉진제의 존재를 밝힌 후, 하나의 탐험적 발견행위 모델을 만들어내는 것이다. 그 결과는 먼저 3개의 상위그룹이 형성되었다. 첫째, 브라우징 및 모니터링으로 어떤 대상을 인지 및 집중하는 단계, 둘째, 의미부여로 적극적인 참여 및 공유하는 단계이며 셋째는 더 적극적으로 생각을 확장시켜나가면서 스스로 사회적 학습을 하는 단계였다. 제일 첫 그룹에는 정보요구인지, 소셜공간에서 도움 필요성인지, 도움을 받을 수 있는 자료 발견, 일단 멈춤, 그 대상에 집중등의 단계가 있었다. 두 번째 그룹에는 적극적 의미형성, 소셜 북마킹 및 태깅, 소셜 네트워크에서 나눔, 처음 정보요구를 더 구체화하는 단계가 있었다. 세 번째는, 발견적인 소셜학습, 우연한 정보 발견, 창조적 생각을 유발, 문제 해결 능력향상 등의 총 13단계를 발견하게 되었다. 이 모델은 이용자들이 탐험적 발견행위를 할 수 있는 능력을 향상하게 시키는 정보시스템 디자인에 공헌할 수 있을 것이다.

이동 물체의 태깅을 위한 디지털 빔포밍 기반 RFID 시스템 (Beamforming based RFID System for Moving Target Tagging)

  • 전성하;전현무;신성관;손채봉;양훈기
    • 한국정보통신학회논문지
    • /
    • 제18권7호
    • /
    • pp.1713-1720
    • /
    • 2014
  • RFID 기술은 태그 아이디 정보 획득이라는 기본적인 역할을 넘어 태그 아이디와 위치 정보를 동시에 획득하는 기술이 개발되고 있으며 최근 들어서는 이동태그의 속도, 방향 등 부가적인 정보도 획득하는 방향으로 발전하고 있다. 본 논문에서는 서로 다른 속도로 이동하는 다수의 태그 부착 물체들에 대한 태그 아이디 획득 및 거리, 속도 등 부가적인 정보를 추출할 수 있는 RFID 시스템을 제안한다. 제안된 시스템에서는 태그는 FMCW로 변조된 아이디 신호를 전송하며 리더는 배열(array) 안테나를 이용해서 방위각 방향으로 태그 신호를 일차 분리하고 이어서 FMCW 복조를 통해서 속도, 거리 외에 태그 아이디를 복조한다. 요구된 기능을 수행하기 위한 리더 수신부 구조를 제시하고 제시된 시스템이 동작 가능함을 이론적으로 분석하며 시뮬레이션을 통해서 제시된 시스템의 성능을 검증한다.

태그 동시 출현의 동적인 특징을 이용한 개선된 태그 클라우드의 태그 선택 방법 (Improved Tag Selection for Tag-cloud using the Dynamic Characteristics of Tag Co-occurrence)

  • 김두남;이강표;김형주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권6호
    • /
    • pp.405-413
    • /
    • 2009
  • 태깅 시스템은 인터넷 사용자로 하여금 태그라고 불리는 메타데이터를 글, 사진, 동영상 등에 부여하도록 하여서 컨텐츠의 검색 및 브라우징을 편리하게 하는 시스템이다. 컨텐츠의 브라우징을 위해서 태그 클라우드라는 시각적 인터페이스가 널리 쓰이고 있다. 태그 클라우드는 가장 빈도수가 높은 태그들을 알파벳 순으로 보여주고 폰트의 크기로 그 태그들의 빈도수를 반영한다. 하지만 기존의 태그 선택 방법은 몇 가지 단점들이 알려져 있다. 그래서 이 논문은 참신한 컨텐츠들을 찾을 수 있도록 Freshness라는 태그 클라우드를 위한 새로운 태그 선택 방법을 정의하였다. Freshness는 태그 동시 발생 확률 분포(tag co-occurrence probability distribution)가 동적으로 변화하는 것을 Kullback-Leibler divergence로 평균한 값이다. Allblog, Eolin, Technorati 등 세 개의 웹사이트로부터 실제 태그 데이터를 수집하여 우리의 태그 클라우드를 생성하는 시스템, 'Fresh Tag Cloud'를 구축하였다. 이 태그 클라우드를 Allblog에서 수집한 데이터에서 전통적인 태그 클라우드와 비교했을 때 중복평균이 87.5% 감소하여서 성능이 더 향상된 것을 확인할 수 있다.

추천 시스템 정확도 개선을 위한 협업태그와 사용자 행동패턴의 활용과 이해 (Understanding Collaborative Tags and User Behavioral Patterns for Improving Recommendation Accuracy)

  • 김일주
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.99-123
    • /
    • 2018
  • 웹상에서의 기하급수적으로 증가하는 정보의 양으로 인해, 중요하고 가치 있는 데이터를 변별 해 내는 작업은 그 어느 때보다도 중요하다고 하겠다. 추천 시스템은 이러한 정보의 과 공급 문제를 해결하기 위한 가장 효과적인 방법 중 하나임에도 불구하고, 그 성능은 기존 방식들에서 크게 진전을 이루지 못하고 있는 것이 사실이다. 따라서 본 논문에서는 이 문제를 진전시키기 위해, 협업태그를 활용한 새로운 사용자 프로파일링 기법을 제안하고 사용자의 평가 및 태깅패턴을 분석, 그 활용 또한 모색한다. 본 논문에서 제안하는 기법의 검증을 위해, 해당 프로파일링 기법을 활용 한 혼합 영화 추천 시스템을 구현하고 실제 데이터를 사용하여 기존의 추천 방식 대비 그 경쟁력을 검증하였다. 그와 더불어, 민감도 분석을 통해 사용자의 태깅패턴과 평가패턴에 기반한 차별적인 추천 방식의 잠재적 가능성 또한 제안, 검증한다.

태스크 기반 대화 시스템 구축 도구 (Workbench for building Task based Dialog System)

  • 박은진;권오욱;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.209-211
    • /
    • 2012
  • 본 논문의 대화시스템 구축도구는 태스크 기반 대화 시스템을 구축하는데 필요한 대화 시나리오 지식과 이를 처리하는 태스크 그래프, 슬롯 체계, 대화 라이브러리 등을 생성하고 관리할 수 있는 웹기반 대화 시스템 구축 도구이다. 이 도구는 태스크 그래프를 시각적으로 대화 모델 설계자에게 표시하고, 대화 모델 설계자는 시각적으로 표시된 태스크 그래프를 보며 태스크의 흐름을 한눈에 파악하고 대화 시스템의 시나리오 흐름을 생성하고 편집할 수 있도록 한 것이 특징이다. 또한 대화 모델 설계자와 시나리오 태깅 작업자들 모두는 자신이 구축한 지식이나 대화 태스크를 시스템에 직접 반영하고 실시간으로 대화 시스템에 적용해 봄으로써 대화 시스템의 이해를 높이고 고품질의 대화 시스템을 구축할 수 있다.

  • PDF

커널 Ripple-Down Rule을 이용한 태깅 말뭉치 오류 자동 수정 (Automatic Correction of Errors in Annotated Corpus Using Kernel Ripple-Down Rules)

  • 박태호;차정원
    • 정보과학회 논문지
    • /
    • 제43권6호
    • /
    • pp.636-644
    • /
    • 2016
  • 자연어처리에서 기계학습을 위한 학습 말뭉치는 매우 중요하다. 정제된 대량의 말뭉치는 자연어처리 시스템에 직접 영향을 준다. 본 논문에서는 대량의 말뭉치 오류를 자동으로 수정하는 새로운 방법을 제안한다. 오류 말뭉치와 정답 말뭉치에서 사람이 태깅한 문서의 특성을 반영한 수정 규칙을 자동으로 생성하였다. 수정 규칙은 RDR(Ripple-Down Rules)를 사용하여 표현하였다. 수정 방법의 가치를 보이기 위해 품사 부착 말뭉치와 개체명 부착 말뭉치에 대해서 실험하였으며 두 분야에서 유의미한 결과를 보였다. 이 방법은 대량의 말뭉치를 제작할 때 오류를 최소화하는 방법으로 사용이 가능하다.

영한 기계 번역을 위한 혼합형 N-best 품사 태거 (A Hybrid N-best Part-of-Speech Tagger for English-Korean Machine Translation)

  • 임희석;권철중;이재원;오기은
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.15-19
    • /
    • 1998
  • 기계 번역 시스템에서 품사 태거의 오류는 전체번역 정확률에 결정적인 영향을 미친다. 따라서 어휘 단계의 정보만으로는 중의성 해소가 불가능한 단어에 대해서는 중의성 해소에 충분한 정보를 얻을 수 있는 구문 분석이나 의미 분석 단계까지 완전한 중의성 해소를 유보하는 N-best 품사 태거가 요구된다. 또한 N-best 품사 태거는 단어에 할당되는 평균 품사 개수를 최소화함으로써 상위 단계의 부하를 줄이는 본연의 역할을 수행하여야 한다. 본 논문은 통계 기반 품사 태깅 방법을 이용하여 N-best 후보를 선정하고, 선정된 N-best 후보에 언어 규칙을 적용하여 중의성을 감소시키거나 오류를 보정하는 혼합형 N-best 품사 태깅 방법을 제안한다 제안된 N-best 품사 태거는 6만여 단어의 영어 코퍼스에서 실험한 결과, 단어 당 평균 1.09개의 품사를 할당할 때 0.43%의 오류율을 보인다.

  • PDF

변형 규칙 기반 한국어 품사 태거의 개선 (Improvement of Transformation Rule-Based Korean Part-Of-Speech Tagger)

  • 임희석;김진동;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.216-221
    • /
    • 1996
  • 변형 규칙 기반 품사 태거는 태깅 규칙을 코퍼스로부터 자동 학습할 수 있고, 견고하며 태깅 결과를 이해하고 분석하기가 쉽다는 장점을 갖는다. 이에 최근 한국어 특성을 고려한 변형 규칙 기반 한국어 품사 태거가 개발되었다. 하지만 이 시스템은 오류 어절의 어휘 정보를 사용하지 않으므로 수정 가능 오류에 대한 변형 규칙이 제대로 학습되지 못하며, 변형 규칙 적용 과정에 새로운 오류를 발생시킨다는 문제점이 있다. 이에 본 논문은 오류 어절의 어휘 정보를 참조할 수 있는 세부변형 규칙 추출을 이용한 변형 규칙 기반 한국어 품사 태거의 개선 방안을 제안한다. 어휘 정보를 참조할 수 있는 세부 변형 규칙의 형태는 특정 문맥 C에서 어절 W의 어절 태그 ${\alpha}$를 어절 태그 ${\beta}$로 변형한다와 같다. 제안된 방법은 약 10만 어절 크기의 학습 코퍼스에서 57개의 세부 규칙을 학습하였고, 2만 어절 크기의 실험코퍼스에 적용한 결과 95.6%의 정확도를 보임으로써 기존의 변형 규칙 기반 품사 태거의 정확도를 약 15.4% 향상시켰다.

  • PDF