• Title/Summary/Keyword: 태깅 시스템

검색결과 197건 처리시간 0.032초

규칙과 비감독 학습 기반 통계정보를 이용한 품사 태깅 시스템 (Part-of-Speech Tagging System Using Rules/Statistics Extracted by Unsupervised Learning)

  • 이동훈;강미영;황명진;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.445-447
    • /
    • 2005
  • 본 논문은 규칙 기반 방법과 통계 기반 방법을 동시에 사용함으로써 두 가지 방법의 장단점을 상호 보완한다. 한 문장에 대한 최적의 품사열은 HMM을 기반으로 Viterbi Algorithm을 사용하여 선택한다. 이때 파라미터 값은 규칙에 의한 가중치 값과 통계 정보를 사용한다. 최소한의 일반규칙을 사용하여 구축한 규칙의 적용에 따라 가중치 값을 구하며 규칙을 적용받지 못하는 경우는 비감독학습으로 추출한 통계정보에 기반을 둔 가중치 값을 이용하여 파라미터 값을 구한다. 이러한 기본 모델을 여러 회 반복하여 학습함으로써 최적의 통계기반 가중치를 구한다. 규칙과 비감독 학습으로 추출한 통계정보를 이용한 본 품사 태깅 시스템의 어절 기반 정확도는 $97.78\%$이다.

  • PDF

MP3 태그의 XML 확장을 이용한 동기화된 재생 시스템 (Synchronized MP3 Playing System Using XML Extension of MP3 Tag)

  • 곽미라;조동섭
    • 정보처리학회논문지B
    • /
    • 제9B권1호
    • /
    • pp.67-76
    • /
    • 2002
  • 고품질의 오디오 표준인 MP3포맷의 사용이 증가하면서, 오디오 데이터 외에 작곡가, 가사 등의 관련정보를 함께 저장하려는 요구가 나타났고 이를 만족하는 태깅 시스템들이 등장했다. 특히 ID3 vl 태그와 Lyrics3 v2 태그를 함께 사용하는 태깅 방법이 많이 사용되고 있다. 그러나 이 태그들은 MP3 파일 내에서 오디오 스트림의 뒷부분에 기록되므로, 이러한 태깅 방법이 적용된 MP3 파일이 스트리밍 방식으로 전달되는 경우 사용자는 전체 스트림이 로컬 시스템에 전송되기 전까지 태그 정보를 볼 수 없다. 또한 태그 정보들 중 오디오 스트림에 시간적으로 동기화된 정보들은 동기화의 기능을 잃는다. 본 논문에서는 원격지로부터 전달되는 MP3 파일의 재생시 태그 정보가 무시되는 문제를 해결하였다. XML을 사용하여 MP3 오디오 객체를 모델링하였고, 그 요소들의 시간관계성과 동기성을 HTML+TIME 방식으로 표현하는 XSL 문서를 설계하여 오디오 데이터가 시간성과 동기성을 가지고 웹 상에서 재생되도록 하였다.

태깅 시스템의 태그 추천 알고리즘 (Tag Recommendation Algorithms in Tagging System)

  • 김현우;이강표;김형주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권9호
    • /
    • pp.927-935
    • /
    • 2010
  • 웹 2.0 시대에는 웹 상의 사용자들이 수많은 멀티미디어 컨텐츠를 생성함에 따라서 멀티미디어 검색이 더욱 중요하게 되었다. URL, 사진, 동영상과 같은 웹 컨텐츠를 설명하는 간단한 키워드인 태그는, 웹 컨텐츠의 메타데이터 역할을 하고 있다. 태그가 달린 데이터의 양이 많아지면 훨씬 풍부한 메타데이터를 포함한 웹 컨텐츠를 대상으로 검색이 가능하기 때문에 태그를 이용한 검색으로 사용자가 원하는 결과를 찾을 수 있는 가능성이 높아지게 된다. 하지만 실제로 태그를 사용하는 사용자의 수는 많지 않다. 태그를 입력하는 과정이 번거롭기 때문이거나 어떠한 태그를 입력하는 것이 다른 사용자들로부터의 접근성을 높일 수 있는지 모르기 때문이다. 이러한 문제를 해결하기 위해서, 사용자의 태그 입력 과정을 도와주는 기법인 태그 추천이 연구되었다. 사용자가 어떠한 웹 컨텐츠를 게재하려고 할 때, 태그 추천 시스템이 해당 웹 컨텐츠에 적절한 태그를 추천하면, 사용자는 적절한 태그를 선택하는 것으로 태그 입력이 이루어진다. 본 연구에서는 이러한 태깅 시스템에서의 다양한 태그 추천 방법론을 분석하고, 분류하였다.

품사 태그 세트의 매핑을 이용한 한국어 품사 태거 (POSTAG) 이식 (Porting POSTAG using Part-Of-Speech TagSet Mapping)

  • 김준석;심준혁;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.484-490
    • /
    • 1999
  • 품사 태그세트 매핑은 서로 다른 품사 태그세트로 태깅되어 있는 대량의 코퍼스들로부터 정보를 얻고 또한 제공함을 통해 코퍼스의 재사용성(reusability)을 높이는데 유용하게 사용된다. 본 논문은 포항공대 자연언어처리 연구실의 자연언어처리 엔진(SKOPE)의 품사 태거(POSTAG)에서 사용되는 태그세트와 한국전자통신연구원의 표준 태그세트 간의 양방향 태그세트 매핑을 다룬다. 매핑을 통해 표준태그세트로 태깅된 코퍼스로부터 POSTAG를 위한 대용량 학습자료를 얻고 POSTAG 가 두 가지 태그세트로 결과를 출력할 수 있다. 특히 한국어 태그세트 매핑에서 발생할 수 있는 여러 가지 문제점들, 즉 사전 표제어 차이 (형태소 분할 차이), 태그 할당 차이, 축약 처리 차이 등과 그것들의 기계적인 해결책을 살펴보고, 태그세트 매핑의 정확도를 측정하기 위해서 매핑 전과 후의 태깅 시스템의 정확도를 서로 비교함으로써 매핑의 정확도를 측정하는 실험을 수행하였다. 본 자동 매핑 방법을 반영한 POSTAG 는 제 1회 형태소 분석기 평가 대회(MATEC'99)에 적용되어 성공적으로 사용되었다.

  • PDF

웹을 이용한 개체명 부착 말뭉치의 자동생성과 정제 (Automatic Generation of Named Entity Tagged Corpus using Web Search Engine)

  • 안주희;이승우;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-91
    • /
    • 2002
  • 최근 정보 추출, 질의응답 시스템 등의 고정밀 자연어처리 어플리케이션이 부각됨에 따라 개체명 인식의 중요성이 더욱 커지고 있다. 이러한 개체명 인식을 위한 학습에는 대용량의 어휘자료를 필요로 하기 때문에 충분한 학습 데이터, 즉 개체명 태그가 부착된 충분한 코퍼스가 제공되지 못하는 경우 자료희귀문제(data sparseness problem)로 인하여 목적한 효과를 내지 못하는 경우가 않다. 그러나 태그가 부착된 코퍼스를 생성하는 일은 시간과 인력이 많이 드는 힘든 작업이다. 최근 인터넷의 발전으로 웹 데이터는 그 양이 매우 많으며, 습득 또한 웹 검색 엔진을 사용해서 자동으로 모음으로써 다량의 말뭉치를 모으는 것이 매우 용이하다. 따라서 최근에는 웹을 무한한 언어자원으로 보고 웹에서 필요한 언어자원을 자동으로 뽑는 연구가 활발히 진행되고 있다. 본 연구는 이러한 연구의 첫 시도로 웹으로부터 다량의 원시(raw) 코퍼스를 얻어 개체명 태깅 학습을 위한 태그 부착 코퍼스를 자동으로 생성하고 이렇게 생성된 말뭉치를 개체면 태깅 학습에 적용하는 비교 실험을 통해 수집된 말뭉치의 유효성을 검증하고자 한다. 향후에는 자동으로 웹으로부터 개체 명 태깅 규칙과 패턴을 뽑아내어 실제 개체명 태거를 빨리 개발하여 유용하게 사용할 수 있다.

  • PDF

폭소노미에서 이미지 자동 태깅을 위한 사회적 관계 추출에 관한 연구 (Study for social relationship extraction for automatically image tagging in Folksonomy)

  • 엄원용;이시형;노용만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.425-428
    • /
    • 2010
  • 멀티미디어 기기의 확산과 인터넷의 발달로 Flickr, Facebook 과 같은 사회적 네트워크를 기반으로 이미지 공유가 활발해졌다. 사회적 네트워크 사이트에서 이미지의 효율적인 검색과 관리를 위해서 태그를 이용하는 방법이 많이 사용되고 있다. 하지만 많은 양의 이미지에 수동으로 태그를 등록하는 것은 사용자에게 많은 시간과 노력을 요구한다. 태그 추천 기술은 자동으로 사용자에게 태그를 추천함으로써, 수동 태깅의 한계를 극복할 수 있는 방법이다. 본 논문에서는 사회적 네트워크를 기반으로 하는 폭소노미에서 사용자 사이의 사회적 관계를 사용자 들의 얼굴 정보를 이용하여 측정하고, 이를 활용하여 이미지 태그를 추천하는 기술을 제안한다. 제안하는 방법은 이미지의 시각 정보와 태그 분포뿐만 아니라 사용자 사이의 사회적 관계 정보를 추가로 활용한다. 실험을 통해서 제안하는 방법이 기존의 이미지 태그 추천 방법에 비해서 7% 향상된 태그 추천의 정확성을 보장하는 것을 증명하였다.

한국어 생략어복원 가이드라인 (Korean Zero Anaphora Resolution Guidelines)

  • 류지희;임준호;임수종;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.213-219
    • /
    • 2017
  • 말과 글에서 유추가 가능한 정보에 대해서는 사람들이 일반적으로 생략해서 표현하는 경우를 볼 수 있다. 사람들은 생략된 정보를 문맥적으로 유추하여 이해하는 것이 어렵지 않지만, 컴퓨터의 경우 생략된 정보를 고려하지 못해 주어진 정보를 완전하게 이해하지 못하는 문제를 낳게 된다. 우리는 이러한 문제를 생략어복원을 통해 해결할 수 있다고 여기면서 본 논문을 통해 한국어 생략어복원에 대해 정의하고 기술 개발에 필요한 말뭉치 구축 시의 생략어복원 대상 및 태깅 사례를 포함하는 가이드라인을 제안한다. 또한 본 가이드라인에 의한 말뭉치 구축 및 기술 개발을 통해서 엑소브레인과 같은 한국어 질의응답 시스템의 품질 향상에 기여하는 것이 본 연구의 궁극적인 목적이다.

  • PDF

한국어 생략어복원 가이드라인 (Korean Zero Anaphora Resolution Guidelines)

  • 류지희;임준호;임수종;김현기
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.213-219
    • /
    • 2017
  • 말과 글에서 유추가 가능한 정보에 대해서는 사람들이 일반적으로 생략해서 표현하는 경우를 볼 수 있다. 사람들은 생략된 정보를 문맥적으로 유추하여 이해하는 것이 어렵지 않지만, 컴퓨터의 경우 생략된 정보를 고려하지 못해 주어진 정보를 완전하게 이해하지 못하는 문제를 낳게 된다. 우리는 이러한 문제를 생략어복원을 통해 해결할 수 있다고 여기면서 본 논문을 통해 한국어 생략어복원에 대해 정의하고 기술 개발에 필요한 말뭉치 구축 시의 생략어복원 대상 및 태깅 사례를 포함하는 가이드라인을 제안한다. 또한 본 가이드라인에 의한 말뭉치 구축 및 기술 개발을 통해서 엑소브레인과 같은 한국어 질의응답 시스템의 품질 향상에 기여하는 것이 본 연구의 궁극적인 목적이다.

  • PDF

브라우저 북마크 분류를 키워드로 사용하는 웹페이지 공유를 위한 협동적 URL 태깅 방식 (A Collaborative URL Tagging Scheme using Browser Bookmark Categories as Keyword Support for Webpage Sharing)

  • 니코 엔카나시온;양현호
    • 한국전자통신학회논문지
    • /
    • 제8권12호
    • /
    • pp.1911-1916
    • /
    • 2013
  • 소셜 태깅 시스템이 직면한 중요한 과제 중 하나는 급격하게 증가하는 태그의 양적 증가와 다양성에 대한 대처방안이다. 구조화된 주석 시스템과는 반대로 태그는 사용자에게 웹 콘텐츠에 주석을 달고 조직화하는 비구조적, 개방적 메커니즘을 제공한다. 본 논문에서는 사용자 정의 태그, URL 키워드, 그리고 분류 폴더 이름을 주요 구성 요소로 하는 폭소노미 기반의 URL 추천 방식을 제안한다. 이 방식은 더욱 개선되어 브라우저의 확장 기능으로 구성될 경우 사용자에게 특정 URL을 분류하는 최상의 방안을 제안할 수 있다.