• 제목, 요약, 키워드: URI

검색결과 203건 처리시간 0.036초

한국어 텍스트의 개체 URI 탐지: 품사 태깅 독립적 개체명 인식과 중의성 해소 (A Non-morphological Approach for DBpedia URI Spotting within Korean Text)

  • 김영식;함영균;김지성;황도삼;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • /
    • pp.100-106
    • /
    • 2014
  • URI spotting (탐지) 문제는 텍스트에 있는 단어열 중에서 URI로 대표되는 개체(entity)에 해당되는 것을 탐지하는 것이다. 이 문제는 두 개의 작은 문제를 순차적으로 해결하는 과제이다. 즉, 첫째는 어느 단어열이 URI에 해당하는 개체인가를 인식하는 것이고, 둘째는 개체 중의성 해소 문제로서 파악된 개체가 복수의 URI에 해당할 수 있는 의미적 모호성이 있을 때 그 URI중 하나를 선택하여 모호성을 해소하는 것이다. 이 논문은 디비피디아 URI를 대상으로 한다. URI 탐지 문제는 개체명 인식 문제와 비슷하나, URI(예를 들어 디비피디아 URI, 즉 Wikipedia 등재어)에 매핑될 수 있는 개체로 한정되므로 일반적인 개체명 인식 문제에서 단어열의 품사열이 기계학습의 자질로 들어가는 방법론과는 다른 자질을 사용할 수 있다. 이 논문에서는 한국어 텍스트를 대상으로 한국어 디비피디아 URI 탐지문제로서 SVM을 이용한 개체경계 인식 방법을 제시하여, 일반적 개체명 인식에서 나타나는 품사태거의 오류파급효과를 없애고자 한다. 또한 개체중의성 해소 문제는 의미모호성이 주변 문장들의 토픽에 따라 달라지므로, LDA를 활용하며 이를 영어 디비피디아 URI탐지에서 쓰인 방법들과 비교한다.

  • PDF

URI 중의성 해소 및 오류 감소를 위한 LDA 기반 접근법 (LDA-based Approach for URI Disambiguation and Error Reduction)

  • 김지성;김영식;함영균;황도삼;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • /
    • pp.107-111
    • /
    • 2014
  • URI 중의성 해소 문제는 주어진 문서 내의 특정 단어에 연결 가능한 여러 URI가 주어졌을 때 진짜 URI 하나를 선택해내는 문제라고 할 수 있다. 이 문제는 다양한 해결법들이 존재할 수 있지만 기존에 연구된 문서의 문맥 간 유사도를 이용하여 해결하는 방법을 본 논문에서는 사용한다. 문맥 간 유사도를 이용하는 방법은 영어 디비피디아 URI spotting에서 TF*ICF방법으로 이미 연구가 되어있다. 본 논문에서는 Latent Dirichlet Allocation을 이용하여 URI 중의성 해소 문제를 다룰 것이며 그 범위를 한국어 디비피디아로 한정한다. 새로 제안하는 방법이 URI 중의성 해소 문제를 얼마나 잘 해결하며, 기존의 연구와 비교하여 얼마나 향상될 수 있는지를 분석한다. 또한 기존의 방법과 새로 제안한 방법 각자가 고유하게 풀 수 있는 문제가 존재함을 보이고, 두 방법을 병합하였을 때 보다 높은 성능에 도달할 수 있음을 전망한다.

  • PDF

웹 2.0을 위한 다국어 식별자 기반의 Cool URI에 대한 연구 (A Research on Cool URI based on Internationalized Resource Identifier for Web 2.0)

  • 정의현;김원;송관호;박찬기
    • 한국컴퓨터정보학회논문지
    • /
    • v.11 no.5
    • /
    • pp.223-230
    • /
    • 2006
  • 차세대 웹은 표현 중심의 웹을 데이터 중심의 웹으로 이끌 것으로 예측되며, Web 2.0과 시맨틱 웹의 기술적 결합이 될 것이다. 차세대 웹은 시맨틱 처리, 웹 플랫폼과 데이터 결합이 매우 중요한 기술적 요소이다. 이 중에서 데이터 결합에 사용되는 Cool URI는 영속적이고 사용자 친화적인 URI를 제공하는 기술이며, 이미 블로그 등에서 매우 중요하게 사용되고 있다. 그러나 Cool URI는 한글과 같은 다국어 환경에 적합하도록 구성되어 있지 않으며 여러 인코딩이 혼재된 국내 웹 환경에서는 쉽게 사용하기 어려운 상황이다. 본 논문에서는 이러한 Cool URI를 다국어 식별자와 같이 사용하기 위한 기술적인 고려 사항 및 Cool URI 웹 컴포넌트에 관하여 논한다. 제시한 방식은 인코딩의 종류에 상관없이 동일한 기능을 제공하며, 다른 애플리케이션에서 쉽게 사용 가능하도록 파일 시스템 기반과 CGI 기반 방식을 모두 지원한다. 여러 환경에서 실험한 결과는 구현된 웹 컴포넌트가 설계 목표를 만족함을 보여주었다.

  • PDF

화상 URI 표준화를 위한 네임스페이스 구성에 관한 연구 (A Study on composition of the Namespace for an Imaging URI standardization)

  • 최지원;김기천
    • 한국정보과학회:학술대회논문집
    • /
    • /
    • pp.544-546
    • /
    • 2003
  • 인터넷의 급속한 발전으로 인해 네트워크를 통한 텍스트, 이미지. 사운드, 비디오 등과 같은 디지털 컨텐츠의 유통이 점차 대용량으로 변화하고 있다. 이러한 컨텐츠의 유통을 위해 쓰이는 URI는 텍스트의 한 페이지, 사운드 또는 비디오 클립, 정지 화상과 동영상은 물론 프로그램과 같은 컨텐츠를 인식하는데 쓰이고 URL을 이용하여 정보자원의 물리적 위치를 표시하는 문자열을 통해 정보자원에 접근하고 검색하게 된다. 하지만 휴대용 단말기를 이용하는 경우 단점이라 할 수 있는 입력기능의 제한으로 인해 정보이용이 쉽지 않기 때문에 정보 접근을 위한 새로운 URI 체계와 서비스 환경이 필요하다. 새로운 URI 체계에 하나의 대안으로 바코드나 특정 이미지와 같은 화상을 이용할 수 있는 방법이 있으며 이를 화상 URI로 체계화시키는 작업이 필요하다. 본 논문에서는 관련 기술들을 연구하고 화상 URI 시스템에서 사용되어질 URI 체계를 현재 세계 표준으로 유력한 DOI를 따르는 네임스페이스 구성에 관하여 연구하고 서비스 제공을 위해 구축되어져야할 환경에 관해 기술한다.

  • PDF

국내 한의학계에 보고된 흑색종 관련 실험적 연구들의 비교 고찰 (The Comparison Consideration on Experimental Articles about Melanoma Published in Journals of Korean Medicine)

  • 권강;김남권;김선영;이동진;김철윤;서형식
    • 한방안이비인후피부과학회지
    • /
    • v.28 no.3
    • /
    • pp.30-47
    • /
    • 2015
  • Objective : Melanoma is a very critical and devastating disease. Although many people have depended on surgical operation in melanoma treatment, they have placed importance on non-invasive methods constantly. So we planned to establish a research methodology by analysing existing articles containing conservative melanoma treatments in Journals of Korean Medicine published in Korea.Methods : Using search words of anti-cancer, B16, cancer, lung metastasis, melanoma, metastasis, S-100, SK-MEL, tumor, tyrosinase, we collected 26 articles by searching internet portal sites as following;Using search words of anti-cancer, B16, cancer, lung metastasis, melanoma, metastasis, S-100, SK-MEL, tumor, tyrosinase, we collected 26 articles by searching internet portal sites as followinghttp://oasis.kiom.re.kr,http://www.koreantk.com,http://www.riss.kr,http://www.dbpia.co.kr,http://www.ndsl.kr,http://kiss.kstudy.com,http://www.naver.com,http://www.google.com.Result : The number of articles is 26 and in the year of 2003, 2004 is ranked the highest number in publication. The journal of acupuncture & moxibustion society ranked the highest(30.8%). 2 and 4 authors ranked the highest(26.9%) in number of authors. T-test ranked the highest(58.1%) in statistics methods. P.O. med indicated in 11 articles and Pharmacopuncture in 15 articles. B16 murine melanoma cell was indicated in 25 articles by cancer-induced methods. In measurement, T cell activity was indicated in 14 articles, NK activity in 4 articles, IL-2 in 6 articles, apoptosis in 1 article, lung metastasis in 14 articles.Conclusion : Considering overall results, it is necessary to diversify cancer-induced methods and measurement methods in experimental melanoma research.

국가 과학기술 R&D 기반정보 온톨로지 구축을 위한 URI 관리 및 서비스 시스템 구현 (An Implementation of URI Management and Service System for the Construction of National R&D Reference Information Ontology)

  • 구희관;정한민;강인수;성원경;이승준;심빈구
    • 한국정보과학회:학술대회논문집
    • /
    • /
    • pp.217-219
    • /
    • 2006
  • 전체적인 관점으로 국가 과학기술 R&D를 조망하는 국가 과학기술 R&D 기반정보 온톨로지는 인력정보, 과제정보, 성과정보를 포함하며 여러 URI들과 연계된다. 본 논문에서는 기존의 단일 URI 체계가 아닌 시스템 적이고 다층적인 국가 과락기술 R&D 기반정보 온톨로지의 인스턴스 레벨에 필요한 다중 URI 관리 및 서비스 시스템을 구현한다. 본 시스템은 관리적인 측면에서 웹 인터페이스 기반 URI 등록과 조회를, 서비스 측면에서 URI 질의중심의 웹서비스를 제공한다. 기존 정보(KISTI의 KOI, 학술진흥재단의 부서 및 기관, 국가과학기술인력 종합정보시스템의 인력DB)와 연계를 기반으로 가용성 및 재사용성을 높이고 신규정보를 위한 URI 생성규칙을 제공함으로써 URI 관리 및 서비스 시스템 완성도를 높였다.

  • PDF

DNS 시스템과의 호환을 위한 화상인식 URI 구조 (Icon­uri structure for compatibility with DNS system)

  • 강현식;김기천
    • 한국정보과학회:학술대회논문집
    • /
    • /
    • pp.580-582
    • /
    • 2003
  • 본 논문에서는 인터넷 환경의 발전으로 인한 휴대폰 및 PDA등의 문자 입력이 느린 단말기를 위하여 기존의 문자열로 되어 있는 DNS와 현재 개발 및 상용화가 이루어 지고 있는 화상인식 URI서비스를 분석하여 보고 기존의 화상인식 URI가 가지고 있는 문제점인 DNS와의 호환을 통하여 적합한 화상인식 URI와 서비스 환경을 제시한다.

  • PDF

터널 리스크 평가 기법의 적용성에 대한 연구 (The application of simplified risk assessment for tunnel)

  • 김상환;이충환
    • 한국터널지하공간학회 논문집
    • /
    • v.9 no.1
    • /
    • pp.63-74
    • /
    • 2007
  • 불확실한 지반의 상태는 항상 터널 건설에 있어서 많은 문제점을 일으킨다. 그러므로 새로운 터널의 건설에 앞서 위험에 대한 평가가 필요하다. 이 논문은 수정된 안정계수를 이용한 간편 위험도 평가 시스템인 URI(Underground Risk Index)를 제안하였다. URI의 평가요소들은 각 요소의 등급에 따라 점수화하여 분석함으로서 설계단계에서 위험 가능성에 대한 평가에 이용이 가능하도록 하였으며, 기존의 Interaction Matrix에서 8개의 설계 요소 중(RQD, 일축압축강도, 풍화도, 안정계수, 토피고, 지하수위, RMR, 투수계수)안정계수 산정방법을 수정하여 보다 신뢰성을 높였다. 또한 현장적용에 대한 신뢰성을 검증하기위하여 URI 시스템을 실제현장에 적용하였다.

  • PDF

URI 서버에 기반한 국가 R&D 기반정보 온톨로지 설계 및 구현 (A Design and Implementation of National R&D Reference Information Ontology Based on URI Server)

  • 정한민;강인수;구희관;이승우;성원경
    • 정보관리연구
    • /
    • v.37 no.2
    • /
    • pp.109-136
    • /
    • 2006
  • 시맨틱 웹의 발전은 정보의 규격화, 의미화를 통한 지식을 기본으로 이루어지며, 온톨로지는 이러한 지식표현을 위해 필수적으로 사용되는 도구이다. 온톨로지상에서 개체(Individual)들은 URI(Uniform Resource Identifier)를 이용하여 유일하게 지칭될 수 있어야 한다. 예를 들어, 국가 R&D 기반정보를 모델링하고, 이를 이용하고자 하는 경우에 URI 기반의 온톨로지 설계와 구현이 필수적으로 요구된다. 그렇지만, 식별체계나 URI를 사용하기 위해서는 방대한 인적 물적 자원의 투입이 불가피하여 과학기술문헌상의 인력정보를 식별체계 기반으로 구축하고자 하는 시도가 미약한 실정이었다. 이에 본 연구는 과학기술문헌을 포함한 국가 R&D 기반정보 온톨로지 구축에서 핵심이 되는 인력정보를 포함한 다양한 정보들을 URI 기반으로 구축, 관리, 서비스하는 방법을 기술한다. 약 7,000여건의 국내학술대회 논문들로부터 획득한 기반정보는 추론 서비스를 통해 연구자 네트워크 분석, 성과통계 등 다양한 시맨틱 웹 응용 분야들에 적용된다.

ENUM 서비스를 이용한 화상 인식 URI 구조에 관한 연구 (A Study on Icon-URI structure using ENUM service)

  • 최지원;강현식;김기천
    • 한국정보과학회:학술대회논문집
    • /
    • /
    • pp.856-858
    • /
    • 2004
  • 인터넷의 급속한 발전으로 인해 네트워크를 통한 텍스트, 이미지, 사운드, 비디오 등과 같은 디지털 컨텐츠의 유통이 점차 대용량으로 변화하고 있다. 이러한 컨텐츠의 유통을 위해 쓰이는 URI는 텍스트의 한 페이지, 사운드 또는 비디오 클립, 정지 화상과 동영상은 물론 프로그램과 같은 컨텐츠를 인식하는데 쓰이고 URL을 이용하여 정보자원의 물리적 위치를 표시하는 문자열을 통해 정보자원에 접근하고 검색하게 된다. 하지만 휴대용 단말기를 이용하는 경우 단점이라 할 수 있는 입력기능의 제한으로 인해 정보이용이 쉽지 않기 때문에 정보 접근을 위한 새로운 URI 체계와 서비스 환경이 필요하다. 새로운 URI 체계에 하나의 대안으로 바코드나 특정 이미지와 같은 화상을 이용할 수 있는 방법이 있으며 이를 화상 URI로 체계화시키는 작업이 필요하다. 본 논문에서는 ENUM과 화상인식 관련 기술들을 연구하고 ENUM서비스가 실용화될 경우 ENUM서비스와 연계하여 사용할 수 있는 화상 인식 URI용 인식코드를 제안한다.

  • PDF