• Title/Summary/Keyword: Web text

검색결과 817건 처리시간 0.028초

웹 기반의 화자확인시스템 설계에 관한 연구 (A Study on the Design of Web-based Speaker Verification System)

  • 이재희;강철호
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.23-30
    • /
    • 2000
  • 본 연구에서는 인터넷 웹 기반의 화자확인시스템을 설계하였다. 웹 기반의 화자확인 시스템에 적용할 화자인식기법을 선정하기 위해 문자종속 화자인식기법들(DTW, DHMM, SCHMM)의 성능 및 특징들을 컴퓨터 시뮬레이션을 통하여 비교 평가하였다. 컴퓨터 시뮬레이션 결과를 이용하여 웹 기반의 화자확인시스템에 적합한 인식성능 및 초기 학습발음수를 갖는 DHMM을 화자인식기법으로 선정하고 이를 분산처리환경에서 동작하도록 Activex, DCOM기술을 이용하여 3계층방식으로 설계하였다.

  • PDF

빅데이터를 활용한 음식관광관련 의미연결망 분석의 탐색적 적용 (An Exploratory Study on the Semantic Network Analysis of Food Tourism through the Big Data)

  • 김학선
    • 한국조리학회지
    • /
    • 제23권4호
    • /
    • pp.22-32
    • /
    • 2017
  • The purpose of this study was to explore awareness of food tourism using big data analysis. For this, this study collected data containing 'food tourism' keywords from google web search, google news, and google scholar during one year from January 1 to December 31, 2016. Data were collected by using SCTM (Smart Crawling & Text Mining), a data collecting and processing program. From those data, degree centrality and eigenvector centrality were analyzed by utilizing packaged NetDraw along with UCINET 6. The result showed that the web visibility of 'core service' and 'social marketing' was high. In addition, the web visibility was also high for destination, such as rural, place, ireland and heritage; 'socioeconomic circumstance' related words, such as economy, region, public, policy, and industry. Convergence of iterated correlations showed 4 clustered named 'core service', 'social marketing', 'destinations' and 'social environment'. It is expected that this diagnosis on food tourism according to changes in international business environment by using these web information will be a foundation of baseline data useful for establishing food tourism marketing strategies.

국내 의료기관의 규모별 웹 콘텐츠 접근성 현황에 관한 연구 (A Study On Web Contents Accessibility of Hospital Web Sites in Korea)

  • 김종민;류황건
    • 보건의료산업학회지
    • /
    • 제4권2호
    • /
    • pp.33-46
    • /
    • 2010
  • In this study, we investigated web contents accessibility of 60 hospital web sites in Korea. The eight evaluation criteria were used for estimating the web contents accessibility of the web sites. These criteria were as follows: providing an alternative text, providing caption for moving picture, providing a skip navigation, usage of pop-up windows, usage of a summary or a caption tag for data table, providing a page title, providing a label for online form, and usage of java scripts. K-WAH 3.0 was used for estimating five evaluation criteria. According to Internet web contents accessibility guideline 1.0, we estimated the rest three evaluation criteria manually and described good or bad examples for the evaluation results technically. The results show that the web accessibility of hospital web sites is generally insufficient and the constant interests in improvement for accessibility are urgently needed.

Combining Multiple Sources of Evidence to Enhance Web Search Performance

  • Yang, Kiduk
    • 한국도서관정보학회지
    • /
    • 제45권3호
    • /
    • pp.5-36
    • /
    • 2014
  • 웹은 하이퍼링크 및 야후와 같이 수동으로 분류된 웹 디렉토리 처럼 문서의 콘텐츠를 넘어선 다양한 정보의 소스가 풍부하다. 이 연구는 웹문서 내용을 활용한 텍스트기반의 검색 방식, 하이퍼 링크를 활용한 링크 기반의 검색 방식, 그리고 야후의 카테고리를 활용한 분류 기반의 검색 방식을 융합하므로서 여러 정보소스를 결합하면 검색 성능을 향상시킬 수 있다는 기존 융합검색연구들을 확장시켰다. 텍스트, 링크, 분류 기반 검색 결과를 여러가지 선형조합식으로 생성한 융합결과를 기존의 검색 평가 지표를 사용하여 각각의 검색 결과와 비교 한 후, 검색결과 오버랩의 중요성 또한 조사 하였다. 본 연구는 텍스트, 링크, 분류 기반 검색의 솔루션 스패이스들의 다양성이 융합검색의 적합성을 제시한다는 결론과 더불어 시스템 파라미터의 영향, 그리고 오버랩, 문서순위, 관련성들의 상호 관계 같은 융합 환경의 중요한 특성들을 분석하였다.

신뢰성 있는 웹 전문지식 검색을 위한 하이브리드 랭크 매트릭스 제안 (A Proposal on Hybrid-Rank Metrics for Retrieval of Reliable Expert Knowledge in Web)

  • 이은정;이민주;이승희;박영호;김목련;안후영
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권4호
    • /
    • pp.625-633
    • /
    • 2008
  • 최근 사용자들의 참여, 개방, 공유가 주요 이슈로 떠오르면서 전문적이고 정확한 정보를 웹에서 찾고자하는 사용자의 요구가 증가하고 있다. 그러나 정보의 범람으로 사용자가 원하는 정보를 정확하게 검색하기 어려우며, 원하는 정보를 검색해도 그 정보에 대한 신뢰성을 판단하기가 어렵다. 따라서 본 논문에서는 신뢰성이 결여되기 쉬운 특정 정보에 대한 신뢰성과 검색의 효율성을 높이기 위해 새로운 랭크 매트릭스를 제안한다. 그리고 제안한 새로운 랭크 매트릭스를 적용한 민간의학 정보 웹 사이트를 구현한다. 제안하는 매트릭스를 사용자 레벨에 기반 하여, 레벨에 따른 평가 가중치를 차등화하여 글의 점수를 부여하는 방법이다. 이러한 방법은 참여자의 심리적 요소를 반영하여 글의 신뢰도를 높이는 방법으로 신뢰성이 결여되기 쉬운 정보의 신뢰도를 높일 수 있는 방안으로 사용될 수 있다.

  • PDF

마우스의 움직임에 따른 텍스트 키워드 기반 인터넷광고기법 개발 (Development of Internet Advertising Method based on Text Keyword according to Mouse Action)

  • 진교홍;이혜원
    • 한국정보통신학회논문지
    • /
    • 제7권8호
    • /
    • pp.1691-1697
    • /
    • 2003
  • 인터넷은 전자 상거래의 시장의 급격한 성장에 힘입어 새로운 광고매체로 각광받게 되었으며, 여러 가지 형태의 인터넷 광고 기법이 개발되었다. 그러나 대표적인 인터넷 광고 기법인 배너 광고는 아주 낮은 클릭율을 보일 뿐만 아니라 사용자의 외면으로 인해 광고로서의 기능을 다하지 못하고 있다. 이에 따라 본 논문에서는 웹페이지 내의 기사에서 텍스트 키워드에 따라 광고를 노출시키는 새로운 인터넷 광고 기법을 제안하였다. 즉, 사용자가 웹 페이지의 기사 글을 읽는 동안에 마우스가 해당 텍스트 키워드 위에 올려지면 지정된 광고 컨텐츠가 웹 페이지에 노출되는 기법이다. 제안된 광고 기법은 키워드 기반의 광고이며, 배너 광고와는 달리 다양한 형태의 이미지를 활용할 수 있다. 또한 웹 페이지 전체를 광고에 활용할 수 있고 웹 페이지로 당시간에 영향을 주지 않는다는 장점을 가지고 있다.

웹 문서 검색을 위한 검색어 추출과 확장에 관한 연구 (A Study on Keyword Extraction and Expansion for Web Text Retrieval)

  • 윤성희
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권9호
    • /
    • pp.1111-1118
    • /
    • 2004
  • 웹 문서 검색 시스템 사용자에게 자연어 질의를 입력하는 방법은 가장 이상적인 인터페이스이다. 본 논문은 자연어 질의를 입력하는 웹 문서 검색 시스템을 위해 자연어 처리 기술에 기반하여 사용자의 입력 질의 문장을 구문 분석한 후 검색어를 추출하고 확장하는 다중검색 기법을 제안한다. 질의문에 대한 형태소 분석 및 구문 분석을 수행하고, 구문 트리를 순회하여 구조적으로 연관된 복합명사를 조합하거나 분할하며, 검색어가 되는 음역어와 축약어들을 확장하여 다중 검색함으로써 재현율과 정확도를 향상시킬수 있음을 보였다.

  • PDF

Implementation of Annotation and Thesaurus for Remote Sensing

  • Chae, Gee-Ju;Yun, Young-Bo;Park, Jong-Hyun
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2003년도 Proceedings of ACRS 2003 ISRS
    • /
    • pp.222-224
    • /
    • 2003
  • Many users want to add some their own information to data which was on the web and computer without actually needing to touch data. In remote sensing, the result data for image classification consist of image and text file in general. To overcome these inconvenience problems, we suggest the annotation method using XML language. We give the efficient annotation method which can be applied to web and viewing of image classification. We can apply the annotation for web and image classification with image and text file. The need for thesaurus construction is the lack of information for remote sensing and GIS on search engine like Empas, Naver and Google. In search engine, we can’t search the information for word which has many different names simultaneously. We select the remote sensing data from different sources and make the relation between many terms. For this process, we analyze the meaning for different terms which has similar meaning.

  • PDF

Biotea-2-Bioschemas, facilitating structured markup for semantically annotated scholarly publications

  • Garcia, Leyla;Giraldo, Olga;Garcia, Alexander;Rebholz-Schuhmann, Dietrich
    • Genomics & Informatics
    • /
    • 제17권2호
    • /
    • pp.14.1-14.6
    • /
    • 2019
  • The total number of scholarly publications grows day by day, making it necessary to explore and use simple yet effective ways to expose their metadata. Schema.org supports adding structured metadata to web pages via markup, making it easier for data providers but also for search engines to provide the right search results. Bioschemas is based on the standards of schema.org, providing new types, properties and guidelines for metadata, i.e., providing metadata profiles tailored to the Life Sciences domain. Here we present our proposed contribution to Bioschemas (from the project "Biotea"), which supports metadata contributions for scholarly publications via profiles and web components. Biotea comprises a semantic model to represent publications together with annotated elements recognized from the scientific text; our Biotea model has been mapped to schema.org following Bioschemas standards.

Grammatical Structure Oriented Automated Approach for Surface Knowledge Extraction from Open Domain Unstructured Text

  • Tissera, Muditha;Weerasinghe, Ruvan
    • Journal of information and communication convergence engineering
    • /
    • 제20권2호
    • /
    • pp.113-124
    • /
    • 2022
  • News in the form of web data generates increasingly large amounts of information as unstructured text. The capability of understanding the meaning of news is limited to humans; thus, it causes information overload. This hinders the effective use of embedded knowledge in such texts. Therefore, Automatic Knowledge Extraction (AKE) has now become an integral part of Semantic web and Natural Language Processing (NLP). Although recent literature shows that AKE has progressed, the results are still behind the expectations. This study proposes a method to auto-extract surface knowledge from English news into a machine-interpretable semantic format (triple). The proposed technique was designed using the grammatical structure of the sentence, and 11 original rules were discovered. The initial experiment extracted triples from the Sri Lankan news corpus, of which 83.5% were meaningful. The experiment was extended to the British Broadcasting Corporation (BBC) news dataset to prove its generic nature. This demonstrated a higher meaningful triple extraction rate of 92.6%. These results were validated using the inter-rater agreement method, which guaranteed the high reliability.