• 제목/요약/키워드: Web text

검색결과 815건 처리시간 0.029초

웹 페이지내의 텍스트 키워드를 기반으로 한 새로운 인터넷광고기법 개발 (Development of New Internet Advertising Method based on Text Keyword in Web Page)

  • 진교홍;이혜원
    • 한국정보통신학회논문지
    • /
    • 제7권6호
    • /
    • pp.1202-1209
    • /
    • 2003
  • 인터넷 사용자의 급격한 성장과 더불어 전자상거래 시장의 규모도 점점 커지고 있다. 이에 따라 인터넷은 새로운 광고 매체로 각광받게 되었으며 여러가지 광고기법이 개발되었다. 그러나 대표적인 인터넷광고기법인 배너광고는 현재 아주 낮은 클릭율을 나타낼 뿐만 아니라 사용자의 외면으로 인해 저조한 광고효과를 보이고 있다. 이에 따라 본 논문에서는 웹 페이지의 기사 글 중에서 광고를 삽입하고자 하는 문구를 위한 광고 이미지를 만들어 두고, 사용자가 해당 문구를 클릭하고자 할 때 웹 브라우저의 배경화면에 광고 이미지가 노출되는 새로운 인터넷광고 기법을 제안하였다. 인터넷 사용자는 웹 페이지를 읽다가 관심이 있는 문구에 대해서는 클릭을 하고자 할 것이며, 이때 광고 이미지가 배경화면에 나타나므로 높은 광고효과를 기대할 수 있다. 또한 광고의 효과를 보다 오랫동안 지속시키기 위해 사용자가 해당 문구를 클릭하게 되면 해당 웹 페이지로 이동한 이후에도 계속해서 배경화면에 광고이미지가 나타나도록 하였다. 제안된 광고기법은 배너광고와는 달 리 다양한 형태의 이미지를 활용할 수 있으며, 웹 페이지 전체를 광고 노출영역으로 이용할 수 있다.

Web of Science 빅데이터를 활용한 텍스트 마이닝 기반의 정보윤리 이슈 탐색 (Exploring Information Ethics Issues based on Text Mining using Big Data from Web of Science)

  • 김한성
    • 컴퓨터교육학회논문지
    • /
    • 제22권3호
    • /
    • pp.67-78
    • /
    • 2019
  • 본 연구의 목적은 Web of Science(WoS)에서 제공하는 학술 빅데이터를 활용하여 정보윤리 이슈를 탐색하고 향후 정보과 정보윤리 교육을 위한 시사점을 제공하는 것에 있다. 이를 위해 WoS에서 제공하는 학술논문 중 정보윤리와 관련해 출판된 318편의 논문을 텍스트 마이닝 하였다. 구체적으로는 R을 활용해 주요키워드에 대한 빈도 분석(TF, DF, TF-IDF), 토픽 모델링 기반의 정보윤리 이슈 분석, 그리고 각 이슈에 대한 연도별 출연 빈도를 분석하여 정보윤리 연구의 경향성을 탐색하였다. 주요 결과를 살펴보면 다음과 같다. 첫째, TF-IDF를 통해 'digital', 'student', 'software', 'privacy' 등의 단어가 주요 키워드임을 확인하였다. 둘째, 토픽 모델링 분석 결과, 'Professional value', 'Cyber-bullying', 'AI and Social Impact' 등을 포함한 총 8개 이슈로 분석되었고, 그 중, 'Professional value'와 'Cyber-bullying' 이슈가 상대적으로 높은 비율을 차지하고 있었다. 본 연구는 이러한 분석 결과를 기초로 우리나라 정보윤리 교육을 시사점을 논의하였다.

HTTP환경에서 DAA를 이용한 비밀성 보안서비스 지원 방안 (Confidentiality Service Scheme Extending the DAA on HTTP Environment)

  • 조인준;정희경;송기평;이준섭;구경철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 추계종합학술대회
    • /
    • pp.305-311
    • /
    • 1999
  • IETF(Internet Engineering Task Force)의 RFC 2069에서는 HTTP 1.1에 DAA(Digest Access Authentication)방안 채택을 권고하고 있다. 클라이언트가 Web 서버내의 접근보호가 필요한 URI(Uniform Resource Identifier)자원에 접근하고자 할 경우, BAA(Basic Access Authentication)에서는 사용자 패스워드가 네트워크 상에 노출된 상태로 인증이 이루어지기 때문에 안전한 사용자 인증 방안이라고 할 수 없다. 반면에, DAA방안에서는 MAC(Message Authentication Code)를 사용하여 사용자 패스워드를 노출시키지 않고 인증이 이루어지기 때문에 BAA방안보다 안전한 인증 방법이다. 하지만, 이의 문제점은 Web서버와 클라이언트간에 교환되는 메시지에 비밀성 암호서비스를 지원하지 못하고 있다. 본 논문에서는 DAA를 확장하여 Web서버와 클라이언트간에 비밀성 보안서비스를 지원하는 방안을 제안하였다.

  • PDF

데이터베이스 관리 시스템에 기반한 웹검색엔진의 구현 (Web Search Engine based on Database Management System)

  • 강병주;이지동;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.211-218
    • /
    • 1997
  • 웹검색엔진은 색인되는 웹문서가 많아질수록 시스템 확장성(scalability)이라든지, 데이터베이스 유지 관리의 용이성, 데이터의 안전성 문제, 등의 많은 문제가 웹검색엔진에 부담으로 주어지게 된다. 반면에 인트라넷(intranet)용 검색엔진의 경우는 확장성보다는 검색엔진 자체의 개발의 용이성이 더욱 중요하다. Oracle $ConText^{TM}$는 오라클 사(社의) RDBMS인 $Oracle7^{TM}$의 정보검색 확장 옵션으로 텍스트를 Oracle7의 기본 데이터 타입으로 사용될 수 있게 한다. Oracle7+ConText는 대용량의 문서 베이스와 개발의 용이성을 동시에 보장할 수 있는 매우 훌륭한 웹검색엔진 개발 도구이다. 우리는 이를 검증하기 위하여 Oracle7+ConText에 기반한 WEBSECT(Web Search Engine With ConText)라는 웹검색엔진을 개발하였다. 본 논문은 WEBSECT의 개발과 시험 운영을 통해 데이터베이스에 기반한 웹검색엔진의 우수한 확장성과 텍스트 애플리케이션 개발의 용이성 등을 소개한다.

  • PDF

웹 기반의 화자확인시스템을 위한 문장선정에 관한 연구 (A Study on Text Choice for Web-Based Speaker Verification System)

  • 안기모;이재희;강철호
    • 한국음향학회지
    • /
    • 제19권6호
    • /
    • pp.34-40
    • /
    • 2000
  • 문장 종속형 화자 확인시스템을 구현하는데 있어 화자가 발음할 문장의 선정은 화자인식시스템의 성능을 좌우하는 중요한 사항이다. 본 연구에서는 한국어의 음가 분류방식을 이용하여 자음조합체계를 구축하고 이를 웹 기반 화자확인시스템에 적용하여 급격한 화자음성정보의 변화에 대응하는 동시에 최적의 인식성능을 낼 수 있는 자음조합방식을 도출하였다.

  • PDF

The Effectiveness of Streaming Video with Web Based Text in Online Course: Comparative Study on Three Types of Online Instruction for Korean College Students

  • HEO, JeongChul;HAN, Su-Mi
    • Educational Technology International
    • /
    • 제14권1호
    • /
    • pp.1-26
    • /
    • 2013
  • This study is to identify whether three types of online instruction (text-based, video-based, and video-based instruction without text) and age category have a different influence on students' comprehension and motivation. Online students were randomly assigned to one of six groups, and they attended two-week online lectures via Course Management System. The comprehension test and the short form of IMMS were implemented when 114 participants accomplished two-week online lectures. The results revealed that using instructional video in online instruction is more effective instructional medium than text only in order to promote learner's motivation. Besides, older adults aged 41-60 are significantly different from younger adults (21-40 years old) in terms of students' comprehension. Furthermore, three types of online instructions are likely to be influenced by age category.

읽기 형태, 줄 길이, 줄 간격이 한글 웹 문서의 가독성에 미치는 영향 (The Influences of Reading Type, Line Length, and Interlinear Spacing on the Legibility of Korean Web Documents)

  • 신종현;박민용
    • 대한산업공학회지
    • /
    • 제29권3호
    • /
    • pp.197-205
    • /
    • 2003
  • Many people get plenty of information from World Wide Web, and the study of the factors that affect on reading task on web browser is presenting important issue. But domestic studies on legibility of Korean on web environment were relatively poor and the study about suitable text layout for skimming wasn't carried out also. At this point, this study was performed to investigate the effects of two types of reading, three levels of line length, and three levels of interlinear spacing on comprehension and reading rate when subjects read the materials on web browser. Reading speed, error rate, subjective preference and SACL(Stress and Arousal Checklist) evaluation were measured to evaluate the effects. Eighteen volunteer subjects participated in eighteen web document sessions with two different reading types, three different line lengths, and three different interlinear spacings. Statistical results from objective and subjective evaluations indicate that 50 characters per line of line length and 100 percents of interlinear spacing improved reading rate, overall error rates were reduced when reading normally, and SACL measures were increased at fast reading type. Consequently, in order to design text layout to retrieve information in WWW environment effectively, just applying guidelines of traditional printed material is not proper. Therefore, it is effective to consider reading type, line length, and interlinear spacing. Implications of these results and suggestions for the further study are also addressed.

바이그램이 문서범주화 성능에 미치는 영향에 관한 연구 (A Study on the Effectiveness of Bigrams in Text Categorization)

  • 이찬도;최준영
    • Journal of Information Technology Applications and Management
    • /
    • 제12권2호
    • /
    • pp.15-27
    • /
    • 2005
  • Text categorization systems generally use single words (unigrams) as features. A deceptively simple algorithm for improving text categorization is investigated here, an idea previously shown not to work. It is to identify useful word pairs (bigrams) made up of adjacent unigrams. The bigrams it found, while small in numbers, can substantially raise the quality of feature sets. The algorithm was tested on two pre-classified datasets, Reuters-21578 for English and Korea-web for Korean. The results show that the algorithm was successful in extracting high quality bigrams and increased the quality of overall features. To find out the role of bigrams, we trained the Na$\"{i}$ve Bayes classifiers using both unigrams and bigrams as features. The results show that recall values were higher than those of unigrams alone. Break-even points and F1 values improved in most documents, especially when documents were classified along the large classes. In Reuters-21578 break-even points increased by 2.1%, with the highest at 18.8%, and F1 improved by 1.5%, with the highest at 3.2%. In Korea-web break-even points increased by 1.0%, with the highest at 4.5%, and F1 improved by 0.4%, with the highest at 4.2%. We can conclude that text classification using unigrams and bigrams together is more efficient than using only unigrams.

  • PDF

웹 서버 성능 가속기 (Web-server accelerator - CDA(Contents Delivery Accelerator))

  • 조준우;최현진;박규호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 컴퓨터소사이어티 추계학술대회논문집
    • /
    • pp.73-76
    • /
    • 2003
  • Current web-server deals a multimedia data as well as text data. But dealing a multimedia data is high burden to web-server. So it can degrade web-server response. We introduce H/W feature CDA (Contents Delivery Accelerator). Main function of this H/W is transferring data between SCSI disk and NIC by direct path, and TCP offloading. These 2 functions can accelerate web-server performance. In this paper we will explain problem of current web-server and suggest our new architecture and say various implementation issues.

  • PDF

PubMine: An Ontology-Based Text Mining System for Deducing Relationships among Biological Entities

  • Kim, Tae-Kyung;Oh, Jeong-Su;Ko, Gun-Hwan;Cho, Wan-Sup;Hou, Bo-Kyeng;Lee, Sang-Hyuk
    • Interdisciplinary Bio Central
    • /
    • 제3권2호
    • /
    • pp.7.1-7.6
    • /
    • 2011
  • Background: Published manuscripts are the main source of biological knowledge. Since the manual examination is almost impossible due to the huge volume of literature data (approximately 19 million abstracts in PubMed), intelligent text mining systems are of great utility for knowledge discovery. However, most of current text mining tools have limited applicability because of i) providing abstract-based search rather than sentence-based search, ii) improper use or lack of ontology terms, iii) the design to be used for specific subjects, or iv) slow response time that hampers web services and real time applications. Results: We introduce an advanced text mining system called PubMine that supports intelligent knowledge discovery based on diverse bio-ontologies. PubMine improves query accuracy and flexibility with advanced search capabilities of fuzzy search, wildcard search, proximity search, range search, and the Boolean combinations. Furthermore, PubMine allows users to extract multi-dimensional relationships between genes, diseases, and chemical compounds by using OLAP (On-Line Analytical Processing) techniques. The HUGO gene symbols and the MeSH ontology for diseases, chemical compounds, and anatomy have been included in the current version of PubMine, which is freely available at http://pubmine.kobic.re.kr. Conclusions: PubMine is a unique bio-text mining system that provides flexible searches and analysis of biological entity relationships. We believe that PubMine would serve as a key bioinformatics utility due to its rapid response to enable web services for community and to the flexibility to accommodate general ontology.