• 제목/요약/키워드: 사용자 정보 추출

검색결과 2,335건 처리시간 0.03초

유한 오토마타를 이용한 정보 추출 시스템의 구현 및 분석 (An Information Extraction System Using Finite State Automata)

  • 오효정;임정묵;이만호;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.97-104
    • /
    • 1998
  • 인터넷의 사용자가 폭발적으로 증가함에 따라, 인터넷을 이용한 다양한 정보 서비스가 생성되었으며, 이로 인해 일반 사용자들이 접할 수 있는 디지털 문서의 양은 기하 급수적으로 증가 되었다. 본 논문에서는 유사한 정보를 갖는 다량의 문서들로부터 사용자가 원하는 정보만을 추출하는 정보 추출 시스템의 개발 과정 및 결과를 기술한다. 개발된 시스템은 필요한 정보를 포함하는 문장들을 걸러 낸 후, 필요한 사실정보의 출현을 나타내는 패턴을 사용한 유한 오토마타를 통하여 사용자가 원하는 정보를 추출한다. 관광지 안내 텍스트를 대상으로 한 실험 및 분석 결과를 기술한다.

  • PDF

사용자 행동 패턴과 웹 문서 구조 분석을 이용한 웹 폐이지 테스팅 방법 (A Method for Testing Web pages Using the Analysis of User Behavioral Pattern and Web Document Structures)

  • 유대승;심민석;엄정섭;이명재
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.547-549
    • /
    • 2001
  • 웹 기반 시스템의 테스팅에 대한 정확성과 신뢰성을 향상시키는 것은 시스템의 질을 향상시킬 수 있고 시스템 개발 및 유지보수에 대한 비용을 현저히 줄일 수 있다. 본 논문에서는 웹 로그 분석을 통하여 테스팅 환경 설정에 필요한 정보와 사용자들에 대한 패턴 정보를 추출하였다. 그리고 웹 컨텐츠 분석을 통하여 링크 정보와 데이터베이스에 대한 접근 또는 사용자 입력을 요구하는 모듈에 대한 정보를 추출하였다. 추출한 정보를 이용하여 테스팅을 위한 시나리오 문서인 테스트 스크립트를 생성함으로써 실세계에 근접한 테스트 시뮬레이션을 구현하는 방법을 제시하였다.

  • PDF

소셜 북마킹 서비스의 태그를 이용한 개인화 콘텐츠 (Personalized Contents using the Tags of the Social Bookmarking Service)

  • 한주현;정문열
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.267-272
    • /
    • 2009
  • 웹 2.0 이라 불리는 현 웹의 패러다임은 개방, 공유, 참여로 압축하여 말할 수 있다. 이 속에서는 사용자의 참여와 공유로 콘텐츠가 생산 또는 재생산된다. 이러한 콘텐츠는 사용자의 관심을 반영하기 때문에 사용자가 어떠한 콘텐츠를 만들어 냈는지, 수집했는지 등을 분석하면 사용자의 관심 범주를 추출할 수 있다. 본 논문에서는 사용자가 소셜 북마킹 서비스를 이용하며 생성한 태그를 바탕으로 사용자의 관심 범주를 추출하여 이를 통해 개인화 콘텐츠 제공 서비스를 제안한다. 우선, 웹 서비스에서 제공하는 피드를 이용하여 사용자가 생성한 태그 중 가장 많이 쓰인 10개의 태그와 그것들과 관련 있는 태그들만 모아서 관심 범주을 추출하기 위한 태그 집합을 구성한다. 구성된 태그 집합을 바탕으로 피어슨 상관 계수를 통해 태그 간 동시 사용률을 조사한다. 이후 사용자 흥미에 부합하는 콘텐츠를 검색하기 위해 조사된 동시 사용률을 바탕으로 검색 키워드 그룹을 추출한다. 이렇게 만들어진 키워드 그룹들은 사용자의 평소 관심사와 관련된 콘텐츠를 검색하는데 사용되며, 이를 통해 사용자의 관심 있는 내용의 콘텐츠를 사용자의 특별한 검색 절차 없이 제공받는다. 이러한 방식을 통해 사용자가 원하는 정보를 입력하는 절차 없이도 웹에 축적된 사용자의 정보를 사용하여 자동으로 개인화된 콘텐츠를 제공할 수 있을 것으로 기대 된다.

  • PDF

소셜 사건에 대한 사용자의 행동 분석에 기반한 신뢰성 높은 사용자의 트윗 추출 (Extracting Reliable User's Tweet for Social Events Based on User Behavior in Twitter)

  • 촐몽 바야르;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.608-611
    • /
    • 2012
  • 소셜 사건이 일어나면 그 사건과 관련된 트윗이 폭발적으로 증가하는데 트윗 일부 내용을 살펴보면 스팸, 광고와 같은 트윗이 많이 포함되어 있다. 수 많은 트위터 데이터에서 사용자가 사건과 직접 관련된 신뢰성 높은 트윗을 찾아 읽는데 시간이 많이 걸릴 수 있다. 이러한 문제를 해결하기 위해 본 논문에서 트위터의 리트윗 정보, 사용자 신뢰도 측정 및 활동 분석, 팔로잉과 팔로워간의 정보 등 사용자의 행동 분석을 이용하여 소셜 사건과 직접 관련된 신뢰성 높은 사용자의 트윗을 추출하는 방법을 제안한다. 제안 방법의 유효성을 검증하기 위해 소셜 이슈 4 개에 대한 트윗 데이터에서의 실험을 통하여 상위 100 개의 결과에서의 정확률(P@100) 76.6%의 성능을 보였다. 실험을 통해 제안 방법이 신뢰성 높은 사용자의 트윗을 추출하는데 효과적인 방법임을 알 수 있다.

협동적 순위 평가와 워드넷을 이용한 검색엔진의 성능 향상 (Performance Inprovement of a Search Engine Using Collaborative Evaluation and The WordNet)

  • 김형일;김준태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.103-105
    • /
    • 2001
  • 웹에서 사용자가 원하는 정보를 정확히 추출하기란 쉬운 문제가 아닐 것이다. 이러한 정보추출의 중요성의 문제는 방대해지는 정보의 양과 직결된다. 현재 웹의 정보는 사용자들이 원하는 모든 정도를 담고 있다고 이야기할 수 있을 만큼 많은 정보들이 내재되어 있다. 그러나 이러한 정보의 홍수 속에서 사용자들은 자신이 원하는 정보를 정확히 추출하기란 쉽지 않은 일이며, 정확히 추출이 되었어도 전통적 방식을 따르는 검색엔진은 내용기반 방식을 기초로 웹페이지의 순위를 결정함으로, 사용자에게 중요한 페이지를 상위에 위치시키기란 쉬운 일이 아니다. 본 논문에서는 이러한 전통적 방식의 검색엔진의 문제점을 해결하기 위하여 협동적 순위 평가 방법과 워드넷을 기반으로 검색엔진의 성능 향상 방법을 제안한다.

  • PDF

사용자 적응형 에이전트 기반의 전자도서관 시스템 (Digital Library System based on User Adaptive Agents)

  • 소영준;김인태;김범수;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.140-142
    • /
    • 1999
  • 본 논문에서 구현하고자 하는 에이전트기반 전자도서관 시스템은 웹을 통해 도서정보를 검색하는 사용자들에 대한 도서 정보 관심도를 모니터 에이전트에 의해 추출하게 하고 해당 정보를 대상으로 학습 과정을 거쳐 사용자별 프로파일을 구축할 수 있게 한다. 이 과정에서 모니터 에이전트에서 추출되는 사용자 history와 학습예제 정보는 사용자가 행하는 다양한 작업의 결과 차별화된 중요도가 적용된다. 학습 에이전트를 통해 구축된 사용자 관심 정보는 각 사용자에게 세부 DB 추천 모듈과 관심 정보를 푸쉬해주는 에이전트에 적용된다. 본 시스템에서는 전자 도서관에 가입하는 사용자들의 공통된 그룹 정보를 관리하여 이를 통해 동일 그루내의 사용자들 사이의 정보 이용이 가능하게 하였다. 본 논문에서는 개인과 그룹을 대상으로 하는 모니터 에이전트와 학습 에이전트를 설정하여 도서관을 이용하는 사용자들에게 정확하고 신속한 정보를 제공하는 것을 목적으로 한다.

  • PDF

동적 데이터 추출을 통한 뉴스 클리핑 시스템 (News Clipping System Through Dynamic Data Extraction)

  • 전호철;신성혁
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(하)
    • /
    • pp.727-730
    • /
    • 2003
  • 인터넷의 빠른 보급으로 많은 양의 정보가 유통되기 시작했다. 그러나 사용자들은 필요한 정보들을 취사 선택하기엔 정보들은 양이 너무 방대하다. 각종 사이트에 있는 뉴스들을 실시간으로 사용자들에게 필요한 정보를 제공할 수 있는 뉴스 클리핑은 이러한 사용자들의 요구를 충족할수 있다 하지만 기존의 뉴스 클리핑 시스템은 각 사이트에 접근 후, 수동적인 분석을 통해 뉴스 정보 및 뉴스 기사의 위치를 파악하고 이를 추출하도록 하는 시스템들이다. 본 논문에서 제안하고자 하는 시스템은 사이트의 구조를 파악하고, 뉴스 기사들을 동적으로 추출함으로써 기존 시스템의 단점을 극복하고, 내용 기반의 뉴스기사 검색이 가능하도록 한다.

  • PDF

원의 넓이에 근거한 서브 이미지 기반 CAPTCHA 시스템 효율 개선 (Sub-image based CAPTCHA System Efficiency Improvement Based on Area of Circle)

  • 정우근;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(D)
    • /
    • pp.101-105
    • /
    • 2010
  • 현재 인터넷 보급의 우수한 발달로 인해 우리는 정보의 바다 또는 인터넷 시대에 살고 있다. 우리는 이러한 인터넷 시대에 살고 있는 만큼 많은 정보를 인터넷을 통하여 검색하고 원하고자 하는 정보를 인터넷을 통해 얻고 있다. 하지만 인터넷을 통하여 웹서핑 또는 정보를 검색하다보면 스팸이나 자동화 도구를 이용하여 광고성 또는 해당 정보와는 상관없는 글들이 무수히 등록되어 있는 것을 볼 수 있다. 이와 같은 것을 방지하기 위하여 CAPTCHA 시스템이 개발되었다. 하지만 기존에 존재하는 CATPCHA 시스템은 텍스트 기반의 시스템이고, 현재 쉽게 통과될 수 있는 많은 기법들이 제시되고 있다. 그리하여 우리는 이러한 단점을 보완하고자 새로운 이미지 기반의 CAPTCHA 시스템을 전 연구를 통하여 새롭게 제안했다[4]. 제안된 시스템은 일반적인 이미지에서 사각형 형태의 서브 이미지를 추출, 추출된 서브 이미지를 무작위 회전을 가하여 사용자에게 올바른 교정을 통해 사용자를 인증하였다. 우리는 이와 같은 연구를 바탕으로 본 논문에서는 서브 이미지를 추출 시 정사각형의 형태가 아닌 N다각형의 형태를 통하여 서브 이미지를 추출한다. 본 논문에서는 N다각형 형태의 서브 이미지 추출시 전 연구와는 다른 방법으로 서브 이미지를 추출하고, 실험을 통하여 사용자에게 가장 인식률이 높은 다각형을 찾고, 전 연구와는 다른 방법의 서브 이미지 추출 방법을 통해 사용자에게 보다 효과적인 서브 이미지를 제공한다. 본 논문에서 제공되는 다각형은 정삼각형에서부터 정16각형이다.

  • PDF

사용자의 선호도를 반영하는 영화추천시스템의 개발 (Developing Movie Recommendation System Reflecting Movie Viewers' Preferences)

  • 이세호;이강은;황옥삼;노상욱
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 추계학술대회
    • /
    • pp.507-513
    • /
    • 2007
  • 기존의 영화정보제공 시스템에서는 사용자에게 영화에 대한 정보를 전달할 때 단순히 새로운 영화에 대한 정보를 전달하는데 그치고 있다. 이러한 정보시스템은 사용자에 대한 기호나 성향을 고려하지 않기 때문에, 사용자에게 필요하고 적절한 정보를 제공하지 못하는 문제점이 있다. 따라서, 본 논문은 정보 제공의 효율성을 높이기 위하여 사용자의 영화 선호도가 반영된 영화추천시스템을 설계 및 구현한다. 다양한 사용자로부터 수집한 기본정보에 데이터 분류도구를 적용하여 사용자에 대한 일정한 기호 또는 성향을 추출한다. 결과적으로 추출된 정보를 대상 사용자들에게 SMS로 제공하여 각자의 기호나 성향을 고려한 정보를 얻을 수 있도록 한다.

  • PDF

사용자 입력 패턴 분석을 이용한 사용자 판별 방법 연구 (User Identification Method Using Input Pattern Analysis)

  • 박민수;박주민;김경헌;원유재
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제55차 동계학술대회논문집 25권1호
    • /
    • pp.213-216
    • /
    • 2017
  • 본 논문에서는 사용자 입력패턴 분석을 통한 행위 기반 인증 방법을 제안한다. 이 알고리즘은 기기를 통해 들어온 사용자의 다양한 입력정보를 받아오고, 받아온 정보를 분석하여 사용자만의 고유한 정보를 추출한다. 이렇게 추출된 정보를 데이터베이스에 저장 후, 사용자에 대한 인증요청이 들어오면 입력 정보들과 저장된 입력정보의 일치여부에 따라 인증을 허용할지 결정한다. 이를 이용하면 사용자의 고유한 행위에 대한 정보를 가지고 인증을 진행하기 때문에, 사용자의 기억에 의존하지 않고 간단하게 인증 절차를 진행할 수 있다. 본 논문에서는 실험을 통해 모인 데이터를 분석하여 제안하는 인증 방법이 실질적으로 사용자 인증에 적용 될 수 있음을 보인다.

  • PDF