• 제목/요약/키워드: 정보 수집 및 추출

검색결과 752건 처리시간 0.036초

그래프 중심성 분석에 의한 CQI 보고서 핵심어 추출 시스템의 설계 및 개발 (Design and Implementation of Keywords Extraction System from CQI Reports by the Analysis of Graph Centrality)

  • 테이퍼악떠라;임종범;이종혁;길준민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.256-259
    • /
    • 2019
  • 최근 대학교는 CQI(Continuous Quality Improvement) 등의 방대한 교육 관련 데이터를 수집하고 있고 이를 분석하여 교육 및 경영에 활용하고 있다. 핵심어는 텍스트의 내용을 간결하게 표현할 수 있는 단어이다. 그래서 CQI 보고서의 의미를 파악하기 위해서는 먼저 핵심어 추출이 필요하다. CQI 보고서에서 핵심어를 추출하면 이후 정보 검색, 인덱싱, 분류, 클러스터링, 필터링 등과 같은 많은 응용 작업을 용이하게 수행할 수 있다. 따라서 방대한 양의 CQI 보고서로부터 핵심어 추출을 자동화한다면 이후 요약 및 의미 파악에 많은 도움이 될 것이다. 이 논문에서는 CQI 보고서 요약을 위해 자동적으로 핵심어를 추출하는 방법을 제안한다.

비교 쇼핑 정보 수집을 위한 멀티 에이전트 시스템 (A Multi-Agent System for Collecting Comparative Shopping System)

  • 신주리;전중남;이건명
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.154-156
    • /
    • 2001
  • 인터넷 상의 많은 전자 상거래 쇼핑몰에 있는 상품 정보에 대한 비교 서비스를 제공하는 시스템들이 개발되고 있다. 이러한 서비스를 위해서는 분산된 전자 상거래 쇼핑몰들의 정보를 수집하여 통합하는 노력이 필요하다. 이 논문에서는 멀티 에이전트 구조로 설계한 인터넷 상의 쇼핑몰들로부터 상품 정보를 수집하여 서비스하는 시스템에 대해서 소개한다. 이 시스템에서는 랩퍼 생성 서브시스템, 정보 수집 서브시스템, 카테고리 분석 서브시스템, 데이터 정제 서브시스템 등의 구성 요소들이 유기적으로 결합되어 동작한다. 이 논문에서는 전체적인 시스템의 구성에 대해서 살펴보고, 각 서브시스템의 기능 및 구조에 대해서 기술한다. 또한 쇼핑몰로부터 정보를 추출하기 위한 랩퍼 생성 기법과 상품 정보의 카테고리를 결정하는 방법에 대해서 소개한다.

  • PDF

의미정보모델 구축을 위한 색채정보의 수집과 정량적 분석 (Collecting and Analyzing Color Information for Constructing Semantic Information Model)

  • 류기곤;선동언;김현철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.232-235
    • /
    • 2011
  • 지식표현은 일반적으로 논리, 규칙, 프레임 또는 의미망 형태로 표현되며, 최근에는 의미망을 이용한 온톨로지 형태로 표현되고 있다. 이러한 지식표현 방법은 개념을 설명하는 문맥적인 정보나 개념들 간의 구조적인 정보를 이용하여 개념에 대한 지식을 논리적으로 표현하는데 중점을 두었다. 하지만, 지식표현에 사용되는 의미정보는 사람에 의해 수집되고 정제되기 때문에 많은 시간, 비용 및 인력이 필요하다는 한계가 있고, 새로운 의미를 추가하거나 기존의 의미를 수정하는 것이 매우 어렵다는 한계가 있다. 색채는 특정 대상이나 개념에 대한 의미, 연상, 상징 등 객관적인 특징 뿐 아니라 시대, 나라, 문화와 같은 사회적 배경을 반영하기 때문에, 정보를 제공하고 감성을 전달하는 효과적인 수단으로 사용되고 있다. 이에 본 논문은, 색채를 이용한 의미정보모델 구축을 위해, 색채정보를 수집하고 정량적으로 분석하는 방법을 제안한다. 긍정/부정/불안/중립으로 구성된 감성어휘 273개를 이용하여 이미지를 수집한 결과 총 130,944개의 이미지를 수집하였다. 이미지에는 여러 가지 사물, 행동, 배경, 색채 등 다양한 정보가 혼재되어 있어 감성어휘와 연관된 색채를 구별하기 어렵기 때문에 이미지를 직관적으로 설명할 수 있는 사용자 태그를 별도로 수집하였다. 태그는 총 2,836,395개를 수집하였고 각 이미지와 그룹에서의 가중치를 구하였다. 태그의 가중치를 통해 이미지가 그룹 내에서 갖는 중요도를 판별하였고, 각 그룹 별로 상위 30%의 이미지를 추출하여 대표 색채를 분석하였다.

전력 데이터의 특징 추출 및 XGBoost를 이용한 숙박 업소 재실 여부 판단 (Determination presence of people in accommodation using feature extraction and XGBoost method of energy data)

  • 김에덴;고석갑;손승철;이형옥;이병탁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.458-460
    • /
    • 2020
  • 스마트미터의 기술 발달과 보급으로 인해 전력데이터의 수집이 보다 수월 해짐에 따라 각 시스템에 효율적인 맞춤 서비스 제공을 위한 전력 데이터 분석 기술에 관한 다양한 연구가 활발하게 진행되고 있다. 관련하여 본 논문에서는 숙박업소의 각 방마다 전력소비량을 측정 및 수집하여 전력소비패턴을 분석하고 특징 추출 및 XGBoost 를 이용한 머신러닝 분석방법으로 각 방의 사람 재실 여부를 판별하는 방법을 소개한다. 이와 같은 연구를 통해 추후 숙박업소 혹은 숙박업소를 이용하는 소비자들의 맞춤 서비스 제공에 응용 및 적용 할 수 있다.

스마트 폰을 이용한 데이터 수집 어플리케이션 개발 (Development of Data Collection Application using Smart Phone)

  • 정용진;오창헌
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.664-666
    • /
    • 2014
  • 최근 사용자들에게 다양한 정보를 제공하기 위해 무의미한 데이터를 수집하고 관계를 분석하여 의미 있는 데이터를 추출하는 빅데이터가 이슈이다. 하지만 기존의 데이터 수집 방식은 건물 내 외부에 설치된 센서 및 기타 사용자들의 정보들을 이용하여 데이터를 분석하기 때문에 정보취합에 어려움이 존재한다. 본 논문에서는 이러한 데이터 수집의 문제점을 해결하기 위해 스마트 폰을 이용한 데이터 수집 어플리케이션을 개발한다. 개발하는 데이터 수집 어플리케이션은 Wi-Fi에 대한 정보 및 온도, 습도, 가속도, 자이로 등의 데이터를 측정하며, 웹을 통해 서버로 전송한다. 전송된 데이터는 사용자의 상황 추론을 위한 데이터로써 사용되며, 향후 추론 결과에 따라 사용자의 상황에 맞춰 다양한 서비스의 제공이 가능하다.

  • PDF

학술정보의 효율적 전주기 관리 및 서비스 체제 구축에 관한 사례 연구 (A Case Study on The Establishment of Efficient Management of Academic Information and Services.)

  • 조성남;서태설;김완종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.412-415
    • /
    • 2016
  • 본 연구에서는 학술정보의 효율적 관리 및 서비스 체제를 수립하고 활용성을 강화하기 위해 논문 자동 수집 및 구축, 논문 투고 및 심사, 전자출판, XML 자동 구축에 이르기까지 전주기 기능 구현에 방안을 제시하고 이를 구현한 사례를 소개하고자 한다. 기존 Peer-Review 시스템은 데이터 수집 및 변환파트와 투고 및 심사, 전자출판 파트, XML 구축 파트 등으로 분리되거나 별도로 운영되어 왔다. 본 연구에서는 이러한 기능을 통합적으로 구현하기 위해 KISTI의 Peer-Review 시스템인 ACOMS와 XML 기반 학술정보서비스 시스템(KpubS) 기능 및 프로세스를 통합한 구현 방안을 제시하고 이를 시스템으로 구현하였다. 그러나 아직까지 원문 PDF를 XML로 완전 자동 변환할 수 있는 기술은 없는 상태로써 반자동 변환 기능을 탑재하였다. 본 연구 내용은 다양한 수집 채널을 통해 입수된 학술정보 및 XML 자료에 대한 입력체계를 제공하고, XML 본문으로부터 메타데이터를 자동 식별 및 추출하여 학술정보 DB를 구축 저장하며, 구축된 DB 및 XML 기반의 전자출판 기능 제공과 함께 웹서비스 단계까지의 전주기 공정에 대한 프로세스 모델 및 시스템에 관한 것이다. 이에 데이터베이스 구축을 위한 시간 및 비용을 절감할 수 있을뿐만 아니라, 시맨틱 태깅 및 수식, 표, 그림 정보 제공 등 이용자에게 다양한 형태의 서비스를 제공할 수 있게 되었다.

BERT Q&A 모델을 활용한 장학금 정보 추출 및 추천 시스템 (A Recommendation System by Extracting Scholarship Information with a BERT's Q&A Model)

  • 강병준 ;김규진;박진아 ;장이준 ;주재현 ;구형준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.288-289
    • /
    • 2023
  • 본 논문은 글로벌 이슈로 인한 인플레이션과 대학 등록금 인상 우려 등으로 인해 장학금의 중요성이 부각되고 있는 상황을 고려하여 기존의 장학금 공고 게시물을 수집한 후 BERT Q&A (Bidirectional Encoder Representations from Transformers Question & Answering) 모델을 이용해 개별 맞춤형 장학 공고를 추천하는 시스템을 제안한다. 우선 웹 크롤링을 통해 장학금 정보를 수집하고, BERT Q&A 모델과 사전에 정의한 규칙 기반으로 핵심 정보를 추출한다. 이후 분류 과정을 거쳐 사용자가 입력한 정보와 매칭하여 조건에 맞는 장학금 게시물을 추천할 수 있는 어플리케이션을 구현하였다.

웹 수집 로봇 엔진의 설계 및 구현 (Implementation and Design of Robot Engine for Web Collection)

  • 김대유;김정태
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.313-317
    • /
    • 2007
  • 인터넷의 이용이 활발해짐에 따라 수많은 정보들이 웹을 통하여 공개되고 있으며, 이용자는 웹 검색 서비스를 이용하여 이러한 정보들에 효과적으로 접근할 수 있다. 웹 검색 서비스의 구축을 위해서는 웹 로봇을 사용한 웹 문서 수집이 선행되어야 하며, 웹 문서들의 수가 급격히 증가하면서 양질의 웹 문서들을 효과적으로 수집할 수 있는 웹 로봇에 대한 필요성이 증가되고 있으며, 그에 따른 많은 웹 수집 로봇이 탄생되고 있다. 본 논문에서는 효과적인 웹 수집 로봇의 설계와 동적인 웹페이지에서 사용하는 자바스크립트의 링크 추출방안에 대하여 제시하고자 한다.

  • PDF

분야연상어 추출 방법의 설계 및 구현 (Design and Implementation for Extraction of Field-Associationed Terms)

  • 이원휘;최현;이상곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.651-654
    • /
    • 2004
  • 우리는 특정 문서를 읽을 때 문서 전체를 읽지 않더라도 대표적인 몇 개의 단어를 보는 것만으로 정치나 경제, 스포츠 등의 분야를 정확히 인지할 수 있다. 문서 전체를 대상으로 하지 않고 부분텍스트에서 출현하는 소수의 단어정보에서 문서의 분야를 정확히 결정하기 위해 분야연상어의 구축은 중요한 연구과제이다. 인간이 미리 분야체계를 정의하고, 각 분야에 해당하는 문서를 인터넷이나 서적을 통해 수집한다. 본 논문은 수집문서의 분야를 정확히 지시하는 분야연상어를 자동으로 수집하는 시스템을 설계하고 구현하는데 목적이 있다. 문서의 분야결정 시점을 고려하여 분야연상어의 수준, 안정성 랭크, 집중률, 빈도정보를 이용하여 단일 분야연상어를 수집하는 방법을 제안하고 구현한다.

  • PDF

와이파이 핑거프린트 기반 데이터 수집 방법 및 가공 연구 (Wi-Fi Fingerprint-based Data Collection Method and Processing Research)

  • 김성현;윤창표
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.319-322
    • /
    • 2019
  • 실내 환경에서 사용자의 위치를 측위하는 다양한 기법들이 있다. 그중 와이파이 핑거프린트 기법은 데이터 수집 단계와 측위 단계로 구분된다. 데이터 수집 단계에서는 해당 위치 주변의 모든 와이파이 신호를 수집하여 리스트 형태로 관리한다. 수집된 데이터가 많을수록 실내측위 정확도가 향상된다. 기존 고품질 데이터 수집 및 관리 방법은 많은 시간과 비용이 소모되고, 기계학습에 필요한 데이터를 추출해 생성할 때 많은 연산이 필요하다. 따라서 한정된 자원 안에서 많은 데이터를 수집 및 관리할 수 있는 방법을 연구한다. 본 논문은 효율적인 데이터 수집 기법과 기계학습에 필요한 학습 데이터 관리 및 생성 기법을 제안한다.

  • PDF