• Title/Summary/Keyword: 태그 정보 추출

검색결과 211건 처리시간 0.033초

Virtual ID 사용을 위한 유사한 우편 영상 추출 방법 (Mail Image Filtering Method for Use of Virtual ID)

  • 박상철;정창부;손화정;김수형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.817-820
    • /
    • 2004
  • 우편물을 배달하기 위해서 집배원은 오전 시간의 대부분을 이용하여 배달 경로에 따라 우편물을 정렬한다. 우리나라의 자동화 시스템은 순로구분의 전단계까지만 수행하는데 그치고 있으나 외국의 순로 구분 자동화 시스템은 바코드나 사용자 태그를 이용하여 순로구분을 수행한다. 본 논문에서는 영상 기반특징과 인식 기반 특징인 Virtual ID 사용을 위한 우편 영상 검증의 과정으로 처리 속도를 향상 시킬 수 있도록 유사한 영상 혹은 동일 DM 발송 우편 영상을 추출해 내는 2가지 방법을 제안한다. 첫째는 영상 기반 특징을 추출하여 신경망을 사용하고, 두 번째는 우편 영상의 문자열의 Bound Box를 추출하여 이들의 겹침정도를 이용하여 유사성을 판별한다. 실험을 통해 제안한 두가지 방법이 유용함을 입증하였다.

  • PDF

유전알고리즘을 이용한 범용 올리고뉴클레오타이드 태그 디자인 (Universal Oligonucleotide Tag Design using Genetic Algorithm)

  • 임희웅;유석인;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.256-258
    • /
    • 2005
  • 올리고뉴크레오타이드 서열의 디자인은 일반 분자 생물학 뿐만 아니라 DNA 컴퓨팅 분야에서도 중요한 문제이다. DNA나 RNA와 같은 생체 물질간의 화학반응을 이용하여 계산을 수행하는데 사용되는 염기 서열의 품질은 계산의 정확도에 큰 영향을 미치기 때문에, 문제의 특성에 따른 요구 조건에 안는 염기 서열을 디자인 하기위한 방법에 대해 여러 가지 연구가 있어왔다. 기존의 DNA 컴퓨팅을 위한 염기서열 디자인은 주어진 녹는점의 범위에서 단순히 서로 독립적인 염기서열들의 집합을 디자인 하거나, 분자생물학 실험에 사용되는 올리고 프로브나 프라이머 셋을 디자인 하는 것을 중심으로 이루어졌다. 반면, 본 논문에서는 세포에서 추출된 DNA/RNA 분자가 섞여있는 환경에서 어느 DNA/RNA 분자와도 흔성화 반응물 하지않는 범용 올리고뉴클레오타이드 태그를 디자인하는 간단한 유전 알고리즘을 제시하며, 이를 이용해서 디자인된 염기서열 결과를 제시한다.

  • PDF

무선 인터넷을 위한 프레임 지원 HTML 변환기의 설계 및 구현 (Design and Implementation of an HTML Converter Supporting frame for the Wireless Internet)

  • 한진섭;차호정;박병준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.499-501
    • /
    • 2003
  • 본 논문은 무선 인터넷 환경에서 사용자의 편의와 상호 운용성을 고려해서 유선상의 HTML 프레임 콘텐츠를 변환시키는 프레임 지원 HTML 변환기의 설계 및 구현에 대해 기술한다. 구현된 HTML 변환기는 일반 텍스트 콘텐츠의 경우, 일대일 태그 매핑을 통해 WML 콘텐츠로 변환이 된다. 프레임으로 구성된 콘텐츠는 프레임 콘텐츠 재구성 모듈에서 일련의 재구성 과정을 거친 후에 대부분의 프레임 콘텐츠가 여러 메뉴에 대해서 보여지는 타겟 프레임은 하나로 고정되어 있는 것을 고려해서 무선 단말기의 화면에 1행 2열의 테이블 형태의 WML 콘텐츠로 변환이 된다. 즉 좌측열에는 여러 메뉴 콘텐츠를 우측열에는 타겟 프레임에 보여지게 되는 콘텐츠를 위치 시킴으로해서 프레임 콘텐츠의 변환을 수행한다. 추가적으로 이미지 맵이 포함된 콘텐츠의 변환은 이미지 맵 관련 태그를 파싱한 후, 링크되어 있는 HTML 문서의 이름을 추출해서 WML 콘텐츠 데이터로 대체하고, 해당 콘텐츠로 링크시킴으로써 변환이 가능하게 한다.

  • PDF

다수의 SNS를 이용한 키워드 트렌드 분석 시스템 (A Keyword Trend Analysis System Using Multiple SNS Sites)

  • 이명철;한수현;이재성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1133-1135
    • /
    • 2019
  • 기업이나 정부 등의 정책 결정에 활용하기 위해, SNS에서 사용하는 키워드를 추출하여 소비자나 유권자의 관심과 선호도를 분석하는 방법이 많이 사용되고 있다. 본 논문에서는 다수의 SNS 사이트에 올린 글과 그에 대한 공감(좋아요) 댓글, 해시태그를 분석하여 관심 키워드의 트렌드를 분석할 수 있는 시스템을 제안한다. 이 시스템에서는 각각의 SNS 글을 형태소 분석하여 키워드 빈도를 측정하고 그에 대한 공감 및 해시태그의 갯수를 계산하여 일정기간 동안의 변화를 그래프로 표시하였다. 이를 통해, 여러 사이트에서의 키워드 트렌드를 한눈에 확인할 수 있도록 했다.

인스타그램 게시물 데이터를 활용한 건강기능식품 브랜드 분석 및 평가 (Analysis and evaluation of Health Functional Food(HFF) brand using Instagram post data)

  • 윤현주;신재영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.533-534
    • /
    • 2021
  • 최근 소셜 네트워크 서비스(SNS)를 통한 건강기능식품 과대광고 적발이 증가하면서 SNS를 통해 브랜드를 선택함에 있어 신뢰도가 소비자에게 중요한 요소가 된다. 본 논문에서는 인스타그램의 해시태그를 이용해 게시글을 크롤링 하여 수집된 게시물 데이터를 가공 및 분석한다. 불용어 사전을 구축해 불용어를 제거해준 뒤 브랜드 추출을 진행하고, 건강기능식품 브랜드 5개에 대한 게시글 데이터를 수집한다. 5개 브랜드의 신뢰도 측정을 위해 게시글, 해시태그, 계정명을 분석기준으로 삼아 라벨링 처리를 한다. 라벨링 된 열을 통해 절대적 수치로 점수를 부여하여 백분율로 점수를 표현한다. 신뢰도 점수와 더불어 브랜드의 고객 참여도 건수를 같이 명시해 준다.

  • PDF

웹사이트의 구조주출, 저장 및 가시화를 위한 구조분석 에이전트 (A Structure Analysis Agent for Extraction, Storage and Visualization of Web Sites)

  • 정윤경;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.313-315
    • /
    • 2001
  • 인터넷 비즈니스 사이트가 많아짐에 따라 사용자에게 편리한 비즈니스 사이트를 구추하기위해 웹서버의 구조 및 내용을 평가하고 재구성해야 하는데, 수작업에 의한 웹문서의 평가시 인적, 시간적 비용이 높고 시스템에 대한 평가값이 객관적이지 못하다. 이를 해결하기 위해 본 논문에서는 구조추출, 구조저장, 구조가시화로 구성된 웹문서의 구조분석 에이전트를 제안한다. 구조추출 모듈은 URL로 웹문서를 받고 이를 잘정의된 XML형태로 변환한 후, 태그정보를 이용하여 웹문서의 구조를 구하고, 하이퍼링크데이터를 이용하여 웹문서간의 연결구조를 얻는다. 구조저장은 추출된 웹문서와 웹문서 연결관계를 웹서버와 같이 연결하여 저장하며, 구조 가시화에서 이를 계층적으로나 그래프형식으로 가시화된다. 제안한 시스템의 유용성을 보이기 위하여 웹문서의 평가문제에 적용한 결과, 많은 양의 데이터를 의 데이터의 기술적인 평가가 가능하고, 데이터를 수집하기 위한 인력자원, 시간과 비용을 줄일수 있으며, 쉽게 사이트를 평가하여 서비스 수준을 향상 시킬 수 있음을 알 수 있었다.

  • PDF

기계학습 알고리즘에 근거한 단백질 이름의 자동 추출 (A Machine Learning Approach for Automatic Protein Name Extraction from Journal Articles)

  • 김정호;백은옥;이공주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.259-261
    • /
    • 2004
  • 생물학 분야의 문헌으로부터 유전자 및 단백질 이름을 추출하는 기술은 바이오 텍스트 마이닝 분야의 기반 기술로 그 중요성이 점차 증대되고 있다. 이 연구에서는 생물학 분야 문헌의 초록으로부터 하나의 토큰으로 구성된 single gene name은 물론 여러 개의 토큰으로 이루어진 multi gene name까지 유전자나 단백질의 이름을 자동으로 추출하는 시스템 TagGeN(Tagger for Gene Name)을 제안한다. TagGeN은 기존의 태거와 달리, 문자나 숫자 이외의 기호를 포함한 유전자나 단백질 이름의 품사 처리에 있어 개선 방안을 제시하고, 여러 토큰으로 이루어진 이름의 인식에 있어 나란한 두 토큰이 갖는 태그 정보를 이용한 조건부 확률에 근거하여 Markov 모델을 도입한다. 위와 같은 개선방안을 구현한 TagGeN은 성능면에서 기존의 유사시스템에 비해 recall 20.8%, precision 4.7%의 성능향상을 보임으로써 본 연구에서 제안한 방법론의 효과를 입증한다.

  • PDF

텍스트 정보와 시각 특징 정보를 이용한 효과적인 웹 이미지 캡션 추출 방법 (An Efficient Web Image Caption Extraction Method based on Textual and Visual Information)

  • 황지익;박주현;낭종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.346-348
    • /
    • 2006
  • 기존의 웹 이미지 검색 시스템들은 웹 페이지에 포함된 텍스트들의 출현빈도, 태그유형 등을 고려해 각 키워드들의 중요도를 평가하고 이를 이용해 이미지의 캡션을 결정한다. 하지만 텍스트 정보만으로 캡션을 결정할 경우, 키워드와 이미지 사이의 관련성을 평가할 수 없어 부적절한 캡션의 배제가 어렵고, 사람의 인지와 맞지 않는 캡션이 추출되는 문제점이 있다. 본 논문에서는 기존의 웹 이미지 마이닝 방법을 통해 웹 페이지로부터 캡션 후보 키워드를 추출하고, 자동 이미지 주석 방법을 통해 이미지의 개념 부류 키워드를 결정한 후, 두 종류의 키워드를 결할하여 캡션을 선택한다. 가능한 결합 방법으로는 키워드 병합 방법, 공통 키워드 추출 방법, 개념 부류 필터링 방범 캡션 후보 필터링 방법 등이 있다. 실험에 의하면 키워드 병합 방법은 높은 재현율을 가져 이미지에 대한 다양한 주석이 가능하고 공통 키워드 추출 방법과 개넘 부류 키워드 필터링 방법은 정확률이 높아 이미지에 대한 정확한 기술이 가능하다. 특히, 캡션 후보 키워드 필터링 방법은 기존의 방법에 비해 우수한 재현율과 정확률을 가지므로 기존의 방법에 비해 적은 개수의 캡션으로도 이미지를 정확하게 기술할 수 있으며 일반적인 웹 이미지 검색 시스템에 적용할 경우 효과적인 방법이다.

  • PDF

웹 문서 중 의미 있는 표의 추출 (Extraction of Meaningful Tables from The Web Documents)

  • 정성원;이원희;김영기;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.332-339
    • /
    • 2002
  • 현재까지 정보 검색 시스템은 색인어 위주로써 문서의 구조적 정보를 고려하지 알았다. 글자의 크기나 글자체, 들여 쓰기, 표 등은 저자의 의도를 구체화하며, 문서를 명확하게 하는 주요한 수단이다. 이 연구에서는 특히 표에 주목한다. 표는 많은 문서에 일반적으로 쓰이며, 글을 명확하게 해 준다. 일반 문서에 비해서 웹 문서는 태그를 이용하여 정보를 추가할 수 있어 표를 쉽게 구분할 수 있다. 하지만, 웹 상의 표는 지식을 구조화하는 근본적인 목적이외에, 단순히 화면을 정렬하려고 하는 목적으로도 많이 쓰인다. 이 연구에서는 정보 검색시스템에 표 정보를 사용하기 위한 전처리 단계로 의미 있는 표를 추출하는 방법을 제시하며, 이를 위하여 결정 트리를 사용한다.

  • PDF

사용자 활동과 시간 정보를 적용한 추천 기법에 관한 연구 (A Study on Recommender Technique Applying User Activity and Time Information)

  • 윤소영;윤성대
    • 한국정보통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.543-551
    • /
    • 2015
  • 인터넷과 모바일 기기의 사용이 보편화되면서 사용자들이 다양한 웹 사이트에서 자신이 원하는 정보를 찾기 위해 검색과 추천을 이용하는 것이 일상화되고 있다. 본 논문에서는 사용자에게 보다 적합한 아이템을 추천하기위해 사용자의 활동과 시간 정보를 적용하여 시간의 흐름에 따른 사용자의 선호도 변화를 반영한 추천 기법을 제안한다. 제안하는 기법은 아이템 선택 시 고려되는 태그 정보를 포함한 데이터를 카테고리별로 분류한 후 시간 변화에 따른 사용자 선호도 변화 정보를 반영한 데이터만을 사용한다. 해당 카테고리를 선호하는 사용자에게는 협업 필터링 기법에 태그 정보를 적용하여 추출한 아이템을 추천하고, 일반 사용자에게는 태그 정보를 사용하여 계산한 순위를 기반으로 아이템을 추천한다. 제안하는 기법은 hetrec2011-movielens-2k 데이터셋을 사용하여 실험하였으며 실험을 통해 제안한 기법이 기존의 아이템 기반, 사용자 기반 기법보다 추천의 정확성과 적합성이 향상되는 것을 확인하였다.