• Title/Summary/Keyword: 의미 기반 정보 추출

Search Result 676, Processing Time 0.028 seconds

특징 분석과 프랙탈 차원을 이용한 객체 기반 영상검색 (A Object-Based Image Retrieval Using Feature Analysis and Fractal Dimension)

  • 이정봉;박장춘
    • 한국멀티미디어학회논문지
    • /
    • 제7권2호
    • /
    • pp.173-186
    • /
    • 2004
  • 영상 검색의 수행 방법으로 사람의 시각 시스템의 특성을 기반으로 주요 의미를 갖는 객체의 효과적인 특징 추출을 통한 내용기반 영상 검색 시스템을 제안한다. 관심 객체 영역이 우선적으로 검출되도록 하기 위해 영상 내에서 비교적 면적이 크고 배경색상과의 차이가 크면서 영상의 가운데 위치하는 영역을 의미를 갖는 주요 객체로 판단하였다. 영상 고유의 특징을 얻기 위해서는 영상의 객체 윤곽선의 전체 길이를 정규화 된 일정한 세그먼트로 분할한 후에 객체 윤곽선의 세그먼트가 갖는 편각차분 벡터들의 누적 합과 양분된 객체의 시그너처를 추출하여 물체의 회전과 크기 변화에 적응적인 형태 특징으로 사용한다. 이와 같은 형태 특징을 필두로 해서 질감 샘플과 칼라, 그리고 이심률 정보를 결합하여 유사도를 측정함으로써 이동, 회전 크기 변화에 강건한 검색이 가능했으며 영역의 부분적인 변화나 손상으로 인한 객체 특성의 왜곡 현상에 덜 민감하게 반응하였다. 또한 Box-Counting Dimension에 의한 프랙탈 차원을 이용하여 측정한 객체간 복잡도 관계를 기반으로 하여 영상 특징에 서로 다른 유사도 가중치를 부여하는 방법이 잘못된 검색을 최소로 하여 더욱 효율적인 검색율을 보였다.

  • PDF

검색 편의성 향상을 위한 패턴 분석 기반 질의어 확장 (Pattern Analysis-Based Query Expansion for Enhancing Search Convenience)

  • 전서인;박건우;남광우;류근호
    • 한국산업정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.65-72
    • /
    • 2012
  • 21세기 정보화시대에 정보자원의 양은 증대되고 있으며 필요한 정보를 손쉽게 취득하게 해주는 정보검색 시스템의 역할이 중요해지고 있다. 일반적으로 사용자가 원활한 검색을 하기 위해서는 검색하고자 하는 정보에 대한 충분한 사전 파악이 필요하며, 키워드를 식별하는 능력 또한 뛰어나야 한다. 하지만 대부분의 사용자들이 충분한 지식을 갖추고 검색을 수행하지 않으며 질의어에 적합한 효율적인 키워드를 연상하는데 많은 시간을 소비한다. 또한 여러 검색엔진에서 연관검색어 서비스를 제공하고 있지만 이는 검색어와 유사한 의미 내용이 대부분이며 사용자에게 맞는 확장/연관검색어를 제공하여 주지 못한다. 본 논문은 질의어 패턴 분석 기반의 사용자 확장 검색어 추출 및 추천을 통해 사용자의 검색 편의성을 제공하기 위한 시스템을 제안한다.

오피니언 마이닝 기반 SNS 감성 정보 분석 전략 설계 (A Design of SNS Emotional Information Analysis Strategy based on Opinion Mining)

  • 정은희;이병관
    • 한국정보전자통신기술학회논문지
    • /
    • 제8권6호
    • /
    • pp.544-550
    • /
    • 2015
  • 현재, SNS으로 소통되는 의견들이 증가하고 있기 때문에 SNS 메시지로부터 의미 있는 정보를 유추해내는 오피니언 마이닝(Opinion mining) 기술이 중요해지고 있다. 본 논문은 반의어와 부사의 위치에 따라 가중치를 다르게 설정하여 SNS의 감성 정보를 정확하게 추출하는 오피니언 마이닝 기반 SNS 감성 정보 분석 전략(SEIAS, SNS Emotional Information Analysis Strategy)을 제안한다. 제안하는 SEIAS(SNS Emotional Information Analysis Strategy)는 첫째, 오피니언 마이닝 분석에 필요한 감성사전을 구축하고, 둘째, SNS 데이터를 실시간으로 수집하고, 수집된 SNS 데이터와 감성사전를 비교하여 SNS 데이터의 의견값을 산출한다. 특히, 데이터의 의견값을 산출할 때, 반의어, 부사의 위치에 따라 가중값을 다르게 설정함으로써 기존의 SO-PMI와 비교하였을 때 오피니언 분석결과의 정확도를 향상시켰다.

GIS-우편 마케팅 시스템에서 Geo-Lifestyle 군집화 및 시공간 데이터 큐브를 이용한 구매.소비 성향 예측 (Prediction of Consumer Propensity to Purchase Using Geo-Lifestyle Clustering and Spatiotemporal Data Cube in GIS-Postal Marketing System)

  • 이헌규;최용훈;정훈;박종흥
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권4호
    • /
    • pp.74-84
    • /
    • 2009
  • 이 연구는 국내 우편물량 감소와 우편사업 경쟁력 강화를 위하여 GIS 및 시공간 마이닝 기술을 이용한 GIS 기반의 새로운 우편 마케팅 기법을 제안한다. 홍보를 원하는 기업체에게 의미 있고 정확한 마케팅 정보 제공을 위해서 Geo-Lifestyle 군집화를 적용한 인구 사회학적 마켓 세분화 기법과, 시간 공간 차원의 다차원적 분석을 통한 시공간 구매 소비 성향 예측 기법을 제안하였다. Geo-Lifestyle 군집분석 및 시공간 큐브 마이닝의 평가를 위해서 강남구, 송파구 지역의 내부 외부데이터를 사용하였고, 실험결과 14개의 최적 마케팅 클러스터를 생성하였으며 구매 소비 성향 예측을 위한 시 공간 패턴을 추출하였다.

  • PDF

표면 웹기반 공개정보 수집을 위한 워크플로우 확장 연구 (A Study on the Expansion of Workflow for the Collection of Surface Web-based OSINT(Open Source Intelligence))

  • 이수경;최은정;김지연;이인수;이승훈;김명주
    • 디지털융복합연구
    • /
    • 제20권4호
    • /
    • pp.367-376
    • /
    • 2022
  • 전통적인 형사 사건에서 조사 대상에 관한 정보는 국가의 합법적 조직이 보유하고 있는 개인정보만이 제공되기 때문에 정보 수집에 한계가 있다. 일반 검색엔진으로 검색이 가능한 SNS와 포털사이트를 포함하는 표면 웹 기반 공개정보(OSINT)는 범죄수사에 사용할 수 있는 의미 있는 프로파일링에 활용할 수 있다. 한국형 공개정보 워크플로우를 사용하면 공개정보 기반의 효과적인 프로파일링이 가능하지만 "개인"의 경우에는 "성명"으로 시작되기 때문에 수집할 수 있는 공개정보가 제한적이고 동명이인의 정보가 수집되는 등의 신뢰성의 한계가 있다. 본 논문에서는 이러한 한계를 극복하기 위해 개인과 연관된 정보 즉, 등가정보를 정의하고 이를 기반으로 효율적이고 정확한 정보를 수집할 수 있도록 한다. 따라서, 공개정보에서 특정인과 연관된 정보 즉, 등가정보를 추출할 수 있는 개선된 워크플로우를 제시한다. 이때 인물의 인지도에 따라 서로 다른 워크플로우를 제시한다. 이를 통해 인물(개인)의 효과적인 프로파일링이 가능하여 수사 정보 수집의 신뢰도를 높인다. 본 연구를 통해 향후에는 해당 워크플로우를 인공지능 기술을 이용하여 수집된 정보의 분석과정을 자동화할 수 있는 시스템을 개발함으로써 범죄 수사에 있어서 공개 정보 활용을 위한 기틀을 마련하고 수사 방식 다양화에 기여할 수 있을 것이다.

뉴럴 텐서 네트워크 기반 주식 개별종목 지식개체명 추출 방법에 관한 연구 (A Study on Knowledge Entity Extraction Method for Individual Stocks Based on Neural Tensor Network)

  • 양윤석;이현준;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.25-38
    • /
    • 2019
  • 정보화 시대의 넘쳐나는 콘텐츠들 속에서 사용자의 관심과 요구에 맞는 양질의 정보를 선별해내는 과정은 세대를 거듭할수록 더욱 중요해지고 있다. 정보의 홍수 속에서 사용자의 정보 요구를 단순한 문자열로 인식하지 않고, 의미적으로 파악하여 검색결과에 사용자 의도를 더 정확하게 반영하고자 하는 노력이 이루어지고 있다. 구글이나 마이크로소프트와 같은 대형 IT 기업들도 시멘틱 기술을 기반으로 사용자에게 만족도와 편의성을 제공하는 검색엔진 및 지식기반기술의 개발에 집중하고 있다. 특히 금융 분야는 끊임없이 방대한 새로운 정보가 발생하며 초기의 정보일수록 큰 가치를 지녀 텍스트 데이터 분석과 관련된 연구의 효용성과 발전 가능성이 기대되는 분야 중 하나이다. 따라서, 본 연구는 주식 관련 정보검색의 시멘틱 성능을 향상시키기 위해 주식 개별종목을 대상으로 뉴럴 텐서 네트워크를 활용한 지식 개체명 추출과 이에 대한 성능평가를 시도하고자 한다. 뉴럴 텐서 네트워크 관련 기존 주요 연구들이 추론을 통해 지식 개체명들 사이의 관계 탐색을 주로 목표로 하였다면, 본 연구는 주식 개별종목과 관련이 있는 지식 개체명 자체의 추출을 주목적으로 한다. 기존 관련 연구의 문제점들을 해결하고 모형의 실효성과 현실성을 높이기 위한 다양한 데이터 처리 방법이 모형설계 과정에서 적용되며, 객관적인 성능 평가를 위한 실증 분석 결과와 분석 내용을 제시한다. 2017년 5월 30일부터 2018년 5월 21일 사이에 발생한 전문가 리포트를 대상으로 실증 분석을 진행한 결과, 제시된 모형을 통해 추출된 개체명들은 개별종목이 이름을 약 69% 정확도로 예측하였다. 이러한 결과는 본 연구에서 제시하는 모형의 활용 가능성을 보여주고 있으며, 후속 연구와 모형 개선을 통한 성과의 제고가 가능하다는 것을 의미한다. 마지막으로 종목명 예측 테스트를 통해 본 연구에서 제시한 학습 방법이 새로운 텍스트 정보를 의미적으로 접근하여 관련주식 종목과 매칭시키는 목적으로 사용될 수 있는 가능성을 확인하였다.

Etherboot 기반의 CGRID 구축과 서열분석에의 적용 (CGRID construction based on Etherboot technology and its utilization to sequence analysis)

  • 김태경;조완섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.195-208
    • /
    • 2005
  • 최근 생물학 분야에서 실험 도구의 발달 및 컴퓨터 기술의 도입으로 생물 데이터가 폭발적으로 증가하고 있다. 대량의 생물 데이터로부터 의미 있는 정보를 추출하는 것은 매우 중요한 문제이다. 서열비교는 유전자 및 단백질 기능 예측을 하기 위해 사용되는 가장 기본적인 분석방법이다. 하지만, 급격히 증가하는 대량의 서열데이터에 대하여 처리시간 또한 많이 소요된다. 본 논문에서는 이러한 성능상의 한계를 극복하고 기존 미들웨어 방식의 그리드를 보완하기 위하여 하드웨어 기반의 그리드인 CGRID (Chungbuk national university GRID)를 제안하고 서열비교에 적용한다. 하드웨어 기반의 그리드 방식은 기존의 방식과는 달리 모든 작업노드에 반복적으로 프로그램 설치를 할 필요가 없으므로 그리드 구축, 유지 및 관리가 용이하다. 27대의 PC로 구성된 CGRID에서 89종의 오솔로그 데이터베이스 구축 시간을 33주에서 1주일로 단축하였다. 또한, 실험을 통하여 CGRID에서 PC의 수가 증가함에 따라 시스템의 성능이 비례하여 향상됨을 확인하였다.

  • PDF

SOA 기반 서비스 사이의 오류 데이터 정제 서비스 개발 (Developing dirty data cleansing service between SOA-based services)

  • 지은미;최병주;이정원
    • 정보처리학회논문지D
    • /
    • 제14D권7호
    • /
    • pp.829-840
    • /
    • 2007
  • 현재까지 오류 데이터를 정제하는 기법은 여러 소스로부터 대량의 데이터를 통합하여 데이터베이스에 저장되어 있는 데이터의 품질을 관리함으로써 의미 있는 정보를 추출하기 위함이었다. 급변하는 비즈니스 환경과 무한경쟁 사회에서 지속적으로 생존하려면 환경 변화에 빠르게 대처해야 한다. 최근 시스템의 요구사항이 복잡해짐에 따라 대규모의 분산 시스템을 통합 구축하기 위한 서비스 기반 구조 (Service Oriented Architecture)로 확산되고 있으며, 여기에서도 각 서비스간의 데이터 정제기법을 통한 신뢰성 있는 데이터 교환이 필수적이다. 따라서 본 논문에서는 서비스들이 하나의 시스템으로 통합되는 과정에서 이벤트를 통해 서비스 간에 전송되는 XML데이터의 품질 관리를 수행하여, 이미 통합되어 저장된 데이터베이스 데이터의 오류를 탐지하여 정제하는 것이 아니라 상호 작용하는 서비스간의 데이터 정제에 초점을 두고 SOA를 기반으로 하는 오류 데이터 정제 서비스를 개발한다.

사회문제 해결 연구보고서 기반 문장 의미 식별 데이터셋 구축 (Building Sentence Meaning Identification Dataset Based on Social Problem-Solving R&D Reports)

  • 신현호;정선기;전홍우;권이남;이재민;박강희;최성필
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권4호
    • /
    • pp.159-172
    • /
    • 2023
  • 일반적으로 사회문제 해결 연구는 과학기술을 활용하여 다양한 사회적 현안들에 의미있는 해결 방안을 제시함으로써 중요한 사회적 가치를 창출하는 것을 연구 목표로 한다. 그러나 사회문제와 쟁점을 완화하기 위하여 많은 연구들이 국가적으로 수행되었음에도 불구하고 여전히 많은 사회문제가 남아 있는 상황이다. 사회문제 해결 연구의 전 과정을 원활하게 하고 그 효과를 극대화하기 위해서는 사회적으로 시급한 현안들에 대한 문제를 명확하게 파악하는 것이 중요하다. 사회문제 해결과 관련된 기존 R&D 보고서와 같은 자료에서 중요한 사안을 자동으로 식별할 수 있다면 사회문제 파악 단계가 크게 개선될 수 있다. 따라서 본 논문은 다양한 국가 연구보고서에서 사회문제와 해결방안을 자동으로 감지하기 위한 기계학습 모델을 구축하는 데에 필수적인 데이터셋을 제안하고자 한다. 우선 데이터를 구축하기 위해 사회문제와 쟁점을 다룬 연구보고서를 총 700건 수집하였다. 수집된 연구보고서에서 사회문제, 목적, 해결 방안 등 사회문제 해결과 관련된 내용이 담긴 문장을 추출 후 라벨링을 수행하였다. 또한 4개의 사전학습 언어모델을 기반으로 분류 모델을 구현하고 구축된 데이터셋을 통해 일련의 성능 실험을 수행하였다. 실험 결과 KLUE-BERT 사전학습 언어모델을 미세조정한 모델이 정확도 75.853%, F1 스코어 63.503%로 가장 높은 성능을 보였다.

경량형 임베디드 프로세서를 위한 라이다 거리 기반 클러스터링 기법을 활용한 의미론적 물체 인식 (Semantic Object Detection based on LiDAR Distance-based Clustering Techniques for Lightweight Embedded Processors)

  • 정동규;박대진
    • 한국정보통신학회논문지
    • /
    • 제26권10호
    • /
    • pp.1453-1461
    • /
    • 2022
  • 자율주행차량에서 LiDAR와 같은 3D 데이터 센서를 사용한 주변 물체인식 알고리즘의 정확도는 많은 연구를 통해 상승하고 있으나 그에 따라 높은 성능의 하드웨어와 복잡한 구조를 요구하게 되었다. 이러한 물체인식 알고리즘은 주행 중 많은 프로세서를 수행하고 관리해야 하는 자율주행차량의 메인 프로세서에 큰 부하로 작용한다. 이러한 부하를 감소시킴과 동시에 3D 센서 데이터의 장점을 활용하기 위하여, 3D 센서 데이터에서 물리적 특성을 추출하고 이를 이용하여 생성한 ROI를 이용하여 2D 데이터 기반 인식을 제안한다. 기본 이미지에서 밝기 값을 50% 감소시킨 환경에서 기존 2D 기반 모델 대비 5.3% 높은 정확도와 28.57% 감소한 수행 시간을 보였다. 기본 이미지에서 3D 기반 모델 대비 2.46% 낮은 정확도를 가지는 대신 6.25% 감소한 수행 시간을 가진다.