• 제목/요약/키워드: 정보 검색 패턴

검색결과 486건 처리시간 0.023초

트위터 데이터를 이용한 네트워크 기반 토픽 변화 추적 연구 (Topic-Network based Topic Shift Detection on Twitter)

  • 진설아;허고은;정유경;송민
    • 정보관리학회지
    • /
    • 제30권1호
    • /
    • pp.285-302
    • /
    • 2013
  • 본 연구는 높은 접근성과 간결성으로 인해 방대한 양의 텍스트를 생산하는 트위터 데이터를 분석하여 토픽의 변화 시점 및 패턴을 파악하였다. 먼저 특정 상품명에 관한 키워드를 추출한 후, 동시출현단어분석(Co-word Analysis)을 이용하여 노드와 에지를 통해 토픽과 관련 키워드를 직관적으로 파악 가능한 네트워크로 표현하였다. 이후 네트워크 분석 결과를 검증하기 위해 출현빈도 기반의 시계열 분석과 LDA 토픽 모델링을 실시하였다. 또한 트위터 상의 토픽 변화와 언론 기사 검색결과를 비교한 결과, 트위터는 언론 뉴스에 즉각적으로 반응하며 부정적 이슈를 빠르게 확산시키는 것을 확인하였다. 이를 통해 기업은 대중의 부정적 의견을 신속하게 파악하고 이에 대한 즉각적인 의사결정 및 대응을 위한 도구로 본 연구방법을 활용할 수 있을 것으로 기대된다.

빅데이터 분석을 활용한 인공지능 인식에 관한 연구 (A Study on Recognition of Artificial Intelligence Utilizing Big Data Analysis)

  • 남수태;김도관;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.129-130
    • /
    • 2018
  • 빅데이터 분석은 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 데이터를 효과적으로 분석하는 기술을 말한다. 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 글로벌 리서치 기관들은 빅데이터 분석을 2011년 이래로 가장 주목받는 신기술로 지목해오고 있다. 따라서 대부분의 산업에서 기업들은 빅데이터의 적용을 통해 새로운 가치 창출을 위해 노력을 하고 있다. 본 연구에서는 다음 커뮤니케이션의 빅데이터 분석 도구인 소셜 매트릭스를 활용하여 분석하였다. 2018년 5월 19일 시점 1개월 기간을 설정하여 "인공지능" 키워드에 대한 대중들의 인식을 분석하였다. 빅데이터 분석의 결과는 다음과 같다. 첫째, 인공지능에 대한 1위 연관 검색어는 중국(4,122)인 것으로 나타났다. 결과를 바탕으로 연구의 한계와 시사점을 제시하고자 한다.

  • PDF

타임 워핑 하의 효율적인 시계열 서브시퀀스 매칭을 위한 접두어 질의 기법의 확장 (On Extending the Prefix-Querying Method for Efficient Time-Series Subsequence Matching Under Time Warping)

  • 장병철;김상욱;차재혁
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.357-368
    • /
    • 2006
  • 본 논문에서는 타임 워핑 하의 시계열 서브시퀀스 매칭을 처리하는 방법에 대하여 논의한다. 타임 워핑은 시퀀스의 길이가 서로 다른 경우에도 유사한 패턴을 갖는 시퀀스들을 찾을 수 있도록 해 주는 변환이다. 접두어 질의 기법(prefix-querying method)는 착오 기각 없이 타임 워핑 하의 시계열 서브시퀀스 매칭을 처리하는 인덱스를 이용한 최초의 방식이다. 이 방법은 사용자가 질의를 편리하게 작성하도록 하기 위하여 기본 거리함수로서 $L_{\infty}$를 사용한다. 본 논문에서는 $L_{\infty}$ 대신 타임 워핑 하의 시계열 서브시퀀스 매칭에서 기본 거리 함수로서 가장 널리 사용되는 $L_1$을 적용할 수 있도록 접두어 질의를 확장한다. 또한, 제안된 기법으로 타임 워핑 하의 시계열 서브시퀀스 매칭을 수행하는 경우 착오 기각(false dismissal)이 발생하지 않음을 이론적으로 증명한다. 다양한 실험을 통한 성능 평가를 통하여 본 연구에서 제시하는 기법의 우수성을 검증한다. 실험 결과에 의하면, 제안된 기법은 가장 좋은 성능을 보이는 기존의 기법과 비교하여 매우 뛰어난 성능 개선 효과를 보이는 것으로 나타났다.

빅데이터 분석을 활용한 사물인터넷 키워드에 관한 조망 (An Insight Study on Keyword of IoT Utilizing Big Data Analysis)

  • 남수태;김도관;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.146-147
    • /
    • 2017
  • 빅데이터 분석은 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 데이터를 효과적으로 분석하는 기술을 말한다. 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 글로벌 리서치 기관들은 빅데이터 분석을 2011년 이래로 가장 주목받는 신기술로 지목해오고 있다. 따라서 대부분의 산업에서 기업들은 빅데이터의 적용을 통해 새로운 가치 창출을 위해 노력을 하고 있다. 본 연구에서는 다음 커뮤니케이션의 빅데이터 분석 도구인 소셜 매트릭스를 활용하여 분석하였다. 2017년 10월 8일 시점 1개월 기간을 설정하여 "사물인터넷" 키워드에 대한 대중들의 인식을 분석하였다. 빅데이터 분석의 결과는 다음과 같다. 첫째, 사물인터넷 키워드에 대한 1위 연관 검색어는 기술(995)인 것으로 나타났다. 결과를 바탕으로 연구의 한계와 시사점을 제시하고자 한다.

  • PDF

테마파크에서의 안전사고 발생행태에 관한 연구 (A Study on the Behavior of Safety Accidents in Theme Parks)

  • 유인종;김태옥
    • 한국재난정보학회 논문집
    • /
    • 제15권1호
    • /
    • pp.133-142
    • /
    • 2019
  • 연구목적: 본 연구는 테마파크에서 발생되는 안전사고의 발생 현황 및 형태, 그리고 사고원인 등을 조사 분석하는 것을 목적으로 한다. 연구방법:연구를 위해 신문 검색프로그램인 스크랩마스터를 이용하여 언론에 보도되었던 해외 테마파크 안전사고를 조사하였으며, 한국소비자원 등에 의뢰하여 수집한 710건의 안전사고를 분석하였다. 연구결과: 언론에 보도되는 해외 테마파크의 안전사고는 매년 40~60건씩 발생하고 있다. 조사된 자료에 의해서만도 국내에서는 연평균 87건의 안전사고가 발생하고 있고, 사고의 발생형태 및 상해종류 등에 있어서 일정한 패턴을 나타내었다. 결론:본 연구를 통해 테마파크에서 발생되는 다양한 안전사고의 형태와 원인을 파악하여 효과적인 안전사고 예방대책을 수립하고, 시행해야 한다.

시퀀스 데이터베이스에서 타임 워핑을 지원하는 효과적인 인덱스 기반 서브시퀀스 매칭 (An Index-Based Approach for Subsequence Matching Under Time Warping in Sequence Databases)

  • 박상현;김상욱;조준서;이헌길
    • 정보처리학회논문지D
    • /
    • 제9D권2호
    • /
    • pp.173-184
    • /
    • 2002
  • 본 논문에서는 대용량 시퀀스 데이터베이스에 타임 워핑을 지원하는 인덱스 기반 서브시퀀스 매칭에 관하여 논의한다. 타임 워핑은 시퀀스의 길이가 서로 다른 경우에도 유사한 패턴을 갖는 시퀀스들을 찾을 수 있도록 해준다. 최근의 연구에서 타임 워핑을 지원하는 효과적인 전체 매칭 기법을 제안된바 있다. 이 기법은 데이터 시퀀스들로부터 타임 워핑에 영향을 받지 않는 특징 벡터들의 집합을 대상으로 인덱스를 구성한다. 또한, 특징 공간상에서의 필터링을 위하여 삼각형 부등식을 만족하는 타임 워핑 거리의 하한 함수를 사용한다. 본 연구에서는 이 기존의 연구에 슬라이딩 윈도우를 기반으로 하는 접두어-질의 방법을 결합하는 새로운 기법을 제안한다. 인덱싱을 위하여 각 슬라이딩 윈도우와 대응되는 서브 시퀀스로부터 특징 벡터를 추출하고, 이 특징 벡터를 인덱싱 애트리뷰트로 사용하는 다차원 인덱스를 구성한다. 질의 처리를 위하여, 조건을 만족하는 질의 접두어들에 대한 특징 벡터들을 이용하여 다수의 인덱스 검색을 수행한다. 제안된 기법은 대용량의 데이터베이스에서도 효과적인 서브시퀀스 매칭을 지원한다. 본 연구에서는 제안된 기법이 착오 기각을 유발시키지 않음을 증명한다. 제안된 기법의 우수성을 규명하기 위하여 다양한 실험을 수행한다. 실험 결과에 따르면, 제안된 기법은 실제 S&P 500 주식 데이터와 대용량의 생성 데이터 모두에 대하여 큰 성능 개선 효과를 보이는 것으로 나타났다.

컴포넌트 기반의 망관리 시스템 개발에 관한 연구 (A Study on Development of Network Management Systems base on Component)

  • 김행곤;김지영
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.937-950
    • /
    • 2004
  • 인터넷과 웹의 확산으로 네트워크 기반의 분산 환경은 응용의 표준 아키텍처로 인식되고 있다. 또한 네트워크의 효율성과 최상의 서비스 제어와 공유를 위해 복잡한 네트워크 구성 자원들을 관리하는 망 관리 시스템이 요구되고, 이는 응용의 표준 하부 지원 시스템으로서 뿐 아니라 독립적인 상업적 응용으로서 수요와 기대가 점차 증가하고 있다. 하지만 특정 프로토콜이나 특정적인 벤더의 장치에 의존적으로 분산되어져 있고, 이기종의 분산형 네트워크 자체의 성질 때문에 이들 시스템들을 통합하고 일관성 있게 관리할 수 있는 표준화된 망관리의 필요성이 요구되고 있다. 또한 소프트웨어 개발 방법 측면에서는 패턴과 컴포넌트에 의한 조림, 확장을 중심으로 하는 소프트웨어 재사용이 소프트웨어 생산의 기대치를 현실화할 수 있는 최상의 접근 방법으로 인정된다. 이에 따라 잘 정의된 인터페이스를 통해 좀더 쉽고 빠른 응용을 개발 가능하게 하는 컴포넌트 기반 개발 방법론을 기반으로 컴포넌트를 구축, 선택, 조림함으로써 높은 품질과 생산성을 보장한다. 따라서 본 논문에서는 분산 망관리 시스템 개발을 위해 망관리 아키텍처를 정의하고, 망관리 설계패턴과 컴포넌트들을 식별, 정의하여 컴포넌트 아키텍처에 매핑한다. 또한 이를 통해 컴포넌트 개발과 유통, 사용을 위한 컴포넌트를 명세하고, 컴포넌트 설계를 통해 이를 구현하였으며, 구현된 컴포넌트들은 등록, 검색 및 이해할 수 있는 컴포넌트 저장소 시스템으로 적용하고, 미리 구현된 컴포넌트를 통해 전체 망관리 시스템을 분석/설계, 구현하였다.

원격탐사 자료 기반 지형공간 특성분석을 위한 텍스처 영상 비교와 템플레이트 정합의 적용 (Comparison of Texture Images and Application of Template Matching for Geo-spatial Feature Analysis Based on Remote Sensing Data)

  • 류희영;전소희;이기원;권병두
    • 한국지구과학회지
    • /
    • 제26권7호
    • /
    • pp.683-690
    • /
    • 2005
  • 공간 해상도 1m 이하의 고해상도 원격 탐사 영상의 민간 활용이 활발해 짐에 따라, 이를 위한 전문 분야 별 영상 분석 방법의 개발 요구가 증가하고 있다. 다양한 영상분석 기법 중에, 주변 화소들간의 공간 분포 관계에 의해 특성이 결정되는 텍스처 영상의 분석은 이러한 목적을 위한 유용한 영상 분석 방법 중 하나이다. 이 연구에서는 원시 영상으로부터 GLCM 알고리즘에 의해 생성된 텍스처 영상에 대해서 방향 인자, 마스킹 커널의 크기, 변수의 종류에 따른 결과를 비교, 분석한 뒤 각각의 결과 영상의 지형공간 특성 분석의 적용성에 대하여 알아보았다. 또한 원시 영상과 텍스처 영상에서 특성 정보를 포함하는 템플레이트를 설정하고 이를 기준으로 반복적인 패턴을 자동으로 검색하는 템플레이트 정합 프로그램을 구현하여 이를 원시 영상과 텍스처 영상에 적용하였고, 처리 결과에 기초하여 향후 적용 가능성을 검토하였다. 이 연구의 결과는 일정한 패턴으로 나타나는 지구과학적인 지형 특성이나 고해상도 위성영상 정보를 이용한 인공 지형지물의 파악 및 분석에 효과적으로 적용될 수 있을 것으로 예상된다.

Watersheds 기반 계층적 이진화를 이용한 단백질 반점 분할 알고리즘 (The Algorithm of Protein Spots Segmentation using Watersheds-based Hierarchical Threshold)

  • 김영호;김정자;김대현;원용관
    • 정보처리학회논문지B
    • /
    • 제12B권3호
    • /
    • pp.239-246
    • /
    • 2005
  • 생물학자가 단백질을 검색하고 분석하기 위해서는 2차원 젤 전기영동(2DGE : Two Dimensional Gel Electrophoresis) 실험을 해야 한다. 실험 결과는 2차원 영상이 생성된다. 2차원 영상에서 단백질 반점의 패턴 분석을 위해 2차원 젤 영상에 펼쳐진 단백질 반점들을 영상처리를 통해 분할하고, 대조 그룹의 단백질 패턴과 비교분석을 통해 밝히고자하는 단백질 반점을 찾아내야 한다. 단백질 반점을 분할하는 알고리즘에 있어서 기존에는 가우시안 함수를 적용하였지만, 최근 들어 형태학 분리개념에 의한 Watersheds 영역기반 분할(Watersheds region-based segmentation) 알고리즘을 활용하고 있다. 그러나 Watersheds 영역기반 분할 알고리즘은 크기가 큰 영상에서 원하는 영역을 신속하게 분할한다는 장점이 있지만, 영상 화소의 그레이 값이 연속적인 경우 실제 반점의 개수 에 비해 과다분할(over-segmentation)되거나 과소분할(under-segmentation)의 문제점을 안고 있다. 이는 마커(marker) 포인트의 설정에 의해 어느 정도 해결할 수 있지만 병합(merge)과 분할(split) 과정을 반복해야 한다. 본 논문은 Watersheds 기반 계층적 이진화 기법을 적용하여 마커 드리븐 Watersheds 영상분할의 문제점을 해결하고자 한다.

효과적인 추천과 세분화를 위한 트랜잭션 기반 여러 형태 사용자 프로파일의 구축 (The Construction of Multiform User Profiles Based on Transaction for Effective Recommendation and Segmentation)

  • 고재진;안형근
    • 정보처리학회논문지D
    • /
    • 제13D권5호
    • /
    • pp.661-670
    • /
    • 2006
  • 쉽게 접할 수 있는 정보의 양이 증가하고 전자상거래가 발전함에 따라, 드넓은 정보공간을 축소하기 위하여 추천과 SDI 시스템과 같은 정보 필터링 시스템이 사용되어지게 되었으며, 이에 따라 사용자들은 그들의 요구와 취향에 가장 적합한 정보들을 바로 접근할 수 있게 되었다. 지금까지 다양한 정보 필터링 방법들이 추천시스템을 지원하기 위해 제안되었다. 최근에는 새로운 정보교환 표준으로 떠오르고 있는 XML 문서를 필터링 하는 시스템들에 있어서도 다른 접근 방법을 요구하고 있다. 따라서, 본 논문에서 제안하는 시스템은 XML이 가진 구조 정보를 이용하여 여러 형태의 사용자 프로파일을 생성하는 방법을 제안한다. 시스템은 구매와 같은 트랜잭션이 발생하기 전에 사용자 구매 패턴을 분석하기 위해서 필요한 프로파일을 운영자가 직접 정의하는 운영자 프로파일과 이를 적용한 사용자 프로파일의 두 부분으로 구성된다. 운영자 프로파일은 DTD로부터 선택된 항목을 이용하여 DTD를 따르는 문서내의 특정부분을 가리킬 수 있도록 만들어진다. 제안하는 시스템은 사용자의 구매 행위에 적응력을 가질 수 있도록 보다 정확한 사용자 프로파일을 구축하고, 이와 같은 사용자 프로파일을 기반으로 사용자에게 불필요한 검색과정 없이 필요한 상품 정보를 제공할 수 있도록 한다.