• Title/Summary/Keyword: 관심사 추출

Search Result 108, Processing Time 0.059 seconds

Issue Word Extraction Using Chi-square Statistics (카이제곱 통계량을 이용한 이슈 단어 추출)

  • Shin, Junsoo
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.225-227
    • /
    • 2014
  • 최근 온라인 뉴스는 대중의 관심사 및 트렌드에 따라서 다양한 종류의 기사들이 작성된다. 이러한 관심사 및 트렌드는 시간의 흐름에 따라 계속 변한다. 본 논문에서는 온라인 뉴스의 기사 제목을 이용하여 시간에 따라 변하는 관심사 및 트렌드와 관련된 단어를 추출하는 방법을 제안한다. 특정 기간 별 출현하는 뉴스들을 하나의 카테고리로 가정하고 자질 선택 방법에서 널리 사용되는 카이제곱 통계량을 이용하여 각 카테고리의 주요 단어를 추출한다. 실험 결과 특정 기간 별 관심사 및 트렌드와 관련된 단어들이 출현하는 것을 확인하였다.

  • PDF

On Specification of Crosscutting Concerns in AOSD (관점 지향 개발 방법론에서 횡단 관심사 구현 명세 기법)

  • Park, Oak-Cha;Park, Jong-Kock;Choi, Yoo-Sun;Yoo, Cheol-Jung;Jang, Ok-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.453-457
    • /
    • 2006
  • 프로그램 구현 방법에 편중되어온 기존의 AOSD 방법론이 최근에는 전체 개발 라이프사이클에서 초기 요구사항의 중요성이 강조되면서 요구사항 모델링, 분석, 설계분야에서 많은 연구가 진행되고 있다. 하지만, 요구사항 분석에서 추출된 관심사를 설계하여 구현 단계로 변환하는 과정에서 아직까지 상세화된 프로세스가 부족하다. 본 논문에서는 횡단 관심사 구현 명세 기법을 제시한다. 이 기법은 추출된 관심사를 구현 코드로 변환하기 위한 4단계의 프로세스로 구성되어 있다. 상세화된 명세 기법과 가이드라인은 AOSD에서 해결하기 어려운 설계에서 구현간의 갭을 줄여줌으로써 이해 및 유지보수성을 높여준다.

  • PDF

Personalized Contents using the Tags of the Social Bookmarking Service (소셜 북마킹 서비스의 태그를 이용한 개인화 콘텐츠)

  • Han, Ju-Hyeun;Jung, Moon-Ryul
    • 한국HCI학회:학술대회논문집
    • /
    • 2009.02a
    • /
    • pp.267-272
    • /
    • 2009
  • 웹 2.0 이라 불리는 현 웹의 패러다임은 개방, 공유, 참여로 압축하여 말할 수 있다. 이 속에서는 사용자의 참여와 공유로 콘텐츠가 생산 또는 재생산된다. 이러한 콘텐츠는 사용자의 관심을 반영하기 때문에 사용자가 어떠한 콘텐츠를 만들어 냈는지, 수집했는지 등을 분석하면 사용자의 관심 범주를 추출할 수 있다. 본 논문에서는 사용자가 소셜 북마킹 서비스를 이용하며 생성한 태그를 바탕으로 사용자의 관심 범주를 추출하여 이를 통해 개인화 콘텐츠 제공 서비스를 제안한다. 우선, 웹 서비스에서 제공하는 피드를 이용하여 사용자가 생성한 태그 중 가장 많이 쓰인 10개의 태그와 그것들과 관련 있는 태그들만 모아서 관심 범주을 추출하기 위한 태그 집합을 구성한다. 구성된 태그 집합을 바탕으로 피어슨 상관 계수를 통해 태그 간 동시 사용률을 조사한다. 이후 사용자 흥미에 부합하는 콘텐츠를 검색하기 위해 조사된 동시 사용률을 바탕으로 검색 키워드 그룹을 추출한다. 이렇게 만들어진 키워드 그룹들은 사용자의 평소 관심사와 관련된 콘텐츠를 검색하는데 사용되며, 이를 통해 사용자의 관심 있는 내용의 콘텐츠를 사용자의 특별한 검색 절차 없이 제공받는다. 이러한 방식을 통해 사용자가 원하는 정보를 입력하는 절차 없이도 웹에 축적된 사용자의 정보를 사용하여 자동으로 개인화된 콘텐츠를 제공할 수 있을 것으로 기대 된다.

  • PDF

A Study on Graph-based Topic Extraction from Microblogs (마이크로블로그를 통한 그래프 기반의 토픽 추출에 관한 연구)

  • Choi, Don-Jung;Lee, Sung-Woo;Kim, Jae-Kwang;Lee, Jee-Hyong
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.21 no.5
    • /
    • pp.564-568
    • /
    • 2011
  • Microblogs became popular information delivery ways due to the spread of smart phones. They have the characteristic of reflecting the interests of users more quickly than other medium. Particularly, in case of the subject which attracts many users, microblogs can supply rich information originated from various information sources. Nevertheless, it has been considered as a hard problem to obtain useful information from microblogs because too much noises are in them. So far, various methods are proposed to extract and track some subjects from particular documents, yet these methods do not work effectively in case of microblogs which consist of short phrases. In this paper, we propose a graph-based topic extraction and partitioning method to understand interests of users about a certain keyword. The proposed method contains the process of generating a keyword graph using the co-occurrences of terms in the microblogs, and the process of splitting the graph by using a network partitioning method. When we applied the proposed method on some keywords. our method shows good performance for finding a topic about the keyword and partitioning the topic into sub-topics.

Text Extraction and Word Grouping using 3D Area-Weighted Graph in Document (문서 이미지에서 문자 추출과 3차원 면적-가중치 그래프를 이용한 단어 그룹핑)

  • 옥세영;박환철;조환규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.556-558
    • /
    • 1998
  • 이미지 분석이나 데이터 베이스 인덱싱 또는 종이 문서를 전자 문서화 하는 문제는컴퓨터 비젼 응용분야에서 중요 관심사가 되어왔다. 이러한 문제들을 처리하기 위해서는 제일 먼저 이미지와 문자가 혼합되어 있는 문서에서 자동으로 문자와 이미지들을 분리해 내는 과정이 필수 적이다. 본 논문에서는 신문이나 광고등에서 볼 수 있는 이미지, 음각 문자와 양각 문자가 섞여 있는 문서에서 문자만을 추출하는 알고리즘을 제안한다. 이 알고리즘은 Run-length code를 이용하여 문자나 이미지의 경계선(bound) 모양의 특징을 추출하여 음각 문자와 이미지, 양각 문자를 구분한다. 그리고 추출된 글자들을 3차원 공간상에 매핑한 후 3차원 면적 가중치 그래프를 이용하여 관련된 단어들로 묶어주는 3차원 그룹핑 알고리즘을 제시한다. 실험결과로는 추출된 문자와 그룹핑된 결과를 보여준다.

  • PDF

Efficient Mining of User Behavior patterns by classification of age based on location information (위치에 따른 연령대별 유용한 행동패턴 추출 기법)

  • Kim, HyeRan;Lee, SeungCheol;Kim, UngMo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.250-253
    • /
    • 2007
  • 통신기술의 발달로 무선단말기의 보급이 급증하고 무선 네트워크 사용이 일반화됨으로써, 최근 유비쿼터스 컴퓨팅 기술이 중요한 이슈가 되고 있다. 유비쿼터스 컴퓨팅은 시간과 장소의 한계를 넘어 사용자가 하고자 하는 일을 컴퓨팅 환경이 상황을 인지하여 돕는 것을 가능하게 한다. 상황인지를 위해 순차패턴과 시간 연관규칙 탐사를 이용하여 사용자의 행동패턴을 추출하는 연구가 활발히 진행되고 있다. 이러한 연구를 통한 행동패턴은 사용자의 특성을 간과하게 되며, 각 사용자에게 더욱 유용한 서비스를 제공하기 위해서는 사용자를 분류하는 것이 필요하다. 그러나 기존의 연구는 단지 통계적인 사용자의 빈발 행동패턴만을 추출하여 각 사용자의 관심사와는 무관한 서비스 제공이 이루어질 수 있다. 성별, 나이, 직업 등의 개인정보와 위치를 고려하여 사용자에게 더욱 더 효율적이고 유용한 서비스를 제공할 수 있도록 행동패턴을 유형별로 분류할 필요가 있다. 본 논문에서는 각 위치에 따른 사용자의 연령대별 유용한 행동패턴을 추출하여 정확한 서비스를 제공할 수 있는 마이닝 기법을 제안한다.

  • PDF

Query Related Issue Detection using Related Term Extraction (연관 어휘 추출을 통한 질의어 관련 이슈 탐지)

  • Kim, Je-Sang;Kim, Dong-Sung;Jo, Hyo-Geun;Lee, Hyun-Ah
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.133-136
    • /
    • 2013
  • 근래 트위터와 페이스북 등의 SNS(Social Network Service)에서 일반 대중의 관심사나 트렌드 등의 이슈를 탐지하는 많은 연구가 이루어지고 있다. 본 논문에서는 검색어에 대한 연관 어휘 추출을 통해 검색어에 연관된 이슈나 화제를 트위터에서 추출하기 위한 방법을 제안한다. 본 논문에서는 연관성이 높은 단어는 서로 가깝게 발생할 것으로 기대하고, 단어 간 거리가 가까울수록, 공기빈도가 높을수록 커지는 단어연관도 계산법을 제안한다. 연관도 값이 임계치를 넘는 어휘를 연관 어휘로 보고 네트워크의 형태로 관련 이슈를 제시한다.

  • PDF

A Study on the Hierarchical Structure of Color Sensibility (색채 감성의 위계 구조에 대한 탐구)

  • Park, Chang-Ho
    • Korean Journal of Cognitive Science
    • /
    • v.19 no.1
    • /
    • pp.41-56
    • /
    • 2008
  • Previous studies, while investigating factors of sensibility, had rarely considered its internal structure. This study hypothesized that sensibility had sensational aspects and emotional aspects and the former corresponded to objective adjectives, describing attributes of objects, and the latter to subjective adjectives, describing psychology of experiencers. Forty-three objective adjectives and 21 subjective adjectives describing color sensibility were selected both by a linguistic criterion and an empirical evaluation. Factor analysis on semantic differential responses to these two groups of adjectives resulted in 5 sensational factors and 3 emotional factors of color sensibility respectively. Hierarchical structure was derived by regressing emotional factor scores on sensational factor scores. In consequence, emotional aspects were interpreted by different combinations of sensational factors. Limitations and significance of this study were discussed.

  • PDF

Landslide Danger Mapping using Spatial Information Technology (공간정보기술을 이용한 산사태 위험도 매핑)

  • Jo, Myung-Hee;Jo, Yun-Won;Kim, Sung-Jae
    • 한국방재학회:학술대회논문집
    • /
    • 2008.02a
    • /
    • pp.353-356
    • /
    • 2008
  • 최근 대규모 산림재해로 인한 산림환경 훼손 및 산림 농가의 피해는 물론 산림생태계에도 나쁜 영향을 미치고 있으며 이는 사회적으로 매우 민감한 환경문제로서 국민의 주요 관심사가 되고 있다. 본 연구에서는 울진군 전체를 대상으로 GIS 및 RS 기법을 이용하여 다양한 산사태 관련 인자들을 추출 하여 이를 기반으로 GIS 중첩 및 가중치 분석을 통하여 울진군의 산사태 발생 가능 위험지역의 분포도를 작성하고자 한다.

  • PDF

Ananlyzing Customer Management Data by Datamining (Focused on Apartment Customer Classification) (데이터마이닝을 통한 고객관리데이터의 분석 (아파트고객 세분화를 중심으로))

  • Baek, Shin Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.69-72
    • /
    • 2004
  • 기업간의 경쟁이 심화되고 정보의 중요성에 대한 인식이 확대되어 가는 상황에서 다량의 데이터로부터 가치 있는 데이터를 추출하는 CRM 데이터 마이닝은 중대한 관심사가 아닐 수 없다. 본 연구는 데이터마이닝의 여러 활용 분야 중 고객세분화를 위해 최근 많이 사용되고 있는 데이터마이닝 기법인 로지스틱 회귀분석, 의사결정나무, 신경망 알고리즘 기법들을 비교하며, 이를 실제 아파트 고객의 데이터를 이용하여 검증하고자 한다. 따라서, 아파트 고객 세분화를 위한 데이터마이닝 수행시 기법 선택의 기준과 비교 평가의 기준을 제시하는 데 연구목적 있다.

  • PDF