• 제목/요약/키워드: 커뮤니티 클러스터링

검색결과 12건 처리시간 0.02초

커뮤니티 검출기법을 이용한 소프트웨어 아키텍쳐 모듈 뷰 복원 (Recovering Module View of Software Architecture using Community Detection Algorithm)

  • 김정민;이찬근
    • 소프트웨어공학소사이어티 논문지
    • /
    • 제25권4호
    • /
    • pp.69-74
    • /
    • 2012
  • 본 논문은 소프트웨어 클러스터링 기법과 커뮤니티 검출 기법의 비교를 통하여 아키텍쳐 모듈 복원 프로세스에 커뮤니티 검출 알고리즘의 적용가능성을 제시한다. 또한, 대표적인 클러스터링 알고리즘과 커뮤니티 검출 알고리즘의 값과 나눠진 모듈간의 상관관계와 차이점을 분석한다. 이를 통하여 커뮤니티 검출 알고리즘이 소프트웨어 아키텍쳐 모듈 뷰 복원에 활용되어질 수 있다는 몇 가지 근거를 제시하였고, 기존의 클러스터링 결과와 커뮤니티 알고리즘의 결과치를 비교함으로써, 서로의 결과 데이터가 어떠한 연관성을 가지는지 제시하였다.

  • PDF

커뮤니티 제한 검색을 위한 웹 크롤링 및 PageRank 계산 (Web Crawling and PageRank Calculation for Community-Limited Search)

  • 김계정;김민수;김이른;황규영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.1-3
    • /
    • 2005
  • 최근 웹 검색 분야에서는 검색 질을 높이기 위한 기법들이 많이 연구되어 왔으며, 대표적인 연구로는 제한 검색, focused crawling, 웹 클러스터링 등이 있다. 그러나 제한 검색은 검색 범위를 의미적으로 관련된 사이트들로 제한할 수 없으며, focused crawling은 질의 시점에 클러스터링하기 때문에 질의 처리 시간이 오래 걸리고, 웹 클러스터링은 많은 웹 페이지들을 대상으로 클러스터링하기 위한 오버헤드가 크다. 본 논문에서는 검색 범위를 특정 커뮤니티로 제한하여 검색 하는 커뮤니티 제한 검색과 커뮤니티를 구하는 방법으로 cluster crawler를 제안하여 이러한 문제점을 해결한다. 또한, 커뮤니티를 이용하여 PageRank를 2단계로 계산하는 방법을 제안한다. 제안된 방법은 첫 번째 과정에서 커뮤니티 단위로 지역적으로 PageRank를 계산한 후, 두 번째 과정에서 이를 바탕으로 전역적으로 PageRank론 계산한다. 제안된 방법은 Wang에 의해 제안된 방법에 비해 PageRank 근사치의 오차를 $59\%$ 정도로 줄일 수 있다.

  • PDF

Character-net에서 배역비중의 분류와 커뮤니티 클러스터링 (Role Grades Classification and Community Clustering at Character-net)

  • 박승보;조근식
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권11호
    • /
    • pp.169-178
    • /
    • 2009
  • 동영상으로부터 원하는 정보를 검색하려는 다양한 연구들이 있어왔다. 하지만 기존의 연구들은 동영상의 스토리에 대한 고려 없이 특정한사물의 인식이나 사물간의 관계 정보만을 추출하여 검색에 이용하였다. 동영상에서 정확한 정보를 검색하기 위해서는 스토리의 주축이 되는 등장인물과 등장인물의 커뮤니티에 기반을 둔 연구가 반드시 필요하다. 따라서 본 논문은 등장인물에 기반을 둔 동영상 정보검색 방법을 기술한다. 등장인물들은 서로 대화를 통해 관계를 맺으며 스토리를 진행시킨다. 등장인물들 간의 관계는 배역의 비중을 분류하고 등장인물들이 이루는 커뮤니티를 구분하여 스토리에 형성되어 있는 관계를 분석할 수 있다. 이를 위해 본 논문에서 등장인물들의 관계를 묘사할 수 있는 Character-net을 제안하고 Character-net으로부터 등장인물들의 배역의 비중을 분류하고 등장인물들이 이루는 커뮤니티를 클러스터링 하는 방법에 대해 기술하고 실험을 통해 그 효용성을 입증한다.

군집분석 및 커뮤니티 분석 기법을 활용한 직무분석 사례 연구 (A Case Study on Job Analysis Utilizing Cluster Analysis and Community Analysis)

  • 조일현
    • 컴퓨터교육학회논문지
    • /
    • 제7권1호
    • /
    • pp.151-165
    • /
    • 2004
  • 본 연구의 목적은 군집 분석(Cluster Analysis) 및 사회연결망 분석 기법의 일종인 커뮤니티(Community)기법을 활용한 직무 분석 사례를 소개하고 그 결과를 음미해 보는데 있다. 이러한 작업을 통해 기존에 활용되던 직무분석 기법을 보완할 수 있는 계량적 방법론을 구안해냄으로써 궁극적으로 역량기반 커리큘럼의 개발 및 교수체제 설계 시 보다 분석적, 과학적인 준거 자료를 확보할 수 있을 것으로 기대하였다. 본 연구를 위한 직무분석 자료는 국내 대규모 제조업체인 S사에서 인터뷰 및 설문을 통해 수집되었다. 이 자료를 활용하여 실시된 군집 분석의 결과 직무들 간의 유사성에 대한 군집 분석 결과는 공식적인 직무 분류체계와 상당한 차이를 보이고 있음이 판명되었다. 이는 조사된 모든 측면에서 일관되게 확인되었으며, 각 측면별로 다소 상이한 클러스터링 패턴을 보이고 있었다. 군집 분석에 이어 직무들 간의 상호 연결관계 네트워크에 대한 사회연결망분석이 실시되었는데, 그 결과 명확한 중심-주변 구조와 함께 클러스터링 구조를 갖고 있음을 확인할 수 있는데, 이는 공식적인 직무분류체계에서 예상할 수 있는 것과도 다르고 또한 직무 간 내용적 유사성 구조와도 차이가 있는 독특한 패턴을 보이고 있음을 보이고 있는 결과였다. 이러한 연구 결과를 통해서 직무분석을 위한 새로운 분석 알고리즘으로서 군질 분석 및 커뮤니티 분석 기법의 유용성이 확인되었다. 나아가 향후 교육체계 설계를 위해 선행되는 직무분석 시 유의할 점들을 논의하였다.

  • PDF

소셜 미디어 참여에 관한 연구 동향과 쟁점의 변화: 네트워크 분석과 클러스터링 기법을 활용한 메타 분석을 중심으로 (Trends in Social Media Participation and Change in ssues with Meta Analysis Using Network Analysis and Clustering Technique)

  • 신현보;선형주;이준기
    • 한국빅데이터학회지
    • /
    • 제4권1호
    • /
    • pp.99-118
    • /
    • 2019
  • 본 연구는 소셜 미디어 참여 관련 연구 베타분석을 위해 네트워크 분석과 클러스터링 기법을 활용하였다. 주경로 분석 결과 37개의 주요 연구가 추출되었고 커뮤니티 관련 네트워크와 뉴 미디어 관련 네트워크 두 가지로 구분되었다. 연결망 분석과 클러스터링 결과 네가지 클러스터가 형성되었다. 본 연구는 학술 데이터를 활용해 연구 동향을 거시적으로 파악하며 그 방법론으로 네트워크 분석과 기계학습을 활용하였다는 학술적 의의를 가진다.

  • PDF

사이트 포트폴리오 구성을 위한 사용자 관점의 웹사이트 클러스터링 (User Perspective Website Clustering for Site Portfolio Construction)

  • 김민규;김남규
    • 인터넷정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.59-69
    • /
    • 2015
  • 많은 사용자들이 인터넷을 통해 정보검색, 쇼핑, 커뮤니티 참여 등의 일상 생활을 영위하고 있으며, 이들 인터넷 사용자들로부터 수익을 창출하기 위한 웹사이트들의 경쟁은 점점 치열해지고 있다. 각 사이트의 운영자 및 마케팅 담당자들은 경쟁 우위를 차지하기 위해 다양한 전략을 수립하고 있으며, 이 과정에서 타 사이트와의 제휴가 이루어지는 경우도 비일비재하다. 이는 타 사이트와의 제휴를 통해 타사의 고객 정보를 부분적으로 공유할 수 있을 뿐 아니라 포인트 공유, 상호 추천 등 보다 다양한 전략의 운용이 가능하기 때문이다. 제휴를 통해 긍정적인 성과를 거두기 위해서는 현재 자사의 고객은 아니지만 미래의 자사 고객이 될 수 있는 잠재 고객을 다수 확보하고 있는 타 사이트를 제휴 대상으로 선정하는 것이 매우 중요하다. 하지만 많은 사이트 중 이와 같이 자사에 도움이 되는 제휴 대상 사이트를 식별하는 것은 쉬운 일이 아니다. 따라서 본 논문에서는 방문 고객의 유사성 관점에서 사이트 클러스터링을 수행하고, 이에 근거하여 유사 고객군을 공유하고 있는 제휴 사이트 대상을 식별할 수 있는 방안을 제시한다. 또한 제안 방법론의 실무적용 가능성을 평가하기 위해, 웹사이트 150,295개에 대한 패널 5,000명의 실제 방문 기록 약 1억 4천만 건에 대해 실험을 수행하고 그 결과를 제시한다.

기술예측을 위한 특허 키워드 네트워크 분석 (Keyword Network Analysis for Technology Forecasting)

  • 최진호;김희수;임남규
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.227-240
    • /
    • 2011
  • 특허의 중요성이 커짐에 따라 특허분석의 중요성 또한 점점 커지고 있다. 특허분석은 네트워크 기반 방법과 키워드 기반 방법으로 나눠지는데 네트워크 기반은 특허 내부에 존재하는 세부 기술정보에 대한 분석이 불가능하다는 단점이 있고 키워드 기반은 기술정보간의 상호관계를 규명하지 못한다는 단점이 있다. 기존에 제시된 네트워크 기반 특허 분석과 키워드 기반 분석의 한계를 극복하기 위해서 두 방법을 혼합한 방법으로서 본 연구에서는 특허 키워드 네트워크 기반 분석 방법론을 제시하였다. 본 연구에서는 LED 분야의 특허들을 대상으로 텍스트 마이닝을 통해 중요한 기술정보를 추출한 다음, 키워드 네트워크를 구축하고, 이를 대상으로 커뮤니티 네트워크 분석을 수행하였다. 분석 결과는 다음과 같다. 첫째, 특허 키워드 네트워크는 매우 낮은 밀도와 매우 높은 클러스터링 지수를 나타내었다. 밀도가 높다는 것은 LED 분야내 특허 키워드 네트워크 내 노드(키워드)들이 산발적으로 연결되어 있다는 것을 의미하며, 클러스터링 지수가 높다는 것은 해당 키워드 네트워크 내 노드, 즉 키워드들이 각각의 커뮤니티로 매우 긴밀하게 연결되어 있음을 나타낸다. 둘째, 특허 키워드 네트워크도 다른 지식네트워크와 마찬가지로 명확한 멱함수 분포를 따른다는 사실을 알 수 있었다. 이는 기존에 활발히 연구, 활용되어 많은 연결고리를 갖고 있는 특허개념(키워드)수록 지속적으로 다른 연구자들에 의해 선택되고 이 키워드를 바탕으로 새로운 키워드들이 연결되어서 이들 키워드간의 조합으로 새로운 기술이 발명된다는 것이다. 셋째, 특허가 개발될 때 특정 분야에 유입된 키워드 중 새로운 링크가 생긴 키워드의 대부분이 기존에 연결되어 있던 커뮤니티 내의 키워드들과 결합되어 새로운 특허 개념을 구성한다는 사실을 발견하였다. 이러한 사실은 단기(4년) 장기(10년) 두 기간 모두 동일하게 나타났다. 나아가 본 연구에서 제시한 방법론을 통해 도출된 특허 키워드 조합 정보를 활용하면 미래에 어떤 개념들이 합쳐져서 새로운 특허 단위로 만들어 질지 가늠해볼 수 있고, 새로운 특허를 개발할 때 참고할 수 있는 유용한 정보로 활용할 수 있다.

소프트웨어 공수 예측의 정확성에 대한 이상치 제거의 영향 분석 (Analyzing Influence of Outlier Elimination on Accuracy of Software Effort Estimation)

  • 서영석;윤경아;배두환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권10호
    • /
    • pp.589-599
    • /
    • 2008
  • 정확한 소프트웨어 공수 예측은 소프트웨어 관련 여러 커뮤니티들에서 예전부터 항상 이슈가 되어 왔다. 소프트웨어 공수 예측의 정확도를 향상시키기 위해 지금까지 많은 연구들에서는 데이타 품질이 공수 예측에 중요한 요소들 중 하나임에도 불구하고 이것에 대한 고려 없이 공수 예측 기법들에만 초점을 맞추어 왔다. 본 연구에서는 소프웨어어 공수 예측 기법과 이상치 제거 기법들 사이의 영향 관계를 공수 예측 정확도의 관점에서 실험적으로 살펴본다. 두 개의 프로젝트 데이타들(ISBSG와 국내의 한 금융 조직으로부터 수집된 데이타)에 대해 일반적으로 많이 사용되는 세 가지 공수 예측 기법(최소제곱법, 신경망 네트워크, 그리고 베이지안 네트워크)과 두 가지 이상치 제거 기법(최소절사제곱법과 K-means 클러스터링)을 적용시켜 결과들을 서로 비교해 보고 이상치 제거 기법을 적용하지 않은 결과와도 비교해 본다.

쌍대위치 이벤트들의 국지적 공간적 연관성을 평가하기 위한 방법론적 연구: 주택거래의 벡터 공간적 자기상관 (An Alternative Method for Assessing Local Spatial Association Among Inter-paired Location Events: Vector Spatial Autocorrelation in Housing Transactions)

  • 이건학
    • 한국경제지리학회지
    • /
    • 제11권4호
    • /
    • pp.564-579
    • /
    • 2008
  • 물리적 또는 기능적으로 연결된 두 지점에서 발생하는 이벤트(쌍대위치 이벤트)들 사이의 국지적인 공간적 연관성을 평가하는 것은 쉽지 않다. 그것은 대개 그러한 형태의 지리적 현상들이 가지고 있는 프로세스 자체의 복잡한 특성 때문이지만, 실제 공간 상에서 재현될 때 매우 복잡하게 얽혀 시각적 패턴을 인식하기 어렵기 때문이기도 하다. 이 논문은 국지적 스케일에서 공간적으로 자기상관된 쌍대위치 이벤트(또는 벡터)들을 확인하기 위한 대안적 방법을 다루고 있다. 제시된 통계적 알고리즘은 (벡터들의) 시작 포인트들의 클러스터링을 평가하기 위한 단변량 포인트 패턴 분석과 시작 포인트들에 상응하는 벡터들의 유사성 측정을 혼합하여 개발되었다. 사례 분석은 미국 오하이오주 프랭클린 카운티의 지역 주택시장에서 2004년에서 2006년 동안 이루어진 주택거래 데이터를 사용하여 이루어졌다. 분석 결과, 국지적으로 특성화될 수 있는, 특히 지역 커뮤니티와 연관된 다양한 이동들을 보여주는 주택거래들을 확인할 수 있었다.

  • PDF

특허분석을 통한 빅 데이터의 시각화 기술 분석 (Analysis of Big Data Visualization Technology Based on Patent Analysis)

  • 노승민;최용수
    • 전자공학회논문지
    • /
    • 제51권7호
    • /
    • pp.149-154
    • /
    • 2014
  • 현대 데이터 컴퓨팅의 발전은 그래픽 기능의 향상을 이끌고 데이터 디스플레이를 위한 많은 가능성을 가지고 있다. 시각화는 방대한 양의 데이터에서 중요한 정보를 나타내줄 뿐만 아니라 복잡한 분석 방식에 효율적임이 증명되었다. 빅 데이터 분석과 발견은 컴퓨터 그래픽과 시각화 커뮤니티에서 새로운 연구 기회로 제시되고 있다. 본 논문에서는 주요 시장 국의 특허 분석을 통해 빅 데이터의 시각화 기술 개발 동향을 살펴보고자 한다. 특히, 2012년 11월을 기준으로 4개국에 출원 및 등록되어 있는 160건을 대상으로 분석을 진행하였다. 분석결과에 따르면 텍스트 클러스터링, 2D 시각화 분야의 기술개발이 중요하며 이에 대한 시급한 개발을 지향할 필요가 있다. 특히, 국내에서 다양한 스마트 디바이스의 증가와 소셜 네트워크 사용 증대로 인해 빅 데이터 입체 시각화 기술 개발이 매우 시급함을 알 수 있다.