• 제목/요약/키워드: 확률데이터연관

검색결과 74건 처리시간 0.032초

변경 유형의 유사도 및 커밋 시간을 이용한 파일 변경 결합도 (A Technique to Detect Change-Coupled Files Using the Similarity of Change Types and Commit Time)

  • 김정일;이은주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권2호
    • /
    • pp.65-72
    • /
    • 2014
  • 변경 결합도는 두 요소들 사이의 향후 변경 연관성을 알려준다. 만약, 소스 파일들이 자주 함께 변경된다면, 그 소스 파일들의 변경 결합도는 높다고 볼 수 있으며, 나중에 다시 함께 변경될 확률이 높다. 일반적으로 소스 파일들 사이의 변경 결합도는 공통 변경 횟수에 기반하여 정의되었다. 그런데 연관성이 낮은 변경들이 일괄적으로 함께 커밋되는 경우, 즉 뒤얽힌 변경(tangled change)과 같은 경우들이 빈번히 발생한다. 따라서 함께 변경된 횟수만으로 소스 파일의 변경 결합도를 결정하는 것은 한계가 있다. 본 논문에서는 기존의 방법을 보완하기 위해, 소스 파일의 변경 시간뿐 아니라 소스 코드 변경 유형의 유사성을 함께 고려하는 것을 제안하였다. 이를 위하여, 우선 추출된 변경 유형 정보를 이용하여 변경 유형 빈도 벡터를 정의하고, 다음에 코사인 유사도 측정을 통해서 각 소스 파일 버전에서 적용된 코드 변경 유사성을 계산한다. 이후 Eclipse 프로젝트인 JDT와 CDT에 대한 사례 연구를 통해 제안된 방법의 효용성을 보였다.

두 형태의 데이터를 이용하여 시스템의 신뢰도를 추정하는 방법 (Estimation of Reliability of a System Based on Two Typed Data)

  • 심규박;임재걸
    • 한국멀티미디어학회논문지
    • /
    • 제16권3호
    • /
    • pp.336-341
    • /
    • 2013
  • 복잡한 시스템에서 취득할 수 있는 여러 가지 형태의 자료에 대한 신뢰도 분석은 각종 시스템에 대한 신뢰도 보증을 위해 필요한 절차이다. 시스템의 신뢰도 평가는 고장함수의 추정에서 시작한다. 시스템은 한 개의 부품만으로 이루어 진 경우도 있지만 여러 개의 부품이 서로 연관관계를 맺고 있는 경우가 대부분이어서 취득된 자료의 형태도 다양하다. 본 논문에서는 고장 사건의 발생확률이 낮은 경우, 서로 다른 두 개 이상의 부품이나 시스템에서 취득한 자료의 형태를 고려하여 이에 대한 고장함수를 추정하고 신뢰도를 계산하는 방법을 제안하였다. 두 개 이상의 부품이 병렬 및 혼합방식으로 연결된 복잡한 시스템에 대한 고장함수의 추정도 자료의 형태를 고려하면 제안된 방법의 확장으로 가능하리라 생각한다.

한국 청소년에서 치통과 자살 생각의 연관성 (Association of Suicidal Ideation With Dental Pain among Korean Adolescents)

  • 백주원;이귀행;양찬모
    • 정신신체의학
    • /
    • 제30권1호
    • /
    • pp.46-53
    • /
    • 2022
  • 연구목적 이 연구는 전국 온라인 설문 조사인 2018 청소년 건강 행태 조사의 데이터를 분석하여 청소년의 치통과 자살 생각의 연관성을 평가하고자 하였다. 방 법 국내 중·고등학생 62,823명을 대상으로 하였으며, 치통과 자살생각을 포함한 건강 행태에 대한 온라인 자가 보고형 설문 조사에 60,040명이 참여하였다. 다중 로지스틱 회귀 분석을 시행하여 치통과 자살 생각 사이의 관계를 분석하였다. 결 과 자살 생각을 보고한 한국 청소년의 비율은 13.3%이었고, 치통을 경험한 청소년의 비율은 23.4 %였다. 치통을 경험하지 않은 청소년과 비교할 때, 치통을 경험한 청소년이 자살 생각을 경험할 확률이 높았다(OR=1.94, p<0.001). 다중 로지스틱 회귀 모델에서 치통과 자살 생각(AOR=1.24, p<0.001) 의 연관성은 통계적으로 유의하였다. 결 론 한국 청소년의 치통은 사회 인구 통계학적 요인 및 기타 신체적 정신적 건강 요인을 고려해도 자살 생각 증가와 연관되었다. 우울감을 동반한 치통환자의 진료에 있어 자살 위험성의 선별검사가 고려되어야 한다.

카테고리 연관 규칙 마이닝을 활용한 추천 정확도 향상 기법 (A Study on the Improvement of Recommendation Accuracy by Using Category Association Rule Mining)

  • 이동원
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.27-42
    • /
    • 2020
  • 인터넷이라는 가상 공간을 활용함으로써 물리적 공간의 제약을 갖는 오프라인 쇼핑의 한계를 넘어선 온라인 쇼핑은 다양한 기호를 가진 소비자를 만족시킬 수 있는 수많은 상품을 진열할 수 있게 되었다. 그러나, 이는 역설적으로 소비자가 구매의사결정 과정에서 너무 많은 대안을 비교 평가해야 하는 어려움을 겪게 함으로써 오히려 상품 선택을 방해하는 원인이 되기도 한다. 이런 부작용을 해소하기 위한 노력으로서, 연관 상품 추천은 수많은 상품을 다루는 온라인 상거래에서 소비자의 구매의사결정 과정 중 정보탐색 및 대안평가에 소요되는 시간과 노력을 줄여주고 이탈을 방지하며 판매자의 매출 증대에 기여할 수 있다. 연관 상품 추천에 사용되는 연관 규칙 마이닝 기법은 통계적 방법을 통해 주문과 같은 거래 데이터로부터 서로 연관성 높은 상품을 효과적으로 발견할 수 있다. 하지만, 이 기법은 거래 건수를 기반으로 하므로, 잠재적으로 판매 가능성이 높을지라도 충분한 거래 건수가 확보되지 못한 상품은 추천 목록에서 누락될 수 있다. 이렇게 추천 시 제외된 상품은 소비자에게 구매될 수 있는 충분한 기회를 확보하지 못할 수 있으며, 또 다시 다른 상품에 비해 상대적으로 낮은 추천 기회를 얻는 악순환을 겪을 수도 있다. 본 연구는 구매의사결정이 결국 상품이 지닌 속성에 대한 사용자의 평가를 기반으로 한다는 점에 착안하여, 추천 시 상품의 속성을 반영하면 소비자가 특정 상품을 선택할 확률을 좀더 정확하게 예측할 수 있다는 점을 추천 시스템에 반영하기 위한 목적으로 수행되었다. 즉, 어떤 상품 페이지를 방문한 소비자는 그 상품이 지닌 속성들에 어느 정도 관심을 보인 것이며 추천 시스템은 이런 속성들을 기반으로 연관성을 지닌 상품을 더 정교하게 찾을 수 있다는 것이다. 상품의 주요 속성의 하나로서, 카테고리는 두 상품 간에 아직 드러나지 않은 잠재적인 연관성을 찾기에 적합한 대상이 될 수 있다고 판단하였다. 본 연구는 연관 상품 추천에 상품 간의 연관성뿐만 아니라 카테고리 간의 연관성을 추가로 반영함으로써 추천의 정확도를 높일 수 있는 예측모형을 개발하였고, 온라인 쇼핑몰로부터 수집된 주문 데이터를 활용하여 이루어진 실험은 기존 모형에 비해 추천 성능이 개선됨을 보였다. 실무적인 관점에서 볼 때, 본 연구는 소비자의 구매 만족도를 향상시키고 판매자의 매출을 증가시키는 데에 기여할 수 있을 것으로 기대된다.

사회연결망 분석을 활용한 연관규칙 확장기법 (Extension Method of Association Rules Using Social Network Analysis)

  • 이동원
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.111-126
    • /
    • 2017
  • 연관 상품 추천은 수많은 상품을 다루는 온라인 상거래에서 소비자의 상품 탐색 시간을 줄여주며 판매자의 매출 증대에 크게 기여한다. 이는 주문과 같은 거래의 빈도를 기반으로 생성되므로, 통계적으로 판매 확률이 높은 상품을 효과적으로 선별할 수 있다. 하지만, 판매 가능성이 높은 경우라도 신상품처럼 판매 초기에 거래 건수가 충분하지 않은 상품은 추천에서 누락될 수 있다. 연관 추천에서 누락된 상품은 이로 인해 노출 기회를 잃게 되고, 이는 거래 건수 감소로 이어져, 또 다시 추천 기회를 잃는 악순환을 겪을 수도 한다. 따라서, 충분한 거래 건수가 쌓이기 전까지 초기 매출은 일정 기간 동안 정체되는 현상을 보이는데, 의류 등과 같이 유행에 민감하거나 계절 변화에 영향을 많이 받는 상품은 이로 인해 매출에 큰 타격을 입을 수도 있다. 본 연구는 이와 같이 거래 초기의 낮은 거래 빈도로 인해 잘 드러나지 않는 상품 간의 잠재적인 연관성을 찾아 추천 기회를 확보할 수 있도록 연관 규칙을 확장하기 위한 목적으로 수행되었다. 두 상품 간에 직접적인 연관성이 나타나지 않더라도 다른 상품을 매개로 두 상품 간의 잠재적 연관성을 예측할 수 있을 것이며, 이런 연관성은 주문에서 나타나는 상품 간 상호작용으로 표현될 수 있으므로, 사회연결망 분석을 활용한 분석을 시도하였다. 사회연결망 분석기법을 통해 각 상품의 속성과 두 상품 간 경로의 특성을 추출하고 회귀분석을 실시하여, 두 상품 간 경로의 최단 거리 및 경로의 개수, 각 상품이 얼마나 많은 상품과 연관성을 갖는지, 두 상품의 분류 카테고리가 어느 정도 일치하는지가 두 상품 간의 잠재적 연관성에 미친다는 것을 확인하였다. 모형의 성능을 평가하기 위해, 일정 기간의 주문 데이터로부터 연결망을 구성하고, 이후 10일 간 생성될 상품 간 연관성을 예측하는 실험을 진행하였다. 실험 결과는 모형을 적용하지 않는 경우보다 제안 모형을 활용할 때 훨씬 많은 연관성을 찾을 수 있음을 보여준다.

지역단위 화재 위험도 저감의 고양시 경제적 파급효과 분석 (Analyzing The Economic Impact of The Fire Risk Reduction at Regional Level in Goyang City)

  • 손민수;조동인;박창근;고현아;정승현
    • 한국산학기술학회논문지
    • /
    • 제22권2호
    • /
    • pp.685-693
    • /
    • 2021
  • 본 연구에서는 '전국GIS건물통합정보표준데이터'의 건축물 공간정보 자료를 활용하여 고양시 지역단위의 화재발생 위험도를 산출하고 화재발생 확률에 따른 산업별 경제적 피해를 분석하였다. 분석의 편의상 공간적 범위는 경기도 고양시로 제한하였고, 지역 단위별로 동일한 화재위험 감소율을 적용하였다. 먼저, 지역별 화재 위험도를 평가하기 위해 건축물 공간정보 자료를 이용하여, DB 구축, 지표 설정, 공간 분석의 과정을 거쳐 표준화된 화재 발생 가능성을 도출하였다. 다음으로 한국은행 산업 연관표 대분류 30개 산업구분과 고양시 사업체조사 20개 산업구분과 매칭하여 고양시 산업연관표를 생성하였다. 최종적으로 화재 위험에 따른 고양시의 산업별 경제적 피해 산출은 고양시 산업연관표와 화재발생 가능성을 결합하여 산출하였다. 화재로 인한 6개월 생산 불가와 영업 손실이라는 기본 시나리오를 설정하여 공급모형을 기반으로 분석하였다. 분석결과, 일산동구, 일산서구, 덕양구의 순으로 경제적 피해가 큰 것으로 나타났고, 산업별로는 '전기, 가스, 증기 및 수도사업'이 가장 큰 손실이 발생하는 것으로 나타났다. 공간과 산업적인 측면에서 일산서구의 '전기, 가스, 증기 및 수도사업' 손실이 전체의 약 60% 비중을 차지하였다.

환경변화에 강인한 단안카메라 레이더 적외선거리계 센서 융합 기반 교통정보 수집 시스템 개발 (Development of A Multi-sensor Fusion-based Traffic Information Acquisition System with Robust to Environmental Changes using Mono Camera, Radar and Infrared Range Finder)

  • 변기훈;김세진;권장우
    • 한국ITS학회 논문지
    • /
    • 제16권2호
    • /
    • pp.36-54
    • /
    • 2017
  • 본 논문은 환경변화에 강인한 센서 융합 교통정보 수집 시스템을 제안한다. 제안된 시스템은 각 센서의 특징을 융합하여 영상 검지기에 비해 환경에 강인하고, 주 야간 등 시간에 영향을 받지 않으며 루프 검지기에 비해 유지보수에 드는 비용이 적다. 이는 레이더의 물체 추적 기법과 영상검지기의 차량분류, 적외선거리계의 신뢰성 높은 객체검지 정보를 융합하고 각 센서의 문제점을 보완하여 개선을 이루었다. 구현된 시스템을 보행자의 통행이 가능한 도로에서 주 야간 5일에 걸쳐 6시간 동안 실험한 결과 88.7%의 분류정확도와 95.5%의 차량 검지율을 나타내었다. 본 시스템의 파라미터 최적화 작업을 실험환경에 따라 적응되는 방식으로 보완한다면 교통정보 수집 체계의 고도화에 기여할 수 있을 것으로 기대된다.

위상배열 레이다 검출 및 추적 매개변수의 최적 스케쥴링 (Optimal Scheduling of Detection and Tracking Parameters in Phased Array Radars)

  • 정영헌;김현수;홍순목
    • 전자공학회논문지S
    • /
    • 제36S권7호
    • /
    • pp.50-61
    • /
    • 1999
  • 이 논문에서는 클러터 환경에서 항적 유지에 필요한 레이다 에너지를 최소하하기 위한 위상배열 레이디의 표적 검출 및 추적 매개변수 제어방법을 제시한다. 이를 위해 위상배열 레이다의 표적 탐색과정에서 비롯되는 표적 검출과정을 수학적 모델로 전개한다. 수학적 전개과정을 통해 표적 검출과정에서 발생하는 클리터나 측정 잡음에 의한 거짓 정보(false alarm)등과 같은 실제 표적이외의 측정을 고려한다. 추적필터 역시 클리터의 영향을 고려하기 위해 확률적 데이터 연관(Probabilistic Data Association: PDA)필터의 수정된 리카티 방정식의 근사식을 이용한다. 표적 탐색과정과 추적모델을 바탕으로, 최적의 매개변수 계획(scheduling)문제를 비선형 최적제어문제로 수식화하며, 최적제어문제의 해를 얻기 위해 제한조건을 가진 비선형 최적화 문제를 푼다.

  • PDF

자료지향형 모형을 이용한 도시유역에서의 월류 위험지역 예측 (Prediction of Overflow Hazard Area in Urban Watershed by Applying Data-Driven Model)

  • 김현일;금호준;이재영;김범진;한건연
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.6-6
    • /
    • 2018
  • 최근 집중 호우로 인한 내수침수 피해가 도시화와 기후변화로 늘어나고 있다. 내수침수 피해로 인한 복구비용과 시간이 증가하고 있으며 향후에는 이보다 더 크게 늘어날 것으로 예상된다. 이러한 문제를 해결하기 위하여 충분한 선행시간을 가지고 내수 침수 구역을 제시할 수 있어야 한다. 기존의 물리적 모델은 정확하고 정교한 결과를 제공하지만, 시뮬레이션을 준비하고 마치는 데에 시간이 많이 소요된다. 그 이유로서는 강우량, 지형적 특성, 배수관망 시스템, 수문학적 매개변수 등의 다양한 데이터도 필요하기 때문이다. 이는 도시유역에 대한 내수침수의 실시간 예측이 어렵게 되었으며, 충분한 선행시간을 확보하지 못하는 원인이 되었다. 본 연구에서는 이 문제에 대한 해결책으로 결정론적 방법과 확률론적 방법을 자료지향형 모형으로 결합하여 해결책을 제시하고자 하며, 특정 강우 조건하에 도시유역에서의 내수침수에 영향을 미치는 맨홀에 대한 정보를 제공하고자 한다. 위와 같은 과정을 수행하기 위하여 입력자료 조합에 대한 비선형 분석을 실시하였으며, 그 결과로 특정 강우 조건에 대하여 각 맨홀에 대한 누적월류량을 예측할 수 있는 비선형 인공신경망을 구축할 수 있었다. 본 연구에서 제시된 방법론은 국내의 강남 배수분구에 대하여 적용이 되었으며, 내수침수 예측결과와 2차원 해석결과를 비교하고자 하였다. 본 연구에서는 위 과정을 통하여 1차원 도시유출해석을 위한 입력 자료를 준비하는 시간을 절약하고, 다양한 강우 조건과 내수침수지도 사이의 연관성을 학습하는 예측 모형을 이용하여 도시유역의 내수침수에 대한 충분한 선행시간을 확보하고자 한다. 결론적으로, 이 연구의 결과는 도시유역에 대한 비구조적 대책 수립에 도움을 줄 것으로 확인이 되며 도시 유역 내에 맨홀 위치들을 고려한 위험지구를 파악하는 데에 유용할 것으로 판단된다.

  • PDF

상수도 관망 최적설계에 대한 유전 알고리즘과 하모니써치 알고리즘의 적용 및 비교 (Application and Comparison of Genetic Algorithm and Harmony Search Algorithm for Optimal Cost Design of Water Distribution System)

  • 홍아리;이호민;최영환;최지호;김중훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.521-521
    • /
    • 2016
  • 상수도 관망은 수원에서 수요절점까지 물을 안정적으로 공급하는 것을 목표로 한다. 상수도 관망의 최적설계는 수리학적 제한조건 (절점의 수압, 관로의 유속)을 만족하는 범위에서 비용을 최소화하는 설계안을 얻는 것으로 Savic and Walters (1997)는 유전 알고리즘 (Genetic Algorithms, Holland 1975)을 적용한 상수도 관망 설계 프로그램인 GANET를 제안하였고, Maier et al. (1996)은 개미군집알고리즘 (Ant Colony Optimization Algorithm, Dorigo et al. 1996)을 상수도 관망 최적설계에 적용한 후 그 결과가 유전 알고리즘에 비해 우수함을 증명하는 등 상수도 관망 최적설계에 관한 연구가 활발히 진행되어 오고 있다. 유전알고리즘은 선택, 교차, 돌연변이의 반복계산 과정을 통하여 최적해를 찾는 최적화 기법이다. 이 과정에서 결정변수는 유전자 (Gene)의 집합으로 표현되며, 염색체 (Chromosome) 내에서 근접한 유전 인자들은 일종의 Building Block을 형성하게 된다. Building Block은 좋은 해를 갖는 유전 인자를 높은 확률로 보관하여 지역해에 빠질 가능성을 줄이는 반면, 유전형 (Genotype)이 표현형 (Phenotype)을 충분히 모방하여 표현하지 못한 경우 오히려 최적해의 탐색을 방해할 수 있다는 한계점을 갖는다. 유전 알고리즘을 상수도 관망 최적설계에 적용하였을 때에도 이 한계점은 여실히 드러난다. 관로의 관경을 결정변수로 설정한 후 유전형으로 표현하였을 때, 관망도 상에서 근접하지 않은 두 관로가 염색체 내에서 연속으로 나열된다면 두 관로 간의 연관성이 실제보다 크게 고려되기 때문이다. 한편, 하모니써치 (Harmony Search, Geem et al. 2001) 알고리즘은 즉흥 연주 (Improvisation)를 통해 최상의 화음을 만들어내는 현상으로부터 착안하여 만들어진 최적화기법으로 연산 기법은 무작위선택, 기억회상, 피치조정 등으로 구성되어 있으며, 결정변수에 해당하는 연주자가 독립적으로 행동하며 해를 탐색한다는 점에서 유전알고리즘과 큰 차이를 갖는다. 본 연구에서는 유전알고리즘의 Building Block에 의해 발생하는 오류를 개선하고자, 상수도 관망 최적설계 연구에 많이 사용되는 Hanoi 관망 (Fujiwara and Khang 1990) 관로의 정렬 순서를 여러 가지 기준으로 설정하여 관망데이터를 구축한 후 하모니써치와 유전 알고리즘을 적용하여 최적화를 수행하였고 그 결과를 비교하였다. 그 결과 유전 알고리즘과 달리 하모니써치 알고리즘의 경우, 관로의 나열 순서와 상관없이 우수한 최적해 탐색 결과를 보이는 것을 확인할 수 있었다.

  • PDF