• 제목/요약/키워드: Mean Vector

검색결과 696건 처리시간 0.024초

계층 클러스터 트리 기반 라만 스펙트럼 식별 고속 검색 알고리즘 (A Hierarchical Cluster Tree Based Fast Searching Algorithm for Raman Spectroscopic Identification)

  • 김순금;고대영;박준규;박아론;백성준
    • 한국산학기술학회논문지
    • /
    • 제20권3호
    • /
    • pp.562-569
    • /
    • 2019
  • 최근에 원 거리에서 폭발 물질의 감지를 위해 라만 분광 기기의 관심이 점차 증가하고 있다. 더불어 측정된 화학물질에 대한 라만 스펙트럼을 대용량 데이터베이스의 알려진 라만 스펙트라와 비교하여 식별할 수 있는 고속 검색 방법에 대한 요구도 커지고 있다. 지금까지 가장 간단하고 널리 사용되는 방법은 주어진 스펙트럼과 데이터베이스 스펙트라 사이의 유클리드 거리를 계산하고 비교하는 방법이다. 하지만 고차원 데이터의 속성으로 검색의 문제는 그리 간단하지 않다. 가장 큰 문제점중의 하나는 검색 방법에 있어서 연산량이 많아 계산 시간이 너무 오래 걸린다는 것이다. 이러한 문제점을 극복하기 위해, 우리는 정렬된 분산에 따른 MPS Sort+PDS 방법을 제안하였다. 이 방법은 벡터의 두 개의 주요한 특징으로 평균과 분산을 사용하여 후보가 될 수 없는 많은 코드워드를 계산하지 않으므로 연산량을 줄이고 계산 시간을 줄여준다. 본 논문에서 우리는 기존의 방법보다 더욱 더 향상된 2가지 새로운 방법의 고속 검색 알고리즘을 제안한다. PCA+PDS 방법은 전체 데이터를 사용하는 거리 계산과 똑같은 결과를 가지면서 PCA 변환을 통해 데이터의 차수를 감소시켜 계산량을 줄여준다. Hierarchical Cluster Tree 알고리즘은 PCA 변환된 스펙트라 데이터를 사용하여 이진 계층 클러스터 트리를 만든다. 그런 후 입력 스펙트럼과 가장 가까운 클러스터부터 검색을 시작하여 후보가 될 수 없는 많은 스펙트라를 계산하지 않으므로 연산량을 줄이고 계산 시간을 줄여준다. 실험은 정렬된 분산에 따른 MPS Sort+PDS와 비교하여 PCA+PDS는 60.06%의 성능 향상을 보였다. Hierarchical Cluster Tree는 PCA+PDS와 비교하여 17.74%의 성능향상을 보였다. 실험결과는 제안된 알고리즘이 고속 검색에 적합함을 확인시켜 준다.

머신러닝기반 범죄발생 위험지역 예측 (Predicting Crime Risky Area Using Machine Learning)

  • 허선영;김주영;문태헌
    • 한국지리정보학회지
    • /
    • 제21권4호
    • /
    • pp.64-80
    • /
    • 2018
  • 우리나라의 시민들은 범죄에 대한 일반적인 사항만을 알 수 있을 뿐, 자신이 범죄위험에 얼마나 노출되어 있는지를 파악하기 어렵다. 경찰의 입장에서도 범죄발생 지역을 예측할 수 있다면 경찰력이 부족한 상황에서 효율성 있게 범죄에 대처 가능할 것이지만 아직 우리나라에서는 예측시스템이 없고, 관련 연구도 매우 부족한 실정이다. 이에 본 연구에서는 범죄발생 위험지역 예측 자동화 시스템 개발의 첫 번째 단계로 빅데이터로 구축 가능한 범죄정보와 도시지역 자료를 바탕으로 머신러닝 방식을 통해 한국형 범죄발생 위험지역 예측 모형을 개발하고자 한다. 또한 시나리오를 가정하여 범죄발생 확률을 지도로 시각화함으로써 사용자의 이해도를 높이도록 하였다. 선행 연구 및 사례에서 범죄발생에 영향을 미치는 요인 중 빅데이터로 구축 가능한 범죄정보, 날씨정보(기온, 강수량, 풍속, 습도, 일조, 일사, 적설, 전운량), 지역정보(평균 건폐율, 평균 용적율, 평균 높이, 총 건축물수, 평균 공시지가, 평균 주거용도면적, 평균 지상층수)를 머신러닝에 활용할 수 있도록 데이터를 사전 처리하였다. 머신러닝 알고리즘으로서 지도학습 모형 중 다양한 분야에서 활용되며 정확도가 높다고 알려진 의사결정나무모형, 랜덤포레스트모형, Support Vector Machine(SVM)모형을 활용하여 범죄 예측 모형을 구축하고 비교 분석하였다. 그 결과 평균 제곱근 오차(Root Mean Square Error, RMSE)가 낮아 예측력이 높은 의사결정나무모형을 최적모형으로 선정하였다. 이를 바탕으로 가장 빈번하게 발생하는 절도와 폭력범죄를 대상으로 시나리오를 작성하여 범죄 발생 위험지역을 예측한 결과, 사례도시 J시는 위험지역이 3가지 패턴으로 발생하는 것으로 나타났으며, 각각 발생확률을 3 등급으로 구분하여 $250{\times}250m$ 단위의 지도형태로 시각화할 수 있었다. 본 연구는 향후 자동화 시스템으로 개발하여 시시각각으로 변하는 도시 상황에 따라 실시간으로 예측 결과를 시각화하여 제공함으로써 보다 범죄로부터 안전한 도시환경 조성에 기여하고자 한다.

경기도의 소나무재선충병 피해 확산 양상 분석: 2008 ~ 2015년 예찰 데이터를 기반으로 (Analysis of Pinewood Nematode Damage Expansion in Gyeonggi Province Based on Monitoring Data from 2008 to 2015)

  • 박완혁;고동욱;권태성;남영우;권영대
    • 한국산림과학회지
    • /
    • 제107권4호
    • /
    • pp.486-496
    • /
    • 2018
  • 경기도 지역의 소나무재선충병은 2007년 광주시에서 최초 보고된 이래 급속도로 확산되어 큰 피해를 일으키고 있다. 경기도 지역 소나무재선충병의 매개충은 남부지방과 달리 북방수염하늘소(Monochamus saltuarius)이며 주요 감염목은 소나무가 아닌 잣나무이기 때문에 확산 양상이 다르게 나타날 수 있다. 이에 따라 매개충의 생태적 차이, 잣나무의 소나무재선충병 진단 등의 연구가 진행되고 있으나 확산 양상의 정확한 파악에 관한 연구는 여전히 미비한 수준이다. 이 연구에서는 경기산림환경연구소가 조사한 2008년부터 2015년까지의 신규 감염목 예찰 데이터를 기반으로 확산 현황과 전년도 감염목과의 최단거리의 변화와, 이러한 양상이 수치표고모형, 임상도, 도로 네트워크 등과 보이는 공간적 관계를 분석하였다. 이를 통해 소나무재선충병의 발생 위치와 환경인자 간의 관계를 살펴보고자 하였다. 신규 감염목의 수는 2008년에는 13본이었으나 급격히 증가하여 2013년에는 2,954본을 기록하였으며, 2014년 2,938본, 2015년 2,986본으로 유지되고 있다. 감염목 시군 수는 2012년에 6개 시군에서 2013년 11개, 2014년에 15개 시군으로 증가하였다. 감염목 가운데 잣나무의 비율은 2013년에 89.5%, 2014년에 83.4%, 2015년에 89.8%로 나타났다. 2011-2012년 이후 전년도 감염목과의 거리는 빠르게 감소하고 있으며, 2013년과 2014년 사이에는 평균 거리가 전년도에 비해 크게 감소하여 577 m, 2014년과 2015년 사이에는 666 m로 나타났다. 감염목 위치의 고도는 2009년 이후 전반적으로 증가하여 2014년에 최댓값인 565 m에 이르렀다가 2015년에는 평균값, 중앙값, 최댓값이 모두 낮아졌다. 도로와의 거리는 전반적으로 지속적인 증가 양상을 보이고 있다. 이 연구에서 얻은 감염목 분포의 공간적 분석은 효율적인 소나무재선충병 방제 전략을 수립하는데 활용될 수 있을 것이다.

시스템적인 군집 확인과 뉴스를 이용한 주가 예측 (Predicting stock movements based on financial news with systematic group identification)

  • 성노윤;남기환
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.1-17
    • /
    • 2019
  • 빅데이터 시대에 정보의 양이 급증하고, 그중 많은 부분을 차지하는 문자열 정보를 정량화하여 의미를 찾아 낼 수 있는 인공지능 방법론이 함께 발전하면서, 텍스트 마이닝을 통해 주가 예측에 적용해 온라인 뉴스로 주가를 예측하려는 시도가 다양해지고 있다. 이러한 주가 예측의 방법은 대개 예측하고자 하는 기업의 뉴스로 주가를 예측하는 방식이다. 하지만 특정 회사의 뉴스만이 그 회사의 주가에 영향을 주는 것이 아니라, 그 회사와 관련성이 높은 회사들의 뉴스 또한 주가에 영향을 줄 수 있다. 그러나 관련성이 높은 기업을 찾는 것은 시장 전반의 공통적인 영향과 무작위 신호 때문에 쉽지 않다. 따라서 기존 연구들은 주로 미리 정해진 국제 산업 분류 표준에 기반을 둬 관련성이 높은 기업을 찾았다. 하지만 최근 연구에 따르면, 국제 산업 분류 표준은 섹터에 따라 동질성이 다르며, 동질성이 낮은 섹터는 그들을 모두 함께 고려하여 주가를 예측하는 것이 성능에 악영향을 줄 수 있다는 한계점을 가진다. 이러한 한계점을 극복하기 위해, 본 논문에서는 주가 예측 연구에서 처음으로 경제물리학에서 주로 사용되는 무작위 행렬 이론을 사용하여 시장 전반 효과와 무작위 신호를 제거하고 군집 분석을 시행하여 관련성이 높은 회사를 찾는 방법을 제시하였다. 또한, 이를 기반으로 관련성이 높은 회사의 뉴스를 함께 고려하며 다중 커널 학습을 사용하는 인공지능 모형을 제시한다. 본 논문의 결과는 무작위 행렬 이론을 통해 시장 전반의 효과와 무작위 신호를 제거하여 정확한 상관 계수를 찾아 군집 분석을 시행한다면 기존 연구보다 더 좋은 성능을 보여 준다는 것을 보여준다.

잠긴수제가 설치된 만곡수로에서의 이차류 거동 수치모의 (Numerical modeling of secondary flow behavior in a meandering channel with submerged vanes)

  • 이정섭;박상덕;최철희;백중철
    • 한국수자원학회논문집
    • /
    • 제52권10호
    • /
    • pp.743-752
    • /
    • 2019
  • 만곡수로에서의 흐름은 나선형 운동 형태의 이차류가 지배적이며, 이로 인해 일반적으로 만곡 외측을 따라 침식 현상이 발생하게 된다. 이러한 이차류를 약화시키기 위해서 보통 만곡수로 외측을 따라서 수제와 같은 수공구조물을 설치한다. 이 연구에서는 OpenFOAM 오프소스 소프트웨어를 토대로 난류 해석을 위한 하이브리드 RANS/LES 기법과 자유수면 해석을 위한 VoF기법을 이용한 3차원 수치모의를 통해서 $90^{\circ}$ 만곡수로에 설치된 잠긴수제가 후루드수가 0.43인 조건에서 이차류의 발달에 미치는 영향을 분석하였다. 시간과 공간에 대해서 2차 정확도의 유한체적법을 이용하여 수치모의를 수행하였으며, 수치해석 결과는 실험결과와 비교하여 수치모의의 정확도를 평가하였다. 잠긴수제가 설치된 경우의 수치모의 결과를 흐름방향 유속 분포와 횡방향 순환 유속벡터장을 중심으로 수리실험 관측값들과 비교할 때 수치모의 결과는 수리실험에서 관측된 주요 이차류 흐름 거동과 현상들을 대부분 양호한 정확도로 잘 재현하는 것으로 나타났다. 수치모의 결과를 비교해보면, 잠긴수제 설치로 인해서 만곡이 끝나는 단면 외측 하상부근에서의 유속은 약 평균유속의 1/3 정도 감소하는 반면에 수제 상단부에서의 전단층 발달에 따른 흐름 가속으로 자유수면 부근까지 유속이 증가하고 만곡 수충부에서는 수면 부근 유속이 약 20% 증가하는 것으로 나타났다. 결과적으로 잠긴수제는 만곡부에서 발생하는 이차류의 강도를 약화시켜 만곡부 외측 하상의 안정에 도움이 될 것으로 판단된다. 한편, 각 잠긴수제 전면부에서 말발굽와가 그리고 후면부에서는 후류가 형성되면서 수제 구조물 주변에서 강한 국부세굴이 발생하는 것으로 나타남으로, 국부세굴을 최소화할 수 있는 수제의 형상 및 배열에 대한 추가 연구가 요구된다.

머신러닝 기법을 활용한 터널 설계 시 시추공 내 암반분류에 관한 연구 (A study on the rock mass classification in boreholes for a tunnel design using machine learning algorithms)

  • 이제겸;최원혁;김양균;이승원
    • 한국터널지하공간학회 논문집
    • /
    • 제23권6호
    • /
    • pp.469-484
    • /
    • 2021
  • 터널 설계 시 지반조사를 통한 암반분류 결과는 공사기간 및 공사비 산출, 그리고 터널안정성 평가에 지대한 영향을 미친다. 국내에서 지금까지 완공된 3,526개소의 터널들의 설계 및 시공을 통해 관련 기술들은 지속적으로 발전되어 왔지만, 터널 설계 시 암질 및 암반등급을 보다 정확하게 평가하기 위한 방법에 대한 연구는 미미하여 평가자의 경험 및 주관에 따라 결과의 차이가 큰 경우가 적지 않다. 따라서 본 연구에서는 암석샘플에 대한 주관적 평가를 통한 기존의 인력에 의한 암반분류 대신, 최근 지반분야에서도 그 활용도가 급증하고 있는 머신러닝 알고리즘을 이용하여 시추조사에서 획득한 다양한 암석 및 암반정보를 분석하여 보다 신뢰성있는 RMR에 의한 암반분류 모델을 제시하고자 하였다. 국내 13개 터널을 대상으로 11개의 학습 인자(심도, 암종, RQD, 전기비저항, 일축압축강도, 탄성파 P파속도 및 S파 속도, 영률, 단위중량, 포아송비, RMR)를 선정하여 337개의 학습 데이터셋과 60개의 시험 데이터셋을 확보하였으며, 모델의 예측성능을 향상시키기 위해 6개의 머신러닝 알고리즘(DT, SVM, ANN, PCA & ANN, RF, XGBoost)과 각 알고리즘별 다양한 초매개변수(hyperparameter)를 적용하였다. 학습된 모델의 예측성능을 비교한 결과, DT 모델을 제외한 5개의 머신러닝 모델에서 시험데이터에 대한 RMR 평균절대오차 값이 8 미만으로 수렴되었으며, SVM 모델에서 가장 우수한 예측성능을 나타내었다. 본 연구를 통해 암반분류 예측에 대한 머신러닝 기법의 적용 가능성을 확인하였으며, 향후 다양한 데이터를 지속적으로 확보하여 예측모델의 성능을 향상시킨다면 보다 신뢰성 있는 암반 분류에 활용될 수 있을 것으로 기대된다.