• 제목/요약/키워드: Database Algorithm

검색결과 1,653건 처리시간 0.031초

Efficient Processing of k-Farthest Neighbor Queries for Road Networks

  • Kim, Taelee;Cho, Hyung-Ju;Hong, Hee Ju;Nam, Hyogeun;Cho, Hyejun;Do, Gyung Yoon;Jeon, Pilkyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권10호
    • /
    • pp.79-89
    • /
    • 2019
  • 본 연구에서는 도로 네트워크에서 k-최원접 이웃 검색을 위한 효율적인 FANS(k-FArthest Neighbor Search) 알고리즘을 제안한다. 양의 정수 k, 질의 객체 q, 일련의 데이터 객체 집합 P가 주어지면, k-최원접 이웃 질의는 질의 객체 q에서 가장 멀리 있는 k개의 데이터 객체를 찾는다. 데이터베이스 분야에서 대부분의 연구는 k-최근접 이웃 질의에 중점을 두고 있어서, k-최원접 이웃 질의라는 중요한 근접 질의유형은 별다른 관심을 받지 못했다. 이 논문에서는 도로 네트워크에서 가장 멀리 있는 이웃을 찾는 문제를 다룬다. 도로 네트워크에서 k-최원접 이웃 질의를 처리하는 연구는 거의 없었다. 도로 네트워크에서 k-최원접 이웃 질의를 처리해야 하는 문제는 최단 경로 거리를 계산하는 횟수를 줄이는 것인데, 이는 도로 네트워크와 유클리드 공간의 질의 처리에서 가장 중요한 차이다. 질의 객체와 데이터 객체 사이의 최단 경로 거리에 대한 중복 계산을 줄이기 위하여 공유 계산 전략을 사용한다. 질의 객체에서 데이터 세그먼트까지 최대 거리를 기반으로 효과적으로 후보군을 제거하는 방법은 제시한다. 마지막으로 실제 도로 지도를 사용한 광범위한 실험을 통해 제시된 방법의 효율성과 확장성을 보여준다.

Identification of copy number variations using high density whole-genome single nucleotide polymorphism markers in Chinese Dongxiang spotted pigs

  • Wang, Chengbin;Chen, Hao;Wang, Xiaopeng;Wu, Zhongping;Liu, Weiwei;Guo, Yuanmei;Ren, Jun;Ding, Nengshui
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제32권12호
    • /
    • pp.1809-1815
    • /
    • 2019
  • Objective: Copy number variations (CNVs) are a major source of genetic diversity complementary to single nucleotide polymorphism (SNP) in animals. The aim of the study was to perform a comprehensive genomic analysis of CNVs based on high density whole-genome SNP markers in Chinese Dongxiang spotted pigs. Methods: We used customized Affymetrix Axiom Pig1.4M array plates containing 1.4 million SNPs and the PennCNV algorithm to identify porcine CNVs on autosomes in Chinese Dongxiang spotted pigs. Then, the next generation sequence data was used to confirm the detected CNVs. Next, functional analysis was performed for gene contents in copy number variation regions (CNVRs). In addition, we compared the identified CNVRs with those reported ones and quantitative trait loci (QTL) in the pig QTL database. Results: We identified 871 putative CNVs belonging to 2,221 CNVRs on 17 autosomes. We further discarded CNVRs that were detected only in one individual, leaving us 166 CNVRs in total. The 166 CNVRs ranged from 2.89 kb to 617.53 kb with a mean value of 93.65 kb and a genome coverage of 15.55 Mb, corresponding to 0.58% of the pig genome. A total of 119 (71.69%) of the identified CNVRs were confirmed by next generation sequence data. Moreover, functional annotation showed that these CNVRs are involved in a variety of molecular functions. More than half (56.63%) of the CNVRs (n = 94) have been reported in previous studies, while 72 CNVRs are reported for the first time. In addition, 162 (97.59%) CNVRs were found to overlap with 2,765 previously reported QTLs affecting 378 phenotypic traits. Conclusion: The findings improve the catalog of pig CNVs and provide insights and novel molecular markers for further genetic analyses of Chinese indigenous pigs.

개선된 개미 군집 최적화를 이용한 고해상도 위성영상에서의 객체 기반 도로 추출 (Object-Based Road Extraction from VHR Satellite Image Using Improved Ant Colony Optimization)

  • 김한세;최강혁;김용일;김덕진;정재준
    • 한국측량학회지
    • /
    • 제37권3호
    • /
    • pp.109-118
    • /
    • 2019
  • 도로 정보는 교통, 도시 계획, 지도 갱신, 위치기반서비스 그리고 GIS (Geographic Information System) 데이터 구축 등에 활용되는 중요한 기초 공간정보 자료이다. 따라서 정확한 도로 정보를 획득하고 이를 갱신하는 것은 다양한 공간정보 산업에 중요한 역할을 수행할 수 있다. 본 연구에서는 고해상도 위성영상에서 객체 기반의 도로 추출 기법으로 최근 소개된 개미 군집 최적화(ACO: Ant Colony Optimization)의 한계점을 분석하고 이를 개선하고자 하였다. 객체 기반의 ACO 도로 추출은 도로의 분광 및 형상 정보를 모두 활용하여 효과적으로 도로 추출을 수행할 수 있으나 객체 서술자 정보에 의존적이며 서술자 계산 시 사용자의 개입이 필요하다. 또한, 최적화 반복 종료 시점의 설정이 모호하다는 단점이 존재한다. 따라서 본 연구에서는 이를 개선하기 위해 기존 서술자의 한계를 보완하는 서술자와 최적화 반복 종료기준을 제안하였다. 제안된 방법은 기존의 알고리즘보다 52.51%의 완성도(completeness), 6.12%의 정확도(correctness), 51.53%의 품질(quality) 향상을 나타내었다.

다크웹 환경에서 산업기술 유출 탐지 시스템 (Industrial Technology Leak Detection System on the Dark Web)

  • 공영재;장항배
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.46-53
    • /
    • 2022
  • 오늘날 4차 산업 혁명과 대규모 R&D 지원으로 인해 국내 기업은 세계 기술력 수준의 산업기술을 보유하기 시작하였으며 중요한 자산으로 변모하였다. 국가는 기업의 중요한 산업기술을 보호하고자 국가핵심기술로 지정하였으며, 특히 원자력, 조선, 반도체와 같은 기술이 유출될 경우 해당 기업뿐만 아니라 국가 차원에서도 심각한 경쟁력 손실로 이어질 수 있다. 매년 내부자 유출, 랜섬웨어 그룹의 해킹공격, 산업스파이에 산업기술 탈취 시도가 증가하고 있으며, 탈취된 산업기술은 다크웹 환경에서의 은밀하게 거래가 이루어진다. 본 논문에서는 다크웹 환경에서 은밀하게 이루어지는 산업기술 유출을 탐지하는 시스템을 제안한다. 제안된 모델은 먼저 OSINT 환경에서 수집한 정보를 이용하여 다크웹 크롤링을 통한 데이터베이스를 구축한다. 이후 KeyBERT 모델을 이용한 산업기술 유출 키워드를 추출한 후 다크웹 환경에서의 산업기술 유출 징후를 정량적 수치로 제안한다. 마지막으로 식별된 다크웹 환경에서의 산업기술 유출 사이트를 기반으로 PageRank 알고리즘 통한 2차 유출 가능성을 탐지한다. 제안된 모델을 통해 27,317개의 중복 없는 다크웹 사이트를 수집하였으며, 100개의 원자력 특허에서 총 15,028개의 원자력 관련 키워드를 추출하였다. 가장 높은 원자력 유출 다크웹 사이트를 기반으로 2차 유출을 탐지한 결과 12개의 다크웹 사이트를 식별하였다.

머신러닝 기반 아파트 주동형상 자동 판별 모형 개발 및 적용 - 주동형상에 따른 아파트 개발 특성분석을 중심으로 - (Application and development of a machine learning based model for identification of apartment building types - Analysis of apartment site characteristics based on main building shape -)

  • 한상욱;서정석;;;김정섭
    • 한국지리정보학회지
    • /
    • 제26권2호
    • /
    • pp.55-67
    • /
    • 2023
  • 본 연구의 목적은 GIS와 머신러닝 알고리즘을 활용하여 아파트 단지의 주동형상을 자동으로 판별해주는 모형을 개발하고, 이를 주동형상과 단지특성 관의 관계 분석에 적용하는 것이다. 지리정보데이터를 사용하여 아파트단지별 주동 데이터베이스를 구축하고 랜덤포레스트 알고리즘을 활용하여 단지 내 개별동을 형태에 따라 판상형, 탑상협, 혼합형으로 분류하였다. 또한, 아파트단지별 주동형상별 비중과 개발밀도, 층수 등 단지특성 정보간의 관계를 분석하여 부동산 분야 지리정보응용 가능성을 제안하였다. 본 연구는 인공지능 기반 건축물 유형 분류와 관련한 기초연구로서 다양한 공간분석 및 부동산 분석에 활용될 것으로 예상한다.

피에조콘을 이용한 선행압밀하중 결정 신경망 모델의 구조 최적화 및 초기 연결강도 의존성 개선 (Structural Optimization and Improvement of Initial Weight Dependency of the Neural Network Model for Determination of Preconsolidation Pressure from Piezocone Test Result)

  • 김영상;주노아;박현일;박솔지
    • 대한토목학회논문집
    • /
    • 제29권3C호
    • /
    • pp.115-125
    • /
    • 2009
  • 지반의 응력이력을 정의하는데 이용되는 선행압밀하중은 일반적으로 일차원 실내압밀실험으로부터 결정되어져 왔으나 피에조콘과 같은 원위치 시험의 관측값을 이용한 이론적인 방법과 경험적인 상관관계를 통한 결정도 가능하다. 최근 선행압밀하중을 결정하기 위한 인공신경망 모델들이 제안된 바 있으며, 기존의 이론적 경험적 선행압밀하중 추정 방법들이 갖는 지역의존성의 문제를 극복하고 예측 정확도 면에서도 크게 개선된 것으로 보고되었다. 그러나 인공신경망 모델은 모델구조와 학습과정에서 초기에 무작위로 부여되는 연결강도에 영향을 받아 예측에 변동성이 존재한다. 본 연구에서는 기존의 피에조콘 결과를 이용한 선행압밀하중 추정 인공신경망 모델이 연약지반에서 선행압밀하중 예측 시 보이는 변동성을 개선하기 위하여 신경망 모델의 구조 최적화를 수행하고 군집신경망 모델을 구축하였다. 제안된 군집신경망 모델을 이용한 예측결과는 기존의 다층신경망 모델 및 이론적 경험적 모델들과 비교되었다. 연구결과, 최적화된 구조를 갖는 다층신경망 모델일지라도 초기 연결강도에 따라 최종 학습 후 예측결과의 변동성이 여전히 존재하나, 다층신경망을 네트워크로 연결하여 제안된 군집신경망 모델은 기존의 다층신경망 모델들이 갖는 초기 연결강도 의존성을 개선하여 다층신경망 모델에 비해 일관성 있으며 보다 정확한 예측이 가능한 것으로 나타났다.

인공지능 기반의 말더듬 자동분류 방법: 합성곱신경망(CNN) 활용 (AI-based stuttering automatic classification method: Using a convolutional neural network)

  • 박진;이창균
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.71-80
    • /
    • 2023
  • 본 연구는 말더듬 화자들의 음성 데이터를 기반으로 하여, 인공지능 기술을 활용한 말더듬 자동 식별 방법을 개발하는 것을 주목적으로 진행되었다. 특히, 한국어를 모국어로 하는 말더듬 화자들을 대상으로 CNN(convolutional neural network) 알고리즘을 활용한 식별기 모델을 개발하고자 하였다. 이를 위해 말더듬 성인 9명과 정상화자 9명을 대상으로 음성 데이터를 수집하고, Google Cloud STT(Speech-To-Text)를 활용하여 어절 단위로 자동 분할한 후 유창, 막힘, 연장, 반복 등의 라벨을 부여하였다. 또한 MFCCs(mel frequency cepstral coefficients)를 추출하여 CNN 알고리즘을 기반한 말더듬 자동 식별기 모델을 수립하고자 하였다. 연장의 경우 수집결과가 5건으로 나타나 식별기 모델에서 제외하였다. 검증 결과, 정확도는 0.96으로 나타났고, 분류성능인 F1-score는 '유창'은 1.00, '막힘'은 0.67, '반복'은 0.74로 나타났다. CNN 알고리즘을 기반한 말더듬 자동분류 식별기의 효과를 확인하였으나, 막힘 및 반복유형에서는 성능이 미흡한 것으로 나타났다. 향후 말더듬의 유형별 충분한 데이터 수집을 통해 추가적인 성능 검증이 필요함을 확인하였다. 향후 말더듬 화자의 발화 빅데이터 확보를 통해 보다 신뢰성 있는 말더듬 자동 식별 기술의 개발과 함께 이를 통한 좀 더 고도화된 평가 및 중재 관련 서비스가 창출되기를 기대해 본다.

자율운항기술 기반의 선박 통항 안전성 평가 방법론 개선 연구 (Study on Improving the Navigational Safety Evaluation Methodology based on Autonomous Operation Technology)

  • 박준모
    • 해양환경안전학회지
    • /
    • 제30권1호
    • /
    • pp.74-81
    • /
    • 2024
  • 곧 다가올 미래에는 자율운항선박, 육상 원격제어센터에서 제어되는 선박, 그리고 항해사가 탑승하여 운항하는 선박이 함께 공존하며 해상을 운항할 것이며, 이러한 상황이 도래했을 때 해상 교통 환경의 안전을 평가할 수 있는 방법이 필요할 것으로 사료된다. 이에 본 연구에서는 자율운항기술을 사용하여 항해사가 직접 조종하는 선박과 자율운항선박이 공존하는 해상환경 하에서 선박조종시뮬레이션을 통해 통항 안전성을 평가하기 위한 방안을 제시하였다. 자선은 6-자유도 운동 기반의 MMG 모델을 심층 강화학습기법 중 하나인 PPO 알고리즘으로 학습하여 자율운항 기능을 갖출 수 있도록 설계하였다. 타선은 평가 대상 해역의 해상 교통 모델링 자료로부터 선박이 생성되도록 하였고, 기 학습된 선박모델을 기반으로 자율운항 기능을 구현되도록 하였다. 그리고 해양기상 자료 데이터베이스로부터 조위, 파랑, 조류, 바람에 대한 자료를 수집하여 수치 모델을 수립하고 이를 기반으로 해양기상 모델을 생성하여 시뮬레이터 상에서 해양 기상이 재현되도록 설계하였다. 마지막으로 안전성 평가는 기존의 평가 방법을 그대로 유지하되, 선박조종시뮬레이션에서 해상교통류 시뮬레이션을 통한 충돌 위험성 평가가 가능하도록 하는 시스템을 제안하였다.

국내 건강정보관련 연구에 대한 계량서지학적 분석 (Bibliometric Analysis on Health Information-Related Research in Korea)

  • 김진원;이한슬
    • 정보관리학회지
    • /
    • 제41권1호
    • /
    • pp.411-438
    • /
    • 2024
  • 본 연구는 계량서지학적 분석 방법을 통해 여러 영역으로 나누어진 국내 건강정보 관련 연구를 통합적인 시각으로 보고자 하였다. 이를 위해 한국학술지인용색인 데이터베이스를 통해 2002년부터 2023년까지의 국내 '건강정보' 관련 논문 1,193편을 수집하여 시기별 동향, 학문분야, 지적구조, 키워드 변화 시기를 분석하였다. 분석결과, 건강정보 관련 논문 수는 지속적으로 증가하였으며, 2021년 이후 감소하고 있다. 건강정보 관련 연구의 주요 학문분야는 '의공학', '예방의학/직업환경의학', '법학', '간호학', '문헌정보학', '학제간연구'로 볼 수 있다. 건강정보 관련 연구의 지적구조를 파악하기 위해 단어동시출현분석을 시행하였다. 이후 도출된 네트워크의 구조와 군집파악을 위해 병렬최근접이웃클러스터링 알고리즘을 적용한 결과 '건강정보에 대한 의료공학적 관점'과 '건강정보에 대한 사회과학적 관점'이라는 2개의 대군집을 중심으로 그에 속한 4개의 중군집, 17개의 소군집을 파악할 수 있었다. 학문분야와 키워드의 변화 시기를 추적하기 위해 변곡점 분석을 시도하였으며 공통적으로 2010년과 2011년 사이에 변화가 있는 것으로 나타났다. 마지막으로 평균 출판년도와 단어출현빈도를 통해 전략 다이어그램을 도출하였으며 고빈도 키워드를 '유망', '성장', '성숙' 영역으로 구분하여 제시하였다. 본 연구는 주로 내용분석 중심의 선행연구들과 다르게 여러 가지 계량서지학적 방법을 통해 건강정보 관련 연구영역을 통합적인 시각으로 바라보았다는 데 의의가 있다.

Hierarchical Attention Network를 이용한 복합 장애 발생 예측 시스템 개발 (Development of a complex failure prediction system using Hierarchical Attention Network)

  • 박영찬;안상준;김민태;김우주
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.127-148
    • /
    • 2020
  • 데이터 센터는 컴퓨터 시스템과 관련 구성요소를 수용하기 위한 물리적 환경시설로, 빅데이터, 인공지능 스마트 공장, 웨어러블, 스마트 홈 등 차세대 핵심 산업의 필수 기반기술이다. 특히, 클라우드 컴퓨팅의 성장으로 데이터 센터 인프라의 비례적 확장은 불가피하다. 이러한 데이터 센터 설비의 상태를 모니터링하는 것은 시스템을 유지, 관리하고 장애를 예방하기 위한 방법이다. 설비를 구성하는 일부 요소에 장애가 발생하는 경우 해당 장비뿐 아니라 연결된 다른 장비에도 영향을 미칠 수 있으며, 막대한 손해를 초래할 수 있다. 특히, IT 시설은 상호의존성에 의해 불규칙하고 원인을 알기 어렵다. 데이터 센터 내 장애를 예측하는 선행연구에서는, 장치들이 혼재된 상황임을 가정하지 않고 단일 서버를 단일 상태로 보고 장애를 예측했다. 이에 본 연구에서는, 서버 내부에서 발생하는 장애(Outage A)와 서버 외부에서 발생하는 장애(Outage B)로 데이터 센터 장애를 구분하고, 서버 내에서 발생하는 복합적인 장애 분석에 중점을 두었다. 서버 외부 장애는 전력, 냉각, 사용자 실수 등인데, 이와 같은 장애는 데이터 센터 설비 구축 초기 단계에서 예방이 가능했기 때문에 다양한 솔루션이 개발되고 있는 상황이다. 반면 서버 내 발생하는 장애는 원인 규명이 어려워 아직까지 적절한 예방이 이뤄지지 못하고 있다. 특히 서버 장애가 단일적으로 발생하지 않고, 다른 서버 장애의 원인이 되기도 하고, 다른 서버부터 장애의 원인이 되는 무언가를 받기도 하는 이유다. 즉, 기존 연구들은 서버들 간 영향을 주지 않는 단일 서버인 상태로 가정하고 장애를 분석했다면, 본 연구에서는 서버들 간 영향을 준다고 가정하고 장애 발생 상태를 분석했다. 데이터 센터 내 복합 장애 상황을 정의하기 위해, 데이터 센터 내 존재하는 각 장비별로 장애가 발생한 장애 이력 데이터를 활용했다. 본 연구에서 고려되는 장애는 Network Node Down, Server Down, Windows Activation Services Down, Database Management System Service Down으로 크게 4가지이다. 각 장비별로 발생되는 장애들을 시간 순으로 정렬하고, 특정 장비에서 장애가 발생하였을 때, 발생 시점으로부터 5분 내 특정 장비에서 장애가 발생하였다면 이를 동시에 장애가 발생하였다고 정의하였다. 이렇게 동시에 장애가 발생한 장비들에 대해서 Sequence를 구성한 후, 구성한 Sequence 내에서 동시에 자주 발생하는 장비 5개를 선정하였고, 선정된 장비들이 동시에 장애가 발생된 경우를 시각화를 통해 확인하였다. 장애 분석을 위해 수집된 서버 리소스 정보는 시계열 단위이며 흐름성을 가진다는 점에서 이전 상태를 통해 다음 상태를 예측할 수 있는 딥러닝 알고리즘인 LSTM(Long Short-term Memory)을 사용했다. 또한 단일 서버와 달리 복합장애는 서버별로 장애 발생에 끼치는 수준이 다르다는 점을 감안하여 Hierarchical Attention Network 딥러닝 모델 구조를 활용했다. 본 알고리즘은 장애에 끼치는 영향이 클 수록 해당 서버에 가중치를 주어 예측 정확도를 높이는 방법이다. 연구는 장애유형을 정의하고 분석 대상을 선정하는 것으로 시작하여, 첫 번째 실험에서는 동일한 수집 데이터에 대해 단일 서버 상태와 복합 서버 상태로 가정하고 비교분석하였다. 두 번째 실험은 서버의 임계치를 각각 최적화 하여 복합 서버 상태일 때의 예측 정확도를 향상시켰다. 단일 서버와 다중 서버로 각각 가정한 첫 번째 실험에서 단일 서버로 가정한 경우 실제 장애가 발생했음에도 불구하고 5개 서버 중 3개의 서버에서는 장애가 발생하지 않은것으로 예측했다. 그러나 다중 서버로 가정했을때에는 5개 서버 모두 장애가 발생한 것으로 예측했다. 실험 결과 서버 간 영향이 있을 것이라고 추측한 가설이 입증된 것이다. 연구결과 단일 서버로 가정했을 때 보다 다중 서버로 가정했을 때 예측 성능이 우수함을 확인했다. 특히 서버별 영향이 다를것으로 가정하고 Hierarchical Attention Network 알고리즘을 적용한 것이 분석 효과를 향상시키는 역할을 했다. 또한 각 서버마다 다른 임계치를 적용함으로써 예측 정확도를 향상시킬 수 있었다. 본 연구는 원인 규명이 어려운 장애를 과거 데이터를 통해 예측 가능하게 함을 보였고, 데이터 센터의 서버 내에서 발생하는 장애를 예측할 수 있는 모델을 제시했다. 본 연구결과를 활용하여 장애 발생을 사전에 방지할 수 있을 것으로 기대된다.