• 제목/요약/키워드: Pattern Retrieval

검색결과 167건 처리시간 0.018초

생물학적 데이터 서열들에서 빈번한 최대길이 연속 서열 마이닝 (Mining Maximal Frequent Contiguous Sequences in Biological Data Sequences)

  • 강태호;유재수
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.155-162
    • /
    • 2008
  • DNA 염기 서열이나 단백질 아미노산 서열과 같은 생물학적 서열 데이터들은 일반적으로 많은 수의 항목들을 가지고 있다. 생물학적 데이터 서열들에는 보통 빈번하게 발생하는 수 백개의 항목으로 이루어진 연속된 서열들이 존재한다. 이들 서열들에서 빈번하게 발생하는 연속 서열을 검색하는 것은 생물학적 서열 분석에서 중요한 부분을 차지하고 있다. 이전에는 순차 패턴을 효과적으로 발견하고자 하는 많은 연구들이 수행되었으며 대부분의 기존 순차패턴 마이닝 기법들은 Apriori 알고리즘을 기반으로 한다. PrefixSpan 알고리즘은 Apriori 기반의 가장 효율적인 순차패턴 마이닝 기법이다. 하지만 이 알고리즘은 길이-1인 빈발 패턴들로 부터 서열 패턴을 확장해나가는 방식이다. 따라서 길이가 긴 연속 서열을 포함하는 생물학적 데이터서열들에 대한 검색방법으로는 적합하지 않다. 최근에는 기존의 PrefixSpan방식을 이용하면서도 반복적인 처리과정을 줄인 MacosVSpan이 제안되었다. 하지만 이 알고리즘 또한 길이가 긴 생물학적 데이터 서열들로부터 빈번하게 발생하는 연속 서열들을 검색하기에는 효율적이지 않다. 본 논문에서는 많은 양의 생물학적 데이터 서열들로부터 빈번한 연속서열을 고정길이 확장 트리를 이용하여 효과적으로 찾아내는 방법을 제안한다. 그리고 다양한 환경에서 실험을 통해 제안하는 방식이 MacosVSpan알고리즘에 비해 검색성능이 보다 우수함을 보인다.

해상풍력발전단지의 최적 위치 선정을 위한 Grid-cell 평가 시스템 개념 설계 (A Study on the Design of the Grid-Cell Assessment System for the Optimal Location of Offshore Wind Farms)

  • 이보경;조익순;김대해
    • 해양환경안전학회지
    • /
    • 제24권7호
    • /
    • pp.848-857
    • /
    • 2018
  • 최근 국제적으로 풍력, 태양광, 파도, 연료전지 등의 친환경 신재생에너지 개발이 활발하다. 특히, 해상에서의 풍력발전단지 개발은 대형화를 통한 단가 절감, 고품질의 풍력자원 활용, 발전기로 인한 소음 피해 최소화를 위해 해안에서 멀리 떨어진 위치에 대규모 부유식으로 건설되는 추세이다. 풍력발전단지의 개발은 해사안전법에 의한 해상교통안전진단제도에 따른 평가가 필요하다. 풍력발전단지의 평가는 해당 수역의 체계적인 개발, 관리, 활용을 위해 선과 면적 개념을 모두 적용하여 수행되어야 하며, 이를 위한 평가 방법과 기준이 개발되어야 한다. 이 연구에서는 해상풍력발전단지처럼 해양 공간을 평가할 수 있는 해상교통조사방법과 평가에 대한 적절한 기준을 수립하고, 이를 시스템적으로 처리할 수 있는 방안에 대해서 연구하였다. 먼저 해상교통조사를 위해 AIS와 레이더를 이용한 이동식 해상교통데이터 수집장치를 설계하였다. 그리고 선과 면적의 개념을 모두 적용한 해상교통 항적도, 밀집도, 경로 분석을 제안하였다. 해상교통밀집도는 Grid-cell의 크기를 조절하여 단위 cell에 대한 공간적, 시간적 점유율을 구분하고 해상교통 경로 분석은 해상을 통항로 또는 작업 공간으로 사용할 때를 구분하여 선박의 이동 패턴을 평가할 수 있도록 제안하였다. 최종적으로 시스템적인 해상교통데이터의 수집과 평가가 가능한 해상교통안전평가솔루션의 개념설계를 수행하였다. 이는 자동적인 해상교통데이터의 수집 저장 분류를 통해, 데이터 누락이나 오표기와 같은 인적 오류를 최소화하고 해상 공간의 용도에 따라 선과 면적 개념을 반영하여 분석함으로써 신뢰성 있는 해상 공간의 평가가 가능하게 한다.

레이더 산란계 후방산란계수를 이용한 토양수분함량 추정 (Estimation of Soil Moisture Content from Backscattering Coefficients Using a Radar Scatterometer)

  • 김이현;홍석영;이재은
    • 한국토양비료학회지
    • /
    • 제45권2호
    • /
    • pp.127-134
    • /
    • 2012
  • 다편파 레이더 산란계 시스템 (L, C, X-밴드 안테나)에서 얻어진 편파별 후방산란계수와 토양수분함량과의 상관성을 분석하고 후방산란계수를 이용 토양수분함량을 추정하고자 하였다. 콩 생육시기에 따른 밴드별 후방산란계수 변화 관측 결과 L-밴드 후방산란계수가 C-, X-밴드후방산란계수보다 높게 나타났고, 모든 안테나 밴드에서 콩 생육초기에는 VV-편파가 HH, HV-편파보다 후방산란계수가 높게 나타났다. HH-편파가 VV-편파보다 후방산란계수가 높게 나타나는 시기는 밴드에 따라 차이를 보였다. L-밴드의 경우 7월 20일 (DOY 200), C, X-밴드는 7월 30일 (DOY 210)부터 HH-편파가 다른 편파들 보다 후방산란계수가 높게 나타났다. 모든 안테나 편파별 후방산란계수가 9월 29일 (DOY 271)에 최대값을 보였고, 그 이후 수확기 (DOY 294) 까지 감소하였다. L-밴드 HH-편파와 VV-편파 간의 차이는 꼬투리가 생성되는 착협기 (R3, DOY 228) 부터 다른 밴드에 비해 크게 나타났고, 반면에 C-밴드 HH-편파와 VV-편파 간의 차이는 착협성기 (R4, DOY 242) 이후 증가폭이 크게 나타났다. 후방산란계수와 토양수분함량과의 변화를 분석한 결과 생육기간동안 토양수분함량 변이가 컸고, 전체 생육기간에서는 모든 밴드별 후방산란계수와 토양수분함량 간에 상관성이 나타나지 않았다. 하지만 엽면적지수가 2 이하 (R2, DOY 224) 일 때 후방산란계수가 증가함에 따라 토양수분함량도 증가하는 경향을 보였다. 밴드별 후방산란계수와 토양수분함량과의 상관관계를 분석하였다. 전체 생육기간에서는 모든 밴드에서 두 변수간의 상관계수가 낮게 나타났다 ($r{\leq}0.50$). 반면에 엽면적지수 2 이하 일 때 모든 밴드에서 후방산란계수와 토양수분함량과의 상관계수가 전체 생육단계에서 조사한 것 보다 높게 나타났다. L-밴드 후방산란계수가 C-, X-밴드 후방산란계수 보다 토양수분함량과의 상관성이 높게 나타났고 ($r{\geq}0.84$), L-밴드 HH-편파가 상관계수가 가장 높았다 (r=0.90). X-밴드 후방산란계수는 L-, C-밴드 후방산란계수보다 상관계수가 낮게 나타났다 ($r{\leq}0.71$). 후방산란계수를 이용하여 토양수분함량 추정 모형식을 작성하였다. L-밴드 HH-편파 후방산란계수와 토양수분함량과의 관계를 비교해 본 결과 결정계수가 높게 나타났다($R^2=0.92$). 본 연구를 통해 레이더 산란계 시스템에서 얻어진 후방산란계수를 이용하여 토양수분함량을 추정할 수 있음을 확인하였다.

텍스트 마이닝 기법을 이용한 컴퓨터공학 및 정보학 분야 연구동향 조사: DBLP의 학술회의 데이터를 중심으로 (Investigation of Topic Trends in Computer and Information Science by Text Mining Techniques: From the Perspective of Conferences in DBLP)

  • 김수연;송성전;송민
    • 정보관리학회지
    • /
    • 제32권1호
    • /
    • pp.135-152
    • /
    • 2015
  • 이 논문의 연구목적은 컴퓨터공학 및 정보학 관련 연구동향을 분석하는 것이다. 이를 위해 텍스트마이닝 기법을 이용하여 DBLP(Digital Bibliography & Library Project)의 학술회의 데이터를 분석하였다. 대부분의 연구동향 분석 연구가 계량서지학적 연구방법을 사용한 것과 달리 이 논문에서는 LDA(Latent Dirichlet Allocation) 기반 다항분포 토픽모델링 기법을 이용하였다. 가능하면 컴퓨터공학 및 정보학과 관련된 광범위한 자료를 수집하기 위해서 DBLP에서 컴퓨터공학 및 정보학과 관련된 353개의 학술회의를 수집 대상으로 하였으며 2000년부터 2011년 기간 동안 출판된 236,170개의 문헌을 수집하였다. 토픽모델링 결과와 주제별 문헌 수, 주제별 학술회의 수를 조사하여 2000년부터 2011년 사이의 주제별 상위 저자와 주제별 상위 학술회의를 제시하였다. 주제동향 분석 결과 네트워크 관련 연구 주제 분야는 성장 패턴을 보였으며, 인공지능, 데이터마이닝 관련 연구 분야는 쇠퇴 패턴을 나타냈고, 지속 패턴을 보인 주제는 웹, 텍스트마이닝, 정보검색, 데이터베이스 관련 연구 주제이며, HCI, 정보시스템, 멀티미디어 시스템 관련 연구 주제 분야는 성장과 하락을 지속하는 변동 패턴을 나타냈다.

고차원 멀티미디어 데이터 검색을 위한 벡터 근사 비트맵 색인 방법 (Vector Approximation Bitmap Indexing Method for High Dimensional Multimedia Database)

  • 박주현;손대온;낭종호;주복규
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.455-462
    • /
    • 2006
  • 고차원 데이터 공간에서의 효과적인 검색을 위해 최근 VA-file[1], LPC-file[2] 등과 같이 벡터 근사에 기반을 둔 필터링 색인 방법들이 연구되었다. 필터링 색인 방법은 벡터를 근사한 작은 크기의 색인 정보를 사용하여 근사 거리를 계산하고, 이를 사용하여 질의 벡터와 유사하지 않은 대부분의 벡터들을 빠른 시간 안에 검색 대상에서 제외한다. 즉, 실제 벡터 대신 근사 벡터를 읽어 디스크 I/O 시간을 줄여 전체 검색 속도를 향상시키는 것이다. 하지만 VA-file 이나 LPC-file은 근사 거리를 구하는 방법이 순차 검색과 같거나 복잡하기 때문에 검색 속도 향상 효과가 그리 크지 않다는 문제점을 가지고 있다. 본 논문은 이러한 근사 거리 계산 시간을 줄이기 위하여 새로운 비트맵 색인 구조를 제안한다. 근사 거리 계산속도의 향상을 위하여, 각 객체의 값을 특성 벡터 공간상의 위치를 나타내는 비트 패턴으로 저장하고, 객체 사이의 거리를 구하는 연산은 실제 벡터 값의 연산보다 속도가 훨씬 빠른 XOR 비트 연산으로 대체한다. 실험에 의하면 본 논문이 제안하는 방법은 기존 벡터 근사 접근 방법들과 비교하여 데이터 읽기시간은 더 크지만, 계산 시간을 크게 줄임으로써 전체 검색 속도는 순차 검색의 약 4배, 기존의 방법들보다는 최대 2배의 성능이 향상되었다. 결과적으로, 데이터베이스의 속도가 충분히 빠른 경우 기존의 벡터 근사 접근법의 필터링을 위한 계산 시간을 줄임으로써 더욱 검색 성능을 향상 시킬 수 있음을 확인할 수 있다.

DCT 해쉬를 이용한 모자이크 생성 알고리즘 (Photo Mosaic Generation Algorithm Using the DCT Hash)

  • 이주용;정승도;이지훈
    • 한국산학기술학회논문지
    • /
    • 제17권10호
    • /
    • pp.61-67
    • /
    • 2016
  • 최근 스마트기기의 높은 보급률 및 컴퓨팅 기술의 발전으로 인하여 단순히 정보를 검색하는 사용 패턴에서 벗어나 사진 및 동영상 등의 멀티미디어에 관한 사용자의 관심이 증대되고 있다. 이러한 관심 증대로 인하여 다양한 응용을 위해 이미지를 생성하고 처리하는 이미지 프로세싱에 대한 기술이 발전하고 있다. 최근 자신이 좋아하는 연예인 등의 여러 개의 작은 이미지들을 이용하여 모자이크로 표현하는 엔터테인먼트적인 사례들이 등장하고 있으며 모자이크 기법에 대한 연구 또한 활발히 진행 중이다. 하지만 기존의 모자이크 기법들 데이터베이스의 이미지를 선형적으로 비교하기 때문에 데이터베이스 이미지수가 증가함에 따라 비교 연산처리 시간이 증가하는 단점이 있다. 긴 연산처리 시간을 가진다. 따라서 본 논문에서는 효율적인 검색을 위해 DCT 해쉬를 이용하는 모자이크 이미지 생성 알고리즘을 제안한다. 제안한 알고리즘은 데이터베이스 생성 단계와 모자이크 생성 단계로 구성된다. 데이터베이스 생성 단계에서는 데이터베이스 구축을 위한 이미지들을 블록 단위로 분할하고 분할된 영역에 대한 DCT 해쉬 셋을 생성하여 저장한다. 모자이크 생성 단계에서는 입력 이미지의 각 블록에 대하여 DCT 해쉬를 통해 데이터베이스 내의 가장 유사한 블록을 효율적으로 검색하고, 최종적인 모자이크 이미지를 생성한다. 다양한 실험을 통해, 제안된 알고리즘이 다양한 종류의 이미지 및 크기에 상관없이 효과적으로 모자이크가 생성됨을 보였다.

인터넷 및 스마트폰의 미디어 기능과 청소년 우울과의 관련성 (The relationship between media function of internet and smartphone, and youth depression)

  • 홍연재;류승아;서재식;김윤지;강동묵;김영기;김지훈
    • 의료커뮤니케이션
    • /
    • 제12권1호
    • /
    • pp.73-84
    • /
    • 2017
  • Purpose: As the internet use of teenagers become more common, the need for research on the relationship between the internet and youth depression has emerged. The purpose of this study is to investigate the relationship between internet use and adolescent depression. Methods: The subjects of this study were youth attending elementary($6^{th}$ grade), middle($2^{nd}$ grade), and high schools($2^{nd}$ grade) belonging to the Busan Metropolitan City Office of Education. Depression was assessed using the BDI depression scale. Internet functions were classified into 10 categories, and the degree of use by Internet functions was examined. The most frequently used Internet sites were surveyed. Univariate analysis using $X^2$ test and multivariate analysis using logistic regression analysis were conducted to find out the difference of internet and smartphone media function on depression according to elementary, middle and high school students. Results: Depression was higher of 13.2 times for students who use online transactions (goods purchase), 0.07 times for students who use 'bulletin board' activities in elementary students. Depression was higher of 1.55 times for those who use online transactions (purchasing goods), and 2.3 times for those who use adult sites for middle school students. Depression was higher of 2.1 times when using e-mail and 1.9 times when using other information retrieval for high school students. Conclusion: It is necessary to consider characteristics of internet utilizing pattern by school class in policy regulation and prevention program to reduce youth depression.