• Title/Summary/Keyword: 데이터결합

Search Result 2,390, Processing Time 0.026 seconds

Prediction of transcription factor binding sites by extracting common sequences (공통서열 추출을 통한 전사인자 결합부위 예측)

  • 임명은;심정섭;정명근;박선희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.820-822
    • /
    • 2003
  • 접미사 배열이나 접미사 트리는 대용량의 서열데이터를 효율적으로 검색, 저장할 수 있는 인덱스 자료구조로서 바이오인포매틱스와 같이 대용량 데이터의 처리. 분석이 필요한 분야에 이용될 수 있다. 최근 들어 접미사 배열에 대한 연구가 활발히 진행되어 접미사 배열의 효율적인 저장, 선형시간 생성 및 선형시간 탐색 알고리즘들이 개발되었다. 본 논문에서는 같은 전사인자가 결합할 것으로 예상되는 여러 개의 전사조절부위에 대한 DNA 서열들이 입력으로 주어졌을 때 전사인자가 결합하는 부위를 예측하는 방법을 제시한다. 이를 위해 최근에 제시된 선형시간 접미사 배열 생성 알고리즘을 이용하고 TRANSFAC과 EMBL 등의 DB를 이용하여 실험을 통해 본 논문에서 제시하는 방법의 정확도를 평가한다.

  • PDF

Improving the Effectiveness of Information Retrieval Using Data Fusion Method in the Vector and Neural Network Model (벡터와 신경망 모델에서 데이터 퓨전 기법을 이용한 정보검색의 효율성 향상)

  • 최성환
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2001.08a
    • /
    • pp.137-142
    • /
    • 2001
  • 본 논문에서는 벡터모델과 신경망 모델을 이용하여 데이터 퓨전의 관점에서 다중증거로서 가중치, 문헌분리가, 엔트로피, 공기유사도를 적절히 결합하여 질의를 확장하는 방법을 제안한다. 실험결과 코사인 정규화 가중치 알고리즘, 문서길이 정규화 가중치 알고리즘과 결합하여 질의를 확장하는 것이 정규화시키지 않고 단순히 문헌빈도와 역문헌빈도의 조합을 이용한 가중치 알고리즘과 결합했을 때 보다 평균 정확률 향상이 더 높게 나타났다. 또한 다양한 공기기반 유사도를 이용하여 질의확장을 한 결과 벡터모델과 신경망 모델에서 코사인 공기유사도에 기반하여 질의확장한 경우가 다른 공기유사도에 비해 더 좋은 성능을 보였다.

  • PDF

Implementation of Test-bed for Multi-Channel Combined Broadcasting Contents Transmission (다채널 결합 방송콘텐츠 송신을 위한 테스트베드 구현)

  • Lee, Hyung
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.07a
    • /
    • pp.97-98
    • /
    • 2019
  • 본 논문에서는 대용량의 방송 콘텐츠를 전송하기 위해 다수개의 채널을 결합하여 안정적이고 고속으로 전송하기 위한 방송콘텐츠를 전송하기 위한 테스트베드를 제안한다. 제안하는 테스트베드의 첫 번째 목적은 하나의 방송채널 용량을 초과하는 대용량 방송 콘텐츠를 다수개의 채널을 결합하여 전송하기 위한 것이며, 두 번째 목적은 다채널로 입력된 데이터를 다양한 방법의 병렬 알고리즘을 적용하여 FPGA에 적용한 후 그 결과를 테스트하기 위한 것이다. 이를 위하여 제안하는 테스트베드는 다채널을 위한 입력 보드와 전반적인 제어를 위한 CPU 보드, 병렬 알고리즘 등을 테스트하기 위한 FPGA 보드, 그리고 3개의 보드들을 연결하기 위한 베이스 보드로 구성되었다. 제안하는 테스트베드 환경에서 다채널 대용량의 데이터를 병렬처리 할 수 있는 병렬 알고리즘들을 지속적으로 개발하고 테스트하여 다채널 대용량의 실시간 처리가 가능한 영상처리 시스템을 개발하는 것이다.

  • PDF

Design of CTI framework that combines Open IDS and CVE based OpenIOC (Open IDS 및 CVE 기반의 OpenIOC가 결합된 CTI 프레임워크 설계)

  • Yoon, Keoungchan;Yoo, Jihoon;Sin, Dong-Il;Shin, Dongkyoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.286-289
    • /
    • 2020
  • 정보통신 기술의 발달로 무분별한 사이버 공격에 노출되어 있기 때문에 정보보안의 기술이 중요해지고 있다. 이중 침입 탐지 시스템은 방화벽과 더불어 시스템 및 네트워크 보안을 위한 대표적인 수단으로, 현재까지 네트워크 기반인 NIDS와 호스트 기반인 HIDS에 대한 많은 연구가 이루어졌다. 이러한 침입 탐지에 대한 CTI(Cyber Threat Intelligence)를 공유하기 위해 다양한 CTI 프레임워크를 사용하여 CTI 정보를 공유하는 연구가 진행되고 있다. 이에 본 논문에서는 CVE기반의 OpenIOC와 Snort 및 OSSEC에서 생성된 Raw Data를 결합하여 새로운 CTI 프레임 워크를 제안한다. 제안된 시스템을 테스트하기 위해서는 CVE 분석을 기반으로한 Kali Linux로 공격을 진행한다, 이를 통해 생성된 데이터는 시간이 지남에 따라 축적된 데이터를 저장 및 검색을 위해 대규모 분산 처리 시스템과도 결합이 필요할 것으로 예상되며 추후 딥러닝 기술을 활용하면 지능형 지속 위협을 분석하는데 용이할 것으로 예상된다.

A Study on Data Modeling for Learning Analytics (학습분석을 위한 데이터 모델링 연구)

  • Kim, Kyungrog
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.04a
    • /
    • pp.348-349
    • /
    • 2016
  • 교수자와 학습자 활동에 대한 정보를 피드백하여 사용자 스스로 동기부여와 참여를 증대시키기 위해 학습분석이 활용되고 있다. 이는 교수-학습 지원 시스템(LMS, LCSM 등)에서 교수자와 학습자 상호작용에서 발생한 데이터를 기반으로 한다. 이러한 데이터를 보다 유용하게 활용하기 위해서는 데이터 모델이 필요하다. 이에 본 연구에서는 사용자 중심의 교수-학습 활동 데이터를 표현하기 위한 데이터 모델을 제안한다. 이는 사용자와 교수-학습 활동을 결합하여 표현한 것이다.

A Customer Classifier for EC Mall (전자상거래에 적용 가능한 고객분류기)

  • 김선철;이준욱;이용준;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.138-140
    • /
    • 1999
  • 분류기법은 과거데이터를 분석하여 새로운 데이터에 대한 예측에 사용되며, 결정트리 알고리즘을 많이 사용한다. 따라서, 이 기법은 전자상거래에서 DB 마케팅을 위해 데이터베이스에 저장되어 있는 고객데이터를 분석하여 암시적인 고객들의 행위규칙을 찾고, 예측하기 위하여 사용할 수 있다. 기존의 분류알고리즘들은 전자상거래에서 일반적인 연속형 고객데이터를 처리하는데는 많은 문제점을 가지고 있다. 이러한 문제를 해결하기 위하여 연속형 데이터를 범주형 데이터로 변환하는 알고리즘을 구현하였다. 이 논문은 전자상거래에 적용하기 위한 고객분류기로서 ID3 알고리즘에 1차원 클러스터링알고리즘을 결합하여 사용한다.

  • PDF

스마트 항로표지 서비스를 위한 데이터 전처리 기술 연구

  • 박종빈;김경원
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2022.06a
    • /
    • pp.85-87
    • /
    • 2022
  • 스마트 항로표지 장치에서는 위도와 경도에 대응하는 각종 센싱정보가 시계열 형식으로 생산되므로 다양한 서비스 개발이 용이하다. 그러나 데이터의 수집 및 관리 주체가 상이하고, 시스템이 분산된 상태이며, 같은 항로표지에 대해서도 저장 포맷이 다를 수 있는 등 데이터의 효과적인 활용측면에서 제약이 많았다. 이를 해결하기 위해 본 논문에서는 파편적으로 수집된 스마트 항로표지 원시 데이터를 효과적으로 결합하고 다양한 위치기반 서비스 제공에 적합하게 가공하는 데이터 전처리 기술을 제안한다.

  • PDF

Dependency parsing applying reinforced dominance-dependency constraint rule: Combination of deep learning and linguistic knowledge (강화된 지배소-의존소 제약규칙을 적용한 의존구문분석 모델 : 심층학습과 언어지식의 결합)

  • JoongMin Shin;Sanghyun Cho;Seunglyul Park;Seongki Choi;Minho Kim;Miyeon Kim;Hyuk-Chul Kwon
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.289-294
    • /
    • 2022
  • 의존구문분석은 문장을 의존관계(의존소-지배소)로 분석하는 구문분석 방법론이다. 현재 사전학습모델을 사용한 전이 학습의 딥러닝이 좋은 성능을 보이며 많이 연구되지만, 데이터셋에 의존적이며 그로 인한 자료부족 문제와 과적합의 문제가 발생한다는 단점이 있다. 본 논문에서는 언어학적 지식에 기반한 강화된 지배소-의존소 제약규칙 에지 알고리즘을 심층학습과 결합한 모델을 제안한다. TTAS 표준 가이드라인 기반 모두의 말뭉치로 평가한 결과, 최대 UAS 96.28, LAS 93.19의 성능을 보였으며, 선행연구 대비 UAS 2.21%, LAS 1.84%의 향상된 결과를 보였다. 또한 적은 데이터셋으로 학습했음에도 8배 많은 데이터셋 학습모델 대비 UAS 0.95%의 향상과 11배 빠른 학습 시간을 보였다. 이를 통해 심층학습과 언어지식의 결합이 딥러닝의 문제점을 해결할 수 있음을 확인하였다.

  • PDF

Prediction of transcription factor binding sites by local alignment of common sequences (공통서열의 부분 정렬을 통한 전사인자 결합부위의 예측)

  • Yoon Joo Young;Park Kunsoo;Lim Myung Eun;Chung Myung Geun;Park Soo-Jun;Park Sun Hee;Sim Jeong Seop
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11a
    • /
    • pp.967-969
    • /
    • 2005
  • 유전자의 발현은 전사인자와 전사인자 결합부위의 결함에 의해 조절된다. 따라서 이러한 결합부위를 예측하는 것은 유전학 분야에서 중요한 이슈이다. 본 논문에서는 접미사 배열을 이용하여 전사인자가 결합할 것으로 예상되는 DNA 서열들의 공통서열을 추출하고, 이를 다시 입력 서열과 부분 정렬을 수행함으로써 전사인자가 결합하는 부위를 예측하는 알고리즘을 제시한다. 그리고 알려진 전사인자 결합부위를 가진 데이터로 실험한 결과를 통해 제시된 추출 방법의 성능에 대하여 논의한다.

  • PDF

Prediction of protein binding regions in RNA using random forest (Random forest를 이용한 RNA에서의 단백질 결합 영역 예측)

  • Choi, Daesik;Park, Byungkyu;Chae, Hanju;Lee, Wook;Han, Kyungsook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.583-586
    • /
    • 2016
  • 단백질과 RNA의 상호작용 데이터가 대량으로 늘어남에 따라, 단백질과 RNA의 결합부위를 예측하는 계산학적인 방법들이 많이 개발되고 있다. 하지만, 많은 계산학적인 방법들은 단백질에서 단백질과 RNA 결합부위를 예측한다는 한계점이 있었다. 본 논문에서는 RNA와 단백질의 서열정보를 모두 사용하여, 단백질과 결합하는 RNA 결합부위를 예측하는 기법과 그 결과를 논한다. WEKA random forest(http://www.cs.waikato.ac.nz/ml/weka/)를 이용하여 예측 모델을 개발하였고, RNA 서열의 서열 프로파일, 서열 composition, 결합 상대방의 단백질의 특성 등을 특정으로 표현하였다. Random forest 기법을 사용한 cross validation의 결과로서 1:1 모델에서 제일 높은 성능인 92.4% sensitivity, 92.0% specificity, 92.2% accuracy를 보였고, independent test에서는 72.5% sensitivity, 90.0% specificity, 2.1% accuracy를 보였다.