• 제목/요약/키워드: Process of Data Deletion

검색결과 29건 처리시간 0.025초

Gene Duplications Revealed during the Process of SNP Discovery in Soybean[Glycine max(L.) Merr.]

  • Cai, Chun Mei;Van, Kyu-Jung;Lee, Suk-Ha
    • Journal of Crop Science and Biotechnology
    • /
    • 제10권4호
    • /
    • pp.237-242
    • /
    • 2007
  • Genome duplication(i.e. polyploidy) is a common phenomenon in the evolution of plants. The objective of this study was to achieve a comprehensive understanding of genome duplication for SNP discovery by Thymine/Adenine(TA) cloning for confirmation. Primer pairs were designed from 793 EST contigs expressed in the roots of a supernodulating soybean mutant and screened between 'Pureunkong' and 'Jinpumkong 2' by direct sequencing. Almost 27% of the primer sets were failed to obtain sequence data due to multiple bands on agarose gel or poor quality sequence data from a single band. TA cloning was able to identify duplicate genes and the paralogous sequences were coincident with the nonspecific peaks in direct sequencing. Our study confirmed that heterogeneous products by the co-amplification of a gene family member were the main cause of obtaining multiple bands or poor quality sequence data in direct sequencing. Counts of amplified bands on agarose gel and peaks of sequencing trace suggested that almost 27% of nonrepetitive soybean sequences were present in as many as four copies with an average of 2.33 duplications per segment. Copy numbers would be underestimated because of the presence of long intron between primer binding sites or mutation on priming site. Also, the copy numbers were not accurately estimated due to deletion or tandem duplication in the entire soybean genome.

  • PDF

Phonological processes of vowels from orthographic to pronounced words in the Buckeye Corpus by sex and age groups

  • Yang, Byunggon
    • 말소리와 음성과학
    • /
    • 제10권2호
    • /
    • pp.25-31
    • /
    • 2018
  • This paper investigated the phonological processes of monophthongs and diphthongs in the pronounced words present in the Buckeye Corpus and compared the frequency distribution of these processes by sex and age groups to provide a clearer understanding of spoken English to linguists and phoneticians. Both orthographic and pronounced words were extracted from the transcribed label scripts of the Buckeye Corpus using R. Next, the phonological processes of monophthongs and diphthongs in the orthographic and pronounced labels were tabulated using R scripts, and a frequency distribution by vowel process types, as well as sex and age groups, was created. The results revealed that 95% of the orthographic words contained the same number of syllables, whereas 5% had different numbers of vowels, thereby proving that speakers tend to preserve vowels in spontaneous speech. In addition, deletion processes were preferred in natural speech. Most vowel deletions occurred with an unstressed syllable. Chi-square tests were performed to calculate dependence in the distribution of phonological process types for male and female groups and young and old groups. The results showed a very strong correlation. This finding indicates that vowel processes occurred in approximately the same pattern in natural and spontaneous speech data regardless of sex and age, as well as whether or not the vowel processes were identical. Based on these results, the author concludes that an analysis of phonological processes in spontaneous speech corpora can greatly enhance practical understanding of spoken English.

서비스 지향 구조 기반의 EST 서열 주해 시스템 (An EST Sequence Annotation System Based On Service Oriented Architecture)

  • 남성혁;김태경;김경란;조완섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.35-44
    • /
    • 2008
  • 본 논문에서는 SOA 기반의 EST 서열 주해 시스템인 SeqWeB을 제안한다. SeqWeB은 EST 서열 주해에 사용되는 8개의 분석 프로그램 (Phrap, cross_match, RepeatMasker, ICAtools, TGICL, CAP 3, Phrap, BLAST)을 웹 서비스로 제작하고, BPEL (Business Process Execution Language)을 통해 8개의 서비스를 다양한 형태로 조합한다. BPEL로 조합한 서비스들은 표준 데이터 형식으로 통신하여 통합 시 상호 운용성을 보장한다. SeqWeB은 웹 서비스와 BPEL을 통한 약 결합 방식으로 통합하여, 기존의 애플리케이션 통합 방식보다 시스템의 확장과 수정이 쉬우며 유지보수 비용이 저렴하다. 또한, SeqWeB은 다른 서비스의 컴포넌트로 사용될 수도 있다. SeqWeB을 통해 SOA가 지향하는 재사용성(Reusability)과 유연성 (Flexible)을 기반으로 기존과 다른 방식의 생물학 분야의 애플리케이션 통합방법론을 제시한다.

  • PDF

다중 연속질의에서 슬라이딩 윈도우 집계질의 최적화를 위한 선형 자원공유 기법 (Linear Resource Sharing Method for Query Optimization of Sliding Window Aggregates in Multiple Continuous Queries)

  • 백성하;유병섭;조숙경;배해영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권6호
    • /
    • pp.563-577
    • /
    • 2006
  • 스트림 처리기는 다수의 연속질의에서 제한된 자원을 효율적으로 이용하기 위하여 자원공유 기법을 이용한다. 기존의 기법은 계층구조를 유지하여 집계질의를 처리한다. 그래서 삽입연산은 계층구조 재구성 비용이 필요하다. 또한 검색연산은 서로 다른 슬라이딩 윈도우 크기에 속하는 집계정보 검색비용이 필요하다. 그래서 본 논문에서는 보다 빠른 질의 처리를 위해 선형 자료구조를 사용한다. 제안기법은 팬(Pane)크기 결정단계와 팬 생성단계, 팬 삭제단계로 구성된다. 팬 크기 결정단계는 정확한 집계정보를 유지하기 위한 최적 팬 크기를 결정하는 단계이며, 팬 생성단계는 스트림 버퍼로부터 팬 크기만큼의 데이타에 대한 집계정보를 저장하는 단계이다. 팬 삭제단계는 더 이상 연속질의가 사용하지 않는 팬을 삭제하는 단계이다. 제안 기법은 선형 자료 구조를 이용하므로 계층구조를 이용하는 자료 구조에 비해 자원을 적게 사용한다. 또한 스트림 데이타가 입력되어도 팬 크기에 해당하는 집계정보만 계산하면 되므로 집계정보 삽입비용이 감소하고, 서로 다른 슬라이딩 윈도우 크기에 대해서도 선형검색으로 집계정보 검색비용이 감소한다. 성능평가를 통하여 제안기법이 적은 메모리 사용 결과를 보였으며, 질의 처리 속도가 증가하였다.

엣지 컴퓨팅 환경에서 추적 데이터 서버를 통한 데이터 추적 (Tracking Data through Tracking Data Server in Edge Computing)

  • 임한울;변원준;윤주범
    • 정보보호학회논문지
    • /
    • 제31권3호
    • /
    • pp.443-452
    • /
    • 2021
  • 엣지 컴퓨팅(Edge Computing)의 핵심 기술 중 하나는 사용자의 움직임에 따라서 엣지 서버간에 데이터를 이동시켜 항상 사용자와 가까운 거리에서 서비스를 제공한다는 점이다. 그만큼 엣지 서버간의 데이터의 이동이 빈번하다. IoT 기술이 발전하고 사용영역이 확대됨에 따라 생성되는 데이터 또한 증가하기 때문에 각 데이터를 정확하게 추적하고 처리할 수 있는 기술이 필요하다. 개인정보와 같은 민감한 정보들에 대해서는 더욱 그러하다. 현재 클라우드 시스템 안에서 데이터들의 이동 및 유통에 대한 추적과 추적 기술에 기반한 데이터의 폐기 기술이 존재하지 않아 엣지 컴퓨팅 서비스의 사용자는 해당 데이터가 현재 어떤 곳에 위치하는지, 사용자가 데이터의 삭제를 요청할 경우 클라우드 시스템 내에서도 데이터가 제대로 제거되어 있는지 등을 확인할 수 없다. 본 논문에서는 엣지 컴퓨팅환경에서 각 엣지 서버와 중앙 클라우드에 저장되는 데이터들에 대해 데이터의 이동과 유통에 대한 추적 데이터를 생성, 관리하는 추적 데이터 서버를 구축하여 엣지 컴퓨팅환경에서 저장된 모든 데이터의 흐름을 정확하게 추적할 수 있는 기술과 추적 데이터를 활용하여 사용자의 움직임에 따라서 엣지 서버간의 이동하는 로컬 데이터와 분산 파일시스템에 저장된 데이터들을 정확하게 추적하고 이를 활용하여 데이터를 완벽하게 제거하는 기술을 제안한다.

키밸류 저장소 성능 제어를 위한 삭제 키 분리 LSM-Tree (A Tombstone Filtered LSM-Tree for Stable Performance of KVS)

  • 이은지
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.17-22
    • /
    • 2022
  • 최근 웹 서비스의 확산과 함께 데이터의 형태는 더욱 다양해지고 있다. 이미지, 동영상, 텍스트 등 데이터를 저장하는 형태 뿐 아니라 해당 데이터를 표현하는 속성 및 메타데이터 등도 개수 및 형태가 데이터 별로 상이하다. 이러한 비정형 데이터를 효율적으로 처리하기 위해 키밸류 스토어(Key-Value Store)의 사용이 확산되고 있다. LSM-Tree(Log Structured Merge Tree)는 다양한 상용 키밸류 스토어의 핵심 자료구조이다. LSM-Tree 는 모든 쓰기 및 삭제 연산을 로그 방식으로 기록함으로써 소량의 쓰기에 높은 성능을 제공하도록 최적화 되어 있다. 그러나 최근 유효성 만료 데이터의 대용량 삭제 연산이 LSM-Tree에 특수 키밸류 데이터로 삽입됨에 따라 사용자 요청의 지연시간 및 처리속도가 저하된다는 문제점이 있다. 본 논문은 기존 LSM-Tree의 장점을 모두 유지하면서도 삭제된 키를 주요 트리 구조에서 분리하여 상기 문제를 해결하는 Filtered LSM-Tree (FLSM-Tree)를 제안한다. 제안하는 기법은 상용 키밸류 저장소인 LevelDB에 구현되었으며 성능 평가에서 읽기 성능이 최대 47% 향상됨을 보인다.

시각정보의 수렴적 탐색활동을 위한 주의집중 개시 시간에 관한 연구 (Study on the Starting Time of Attention for Convergent Exploration of Visual Information)

  • 김종하;정재영
    • 한국실내디자인학회논문집
    • /
    • 제25권3호
    • /
    • pp.51-59
    • /
    • 2016
  • The technique for Eye-tracking is to trace the movements of pupils so that the eye's exploration response to be digitized. The procedure of Observation Experiment shows a mutual environmental characteristics between men and measuring devices. In order to improve the reliability and to secure the objectivity of the data acquired from eye-tracking, it is very important to analyze the procedures for the experiment to be prepared and the test data to be saved. Based on this viewpoint, the convergent exploration activities at the observation experiment with the objects of sport images were examined to find out what influences the context effect given by experimental environments have on this experiment. In addition, the starting time of attention affecting the reliability of observation data has been estimated. When the observation time is to be subdivided by the unit of second. The attention disperses for the individual characteristics to be appreciated. However, in case of analysis by the overall average, there was the problem that the section of attention dispersed to make it difficult to analyze the subjects' observation features. The study results made it possible to understand the physiological characteristics which were near unconsciousness, when there was an intensive attention for the first 3 seconds and the observation data were shown to be in ordinary range after 4 seconds. The analysis of observation with the focus of the intensive attention enabled the analysis with the first 3 seconds excepted so that it might approach the ordinary range of observation data. The distribution of attention for the first 3 seconds showed the intensive attention, which was on the center. The emergence of intensive attention and the overlapping of the centers can be considered as a context effect due to the correction for the preparing process of experiment. Accordingly, it is thought to be helpful to the security of objectivity and the construction of reliability of eye-tracking data to analyze the observation features shown after the deletion of the data for the first 3 seconds.

블록체인을 활용한 국가연구개발사업 연구지원시스템 개선 방안 연구 (A Study on the Improvement of Research Support System for National R&D Projects Using Blockchain)

  • 이동환;박승욱
    • 한국산업정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.47-60
    • /
    • 2023
  • 본 연구는 국가 R&D 관리의 효율성을 개선하여 행정 부담을 최소화하고, 연구자·서비스 중심으로의 투명한 연구환경을 조성하기 위하여, 국가연구개발사업 연구지원시스템에 컨소시엄 블록체인을 데이터베이스로 활용하는 방안을 제시하였다. 구체적으로 데이터를 특성에 따라 분류하여, 첫째, 무결성과 투명성이 요구되는 데이터는 블록체인에 저장하는 방안, 둘째, 기밀성과 수정 및 삭제가 요구되는 데이터는 데이터베이스에 저장하는 방안, 셋째, 기밀성·무결성·투명성이 동시에 요구되는 데이터는 원본은 데이터베이스에 저장하고, 해당 데이터의 해시값은 블록체인에 별도로 저장하는 방안을 제안하였다. 블록체인 연구지원시스템을 활용하면 시스템의 안정적인 운영과 연구관리 전문기관 간 신속한 정보 공유가 가능하여, 행정 업무 부담 완화, 프로세스의 투명성 제고, 정보의 비대칭성 해소, 데이터 무결성·가용성·기밀성 확보 등의 효과를 창출할 수 있다.

데이터 레이크 구축을 위한 Apache NiFi기반 ETL 프로세스 (Apache NiFi-based ETL Process for Building Data Lakes)

  • 이경민;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제6권1호
    • /
    • pp.145-151
    • /
    • 2021
  • 최근 들어 인간의 모든 활동 영역에서 디지털 데이터가 생성되고 있고 데이터를 안전하게 저장하고 가공하여 유용한 서비스를 개발하려는 시도가 많아지고 있다. 데이터 레이크는 데이터의 출처나 데이터를 활용하는 분석 프레임워크에 독립된 데이터 저장소를 말한다. 본 논문에서는 스마트시티에서 생성되는 다양한 빅데이터를 데이터 레이크에 안전하게 저장하고 서비스에서 활용할 수 있게 ETL 하는 도구와 이를 효과적으로 사용하는데 필요한 웹기반 도구를 설계하고 구현한다. 원천 데이터를 품질검사하고 정제하여 데이터 레이크에 안전하게 저장한 다음 데이터 수명주기 정책에 따라 관리하는 일련의 과정(ETL)은 대부분 비용이 많이 드는 인프라와 개발 및 유지 관리에 상당한 노력이 필요한 기술이다. 구현기술을 통해 IT분야 전문지식이 없어도 가시적이고 효율적으로 ETL 작업 모니터링, 데이터 수명주기 관리 설정과 실행이 가능하다. 이와는 별개로 데이터 레이크에 신뢰할 수 있는 데이터를 저장하고 사용하려면 데이터 품질검사 리스트 가이드가 필요하다. 또한, 데이터 수명주기 관리 도구를 통해 데이터 마이그레이션 및 삭제 주기를 설정하고 예약하여 데이터 관리 비용을 줄일 수 있어야 한다.

디지털영상의 특정영역 인식과 처리 방안 (Methods on Recognition and Recovery Process of Censored Areas in Digital Image)

  • 김감래;김욱남;김훈정
    • 한국측량학회지
    • /
    • 제20권1호
    • /
    • pp.1-11
    • /
    • 2002
  • 본 연구에서는 보안목표물의 효율적인 활용에 목적을 두고 있으며 이를 위하여 항공사진 영상에 표현된 보안 삭제구역에 대한 문제점을 분석하고 영상의 특정영역 인식을 위하여 클러스터링과 레이블링을 실시하였으며, 후처리 알고리즘을 통하여 디지털 영상 데이터의 다양한 활용성을 극대화시키려 하였다. 이러한 연구성과를 토대로 영상의 밝기 값은 지형ㆍ지물의 수량에 따라 증가하는 것으로 나타났으며, 이는 영상 전체에 포함되어 있는 지형·지물의 정보량 판단에 유용한 평가자료로 활용할 수 있는 것으로 평가되었다. 또한 영상인식 및 후 처리에 있어서 도심지나 교외지의 경우 기존 보안목표물의 삭제를 위한 처리절차와 유사하게 인식되는 지형ㆍ지물의 다수 포함으로 인해 산악지에 비해 좋은 결과 값이 도출되지 않았으며. 이는 지형·지물의 수량이 인식 및 처리에 절대적인 영향을 미치는 것으로 나타났다.